DOI QR코드

DOI QR Code

Multi speaker speech synthesis system

다화자 음성 합성 시스템

  • Lee, Jun-Mo (Dept. of electronics and computer Engineering, Hanyang University) ;
  • Chang, Joon-Hyuk (Dept. of electronic Engineering, Hanyang University)
  • 이준모 (한양대학교 전자컴퓨터통신공학과) ;
  • 장준혁 (한양대학교 융합전자공학부)
  • Published : 2018.05.11

Abstract

본 논문은 스피커 임베딩을 이용한 다화자 음성 합성 시스템을 제안한다. 이 모델은 인공신경망을 기반으로 하는 당일화자 음성 합성 시스템인 타코트론을 기초로 구성된다. [1]. 제안 된 모델은 입력 데이터에 화자 임베딩을 추가 데이터로 항께 넣어주는 간단한 방식으로 구현되며 당일화자 모델에 비해 큰 성능 저하 없이 성공적으로 음성을 생성한다.

Keywords