Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)
- 2018.05a
- /
- Pages.338-339
- /
- 2018
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
Multi speaker speech synthesis system
다화자 음성 합성 시스템
- Lee, Jun-Mo (Dept. of electronics and computer Engineering, Hanyang University) ;
- Chang, Joon-Hyuk (Dept. of electronic Engineering, Hanyang University)
- Published : 2018.05.11
Abstract
본 논문은 스피커 임베딩을 이용한 다화자 음성 합성 시스템을 제안한다. 이 모델은 인공신경망을 기반으로 하는 당일화자 음성 합성 시스템인 타코트론을 기초로 구성된다. [1]. 제안 된 모델은 입력 데이터에 화자 임베딩을 추가 데이터로 항께 넣어주는 간단한 방식으로 구현되며 당일화자 모델에 비해 큰 성능 저하 없이 성공적으로 음성을 생성한다.
Keywords