Multi speaker speech synthesis system

Lee, Jun-Mo;Chang, Joon-Hyuk;

doi:10.3745/PKIPS.y2018m05a.338

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

2018.05a
/
Pages.338-339
/
2018
/
2005-0011(pISSN)
/
2671-7298(eISSN)

Korea Information Processing Society (한국정보처리학회)

DOI QR Code

Multi speaker speech synthesis system

다화자 음성 합성 시스템

Lee, Jun-Mo (Dept. of electronics and computer Engineering, Hanyang University) ;
Chang, Joon-Hyuk (Dept. of electronic Engineering, Hanyang University)

이준모 (한양대학교 전자컴퓨터통신공학과) ;
장준혁 (한양대학교 융합전자공학부)

Published : 2018.05.11

https://doi.org/10.3745/PKIPS.y2018m05a.338 Citation PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문은 스피커 임베딩을 이용한 다화자 음성 합성 시스템을 제안한다. 이 모델은 인공신경망을 기반으로 하는 당일화자 음성 합성 시스템인 타코트론을 기초로 구성된다. [1]. 제안 된 모델은 입력 데이터에 화자 임베딩을 추가 데이터로 항께 넣어주는 간단한 방식으로 구현되며 당일화자 모델에 비해 큰 성능 저하 없이 성공적으로 음성을 생성한다.

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

Multi speaker speech synthesis system

다화자 음성 합성 시스템

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)