Study on formant transition for improvement of speech synthesis

음성 합성의 개선을 위한 포만트 변경에 관한 연구

  • Lee Sang-hyun (School of Electrical and Computer Engineering, Hanyang University) ;
  • Yang Sung-il (School of Electrical and Computer Engineering, Hanyang University) ;
  • Kwon Y. (Department of Physics Hanyang University)
  • 이상현 (한양대학교 전자컴퓨터 공학부) ;
  • 양성일 (한양대학교 전자컴퓨터 공학부) ;
  • 권영헌 (한양대학교 물리학과)
  • Published : 2001.11.01

Abstract

본 논문에서는 음성합성 과정에서 음성유닛을 연결할 때 모음의 결합부분에서 포만트의 불일치로 일어나는 부자연스러운 합성음이 발생되는 문제점을 개선하기 위해서 앞에 오는 음성 유닛과 뒤에 오는 합성 유닛의 포만트 변경에 관한 방법을 제안한다. 요즘에 연구되는 코퍼스 방식에선 에너지와 피치와 음순지속시간 등을 기준으로 유닛을 선택한 후 연결하지만, 스펙트럼의 불일치가 이루어진다. 이런 스펙트럼의 불일치는 음질의 저하를 유도한다. 그래서 앞 음성유닛의 연결부분의 일정부분과 뒤 음성 유닛의 연결부분의 일정부분의 포만트를 천이시켜 일치시켜줌으로써 음질을 향상시켰다. 음성신호를 FFT한 후 magnitude와 phase를 분리한 후 앞 음성의 연결부분의 magnitude와 뒷 음성의 연결부분의 magnitude를 기준으로 linear interpolation한 값을 목표치로 이동하고 다시 합하여 원 신호를 복원하는 방식으로 포만트를 변경시켰다.

Keywords