Implementation of Text-to-Speech System using ABS/OLA Sinusoidal Model

ABS/OLA Sinusoidal 모델을 이용한 문서-음성 변환시스템의 구현

  • Bae Jae-Hyun (Department of Computer Science Korea Advanced Institute of Science and Technology) ;
  • Byeon Heo-Jin (Department of Computer Science Korea Advanced Institute of Science and Technology) ;
  • Oh Yung-Hwan (Department of Computer Science Korea Advanced Institute of Science and Technology)
  • 배재현 (한국과학기술원 전산학과) ;
  • 변효진 (한국과학기술원 전산학과) ;
  • 오영환 (한국과학기술원 전산학과)
  • Published : 1999.11.06

Abstract

본 논문에서는 중첩 가산 Sinusoidal 합성방식에서 위상계승에 의한 단위음 연결법과 다프레임간 정현파 크기의 보간법을 제안한다. 그리고 합성 프레임의 중심이 pitch onset time이라고 가정하고, 음성에서 분리한 성도 모델의 위상을 음성 전체의 위상으로 사용하는 방법을 제안한다. 제안한 방법으로 문서-음성 변환 시스템 (Text-to-Speech System, TTS System)을 구현한 결과 단위음 연결시 연결부분의 파형 왜곡이 감소함을 알 수 있었고, 부드럽게 연결된 합성음을 얻을 수 있었다.

Keywords