Text-to-Speech Synthesizer with the Process of Minimizing Concatenation Distortion

접합 왜곡의 최소화 과정이 포함된 음성합성기

  • 박훈재 (범일음성처리 연구소) ;
  • 김상훈 (한국전자통신연구원 음성언어처리 연구실) ;
  • 정재호 (인하대학교 전자 공학과)
  • Published : 1998.05.01

Abstract

대용량의 음성합성용 데이터베이스를 용이하게 구축하기 위해 음성인식 시스템을 이용한 음소 경계 분할이 이루어지고 있다. 그러나 자동 분할 결과를 직접 이용하여 합성음 을 생성할 경우 음소 경계 에러로 인하여 접합 왜곡이 많이 발생하게 된다. 이러한 문제를 해결하기 위해서, 본 연구에서는 단위 접합시 경계 에러를 고려하여 적합한 접합 위치를 찾 고자 하였다. 여기서 적합한 접합 위치는 스펙트럼의 불연속이 최소화된 접합점을 의미한다. 합성음에 대한 MOS(Mean Opinion Score) 테스트와 스펙트로그램(spectrogram)의 모양을 비교하므로써 제안된 방법의 성능을 평가하였다. 제안된 방법은 두 단계로 이루어져 있다. 첫째, 레퍼런스 패턴(reference pattern)과 두 개의 테스트 패턴(test pattern)을 선택하는 단 계와, 둘째, 앞과 뒤 테스트 패턴 사이의 적합한 접합위치를 찾는 단계이다. 본 연구에서는 패턴 사이의 스펙트로그램 비교를 위해 켑스트럼(cepstrum) 피라미터와 패턴 분류기 (pattern classifier)인 DTW(Dynamic Time Warping) 알고리즘을 사용하였다. 제안된 알고 리즘을 평가한 청취 테스트의 결과에서 제안된 알고리즘을 적용하여 합성된 합성음의 음질 이 자동 분절로 생성된 단위를 그대로 이용한 경우의 음질보다 우수함을 보였다.

Keywords

References

  1. Proc. ICASSP Speech Synthcsis by Rule Using an Optimal Selection of Non-Uniform Synthesis Units Yoshinori Sagisaka
  2. EUROSPEECH v.3 SPEAKEZ: A First Experiment In Concatenation Synthesis From A Large Corpus Alcxander G. Hauptmann
  3. EUROSPEECH Optimising Selection of Units from Speech Databases for concatenative Synthesis A.W.Black;Nick Campbell
  4. 한국 전자 통신 연구소 최종연구 보고서 한국어의 운율 분석 및 음운의 분절 표기에 관한 연구
  5. 음성 통신 및 신호처리 워크샵 논문집 v.13 한국어 음성 DB 구축을 위한 한국어 레이블링 기준에 관한 연구 김종진(외)
  6. SICOPS96 SESSON 3.6 운율 분석용 DB 작성을 위한 자동레이블러의 성능 평가 및 유용성 김상훈;이항섭;김희린
  7. 한국전자통신 연구소 보고서 양질의 음성합성을 위한 최적의 합성단위 추출에 관한 연구 고려대학교 정보통신기술공동연구소
  8. Proc. ICASSP A procedure for automatic alignment of phonetic transcriptions with continuous speech H.C.Leung;V.Zue
  9. Proc. ICASSP v.Ⅱ Concatenative Speech Synthesis by Minimum Distortion Criteria Naoto Iwahashi(et al.)
  10. IEEE Trans. On Audio and Electroacoustics v.AD-21 no.5 Direct Estimation of the Vocal Tract Shape by Inverse Filtering of Acoustic Speech Waveforms Hisashi Wakita
  11. J. Acoust. Soc. Am. v.50 Speech Analysis and Synthesis by Linear Prediction of the Speech Wave B.S.Atal;S.L.Hanauer
  12. Digital Processing of Speech Signals L.R.Rabiner;R.W.Schafer
  13. Fundamentals of Speech Recognition L.R.Rabiner;B.H.Juang
  14. Proc. ICSP A Version of DTW Algorithm with Associated Mattix M.Ionita;C.Burileanu;M.Ionita
  15. 제 10회 신호처리 합동 학술대회 논문집 합성단위 자동생성에서의 오류에 강인한 합성단위 연결구간 결정 방법 박훈재;김상훈;정재호