Hybrid Speaker Adaptation using Maximum-Likelihood Estimation

MLE를 이용한 하이브리드 화자 적응

  • 표현아 (한국과학기술원 전자전산학과) ;
  • 김세현 (한국과학기술원 전자전산학과) ;
  • 오영환 (한국과학기술원 전자전산학과)
  • Published : 2002.10.01

Abstract

최근 음성 인식 시스템의 성능 향상을 위해 화자 적응 (speaker adaptation)에 대한 연구가 활발히 진행되고 있다. HMM 기반 인식 시스템의 모델 파라미터를 수정하는 화자 적응의 경우, MAP방법과 MLLR 방법에 대한 연구가 주류를 이루고 있다. 두 방법은 adaptation data의 양에 따라서 서로 다른 성능을 보인다. 본 논문에서는 기존 두 방법을 Maximum-likelihood Estimation(MLE)를 이용하여 화자 적응을 수행하는 방법을 제안한다. 제안한 방법을 KAIST 통신연구실에서 구축한 한국어 도시이름 500단어 인식 시스템에 적용하여 adaptation data의 양에 상관없이 항상 높은 성능을 나타냈으며, 기존의 방법에 대해서 최고 4.37%의 인식률 향상을 보였다.

Keywords