The Study on the Speaker Adaptation Using Speaker Characteristics of Phoneme

음소에 따른 화자특성을 이용한 화자적응방법에 관한 연구

  • 채나영 (관동대학교 전자공학과) ;
  • 황영수 (관동대학교 전자공학과)
  • Published : 2003.06.01

Abstract

In this paper, we studied on the difference of speaker adaptation according to the phoneme classification for Korean Speech recognition. In order to study of speech adaptation according to the weight of difference of phoneme as recognition unit, we used SCHMM as recognition system. And Speaker adaptation method used in this paper was MAPE(Maximum A Posteriori Probability Estimation), Linear Spectral Estimation. In order to evaluate the performance of these methods, we used 10 Korean isolated numbers as the experimental data. It is possible for the first and the second methods to be carried out unsupervised learning and used in on-line system. And the first method was shown performance improvement over the second method, and hybrid adaptation showed the better recognition results than those which performed each method. And the result of Speaker adaptation using the variable weight according to the phoneme had better than the result using fixed weight.

본 연구는 화자 적응 시스템을 구축하기 위한 전과정으로서, 음성 인식 단위로, 음소를 이용할 경우 화자 적응 변화에 대한 연구이다. 음소 변화에 따른 가중치를 적응시켜 화자 적응을 하기 위하여, 본 연구에서는 인식 시스템으로 반연속 HMM, 화자 적응 방법으로는 최대사후확률추정법과 음성선형특성을, 인식 대상 단어로 10개의 격리 숫자음을 사용하였다. 상기의 화자 적응 방법들은 교사 없는 학습이 가능한 것으로서, 온라인 시스템에서 사용이 가능하다. 이 두 방법을 수행한 결과 두 번째 방법보다 첫 번째 방법의 결과가 더 나은 인식률을 보였으며, 두 방법 모두 결합하여 인식 실험을 한 결과가 각각의 화자 적응 방법을 독립적으로 수행한 결과보다 좋은 결과를 얻을 수 있었다. 또한 가중치에 따른 화자 적응 결과 음소에 따른 변동 가중치를 사용할 경우가 고정된 가중치를 이용한 것보다 우수한 결과를 보였다.

Keywords