연속 음성 인식을 위한 PTM 음절 모델

Phonetic Tied-Mixture Syllable Model for CSR

  • 김봉완 (원광대학교 SiTEC, 원광대학교 전기, 전자 및 정보공학부) ;
  • 이용주 (원광대학교 SiTEC, 원광대학교 전기, 전자 및 정보공학부)
  • 발행 : 2004.05.01

초록

최근 연속 음성 인식에서의 성능 향상을 위하여 음절을 인식 단위로 사용하고자 하는 노력들이 보고되고 있다. 그러나 음절의 경우 음소에 비해 학습성이 좋지 않고 모델의 수가 많으므로 음절 경계에서의 문맥 종속 모델링이 어렵다는 단점을 갖고 있다. 본 논문에서는 음절의 이러한 단점을 극복하기 위하여 모노폰과 트라이폰을 이용하여 음절 모델을 합성하는 방법을 제안한다. 제안된 모델은 트라이폰에 비하여 평균 $55\%$, PTM에 비하여 평균 $13\%$의 인식 속도 향상을 보이며, 동일한 속도일 경우 PTM, 트라이폰 모델 모두에 대하여 ERR이 약$8\%$ 향상됨을 볼 수 있었다.

키워드