Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)
- spring
- /
- Pages.253-256
- /
- 2002
Performance Evaluation of Telephone Continuous Digit Recognition
전화망 환경에서의 연속숫자음 인식 성능평가
- Kim SungTak (School of Engineering, ICU) ;
- Kim SangJin (School of Engineering, ICU) ;
- Jung Hoyoung (Speech Information Technology Center, ETRI) ;
- Kim Hoirin (School of Engineering, ICU) ;
- Hahn Minsoo (School of Engineering, ICU)
- 김성탁 (한국정보통신대학교(ICU) 공학부) ;
- 김상진 (한국정보통신대학교(ICU) 공학부) ;
- 정호영 (한국전자통신연구원(ETRI) 음성정보연구센터) ;
- 김회린 (한국정보통신대학교(ICU) 공학부) ;
- 한민수 (한국정보통신대학교(ICU) 공학부)
- Published : 2002.07.01
Abstract
한국어 숫자는 단음절로 이루어져 있고, 연속적으로 발음할 때 조음현상에 의해 발음이 심하게 변하고, 숫자간의 경계를 규정하기가 어려워진다. 특히 잡음환경에서는 한국어의 무성음인 자음구간의 주파수 특징이 많이 왜곡되어 성능이 저하된다. 본 논문에서는 전화망에서의 고성능 연속숫자음 인식기 개발을 위하여 그 첫 단계로서 다양한 조건에서 MFCC 특징계수를 구하는 방법들과 문맥독립 및 문맥종속 HMM의 상태수 및 각 상태에서의 mixture 수 변화에 대한 성능을 분석해본다. 음향모델로는 문맥독립 모델인 음소와 문맥종속 모델인 triphone 모델을 모두 평가하였다.
Keywords