A Study on the Performance Improvement of Connected Digit Telephone Speech Recognition

연속 숫자음 전화음성의 인식 성능 향상에 관한 연구

  • Kim Min Sung (School of Electronics and Electrical Engineering, Kyungpook National University) ;
  • Jung Sung Yun (School of Electronics and Electrical Engineering, Kyungpook National University) ;
  • Son Jong Mok (School of Electronics and Electrical Engineering, Kyungpook National University) ;
  • Bae Keun Sung (School of Electronics and Electrical Engineering, Kyungpook National University)
  • 김민성 (경북대학교 전자전기공학부) ;
  • 정성윤 (경북대학교 전자전기공학부) ;
  • 손종목 (경북대학교 전자전기공학부) ;
  • 배건성 (경북대학교 전자전기공학부)
  • Published : 2002.07.01

Abstract

전화음성의 경우 전화 회선의 채널 대역폭 제한과 통화로 형성시 달라지는 채널의 특성으로 인하여 마이크 음성에 비하여 인식 성능이 많이 저하된다. 본 연구에서는 연속 숫자음 전화음성의 인식율 향상을 위해 채널 왜곡 보상 기법들을 적용하고, HTK 기반의 인식 실험을 통해 보상 기법에 따른 인식 성능을 비교하였다. 채널 왜곡 보상 기법으로 CMN, RASTA, RTCN 등을 적용하고, 각 보상 기법에 따라 HMM의 state 수, mixture 수를 바꾸어 가며 인식 실험한 결과를 제시한다.

Keywords