다채널 마이크 환경에서 Naive Bayesian Network의 Decision에 의한 음성인식 성능향상

Performance Improvement in Distant-Talking Speech Recognition by an Integration of N-best results using Naive Bayesian Network

  • 지미경 (한국정보통신대학교 공학부 음성인식기술연구실) ;
  • 김희린 (한국정보통신대학교 공학부 음성인식기술연구실)
  • Ji, Mi-kyong (School of Engineering, Information and Communications University) ;
  • Kim, Hoi-Rin (School of Engineering, Information and Communications University)
  • 발행 : 2005.11.17

초록

원거리 음성인식에서 인식률의 성능향상을 위해 필수적인 다채널 마이크 환경에서 방 안의 도처에 분산되어있는 원거리 마이크를 사용하여 TV, 조명 등의 주변 환경을 음성으로 제어하고자 한다. 이를 위해 각 채널의 인식결과를 통합하여 최적의 결과를 얻고자 채널의N-best 결과와 N-best 결과에 포함된 hypothesis의 frame-normalized likelihood 값을 사용하여 Bayesian network을 훈련하고 인식결과를 통합하여 최선의 결과를 decision 하는데 사용함으로써 원거리 음성인식의 성능을 향상시키고 또한 hands-free 응용을 현실화하기위한 방향을 제시한다.

키워드