Proceedings of the KSPS conference (대한음성학회:학술대회논문집)
- 2005.11a
- /
- Pages.151-154
- /
- 2005
Performance Improvement in Distant-Talking Speech Recognition by an Integration of N-best results using Naive Bayesian Network
다채널 마이크 환경에서 Naive Bayesian Network의 Decision에 의한 음성인식 성능향상
- Ji, Mi-kyong (School of Engineering, Information and Communications University) ;
- Kim, Hoi-Rin (School of Engineering, Information and Communications University)
- Published : 2005.11.17
Abstract
원거리 음성인식에서 인식률의 성능향상을 위해 필수적인 다채널 마이크 환경에서 방 안의 도처에 분산되어있는 원거리 마이크를 사용하여 TV, 조명 등의 주변 환경을 음성으로 제어하고자 한다. 이를 위해 각 채널의 인식결과를 통합하여 최적의 결과를 얻고자 채널의N-best 결과와 N-best 결과에 포함된 hypothesis의 frame-normalized likelihood 값을 사용하여 Bayesian network을 훈련하고 인식결과를 통합하여 최선의 결과를 decision 하는데 사용함으로써 원거리 음성인식의 성능을 향상시키고 또한 hands-free 응용을 현실화하기위한 방향을 제시한다.
Keywords