Incorporation of IMM-based Feature Compensation and Uncertainty Decoding

IMM 기반 특징 보상 기법과 불확실성 디코딩의 결합

  • 강신재 (서울대학교 전기.컴퓨터공학부 뉴미디어통신공동연구소 휴먼인터페이스 연구실) ;
  • 한창우 (서울대학교 전기.컴퓨터공학부 뉴미디어통신공동연구소 휴먼인터페이스 연구실) ;
  • 권기수 (서울대학교 전기.컴퓨터공학부 뉴미디어통신공동연구소 휴먼인터페이스 연구실) ;
  • 김남수 (서울대학교 전기.컴퓨터공학부 뉴미디어통신공동연구소 휴먼인터페이스 연구실)
  • Received : 2012.04.02
  • Accepted : 2012.06.05
  • Published : 2012.06.30


This paper presents a decoding technique for speech recognition using uncertainty information from feature compensation method to improve the speech recognition performance in the low SNR condition. Traditional feature compensation algorithms have difficulty in estimating clean feature parameters in adverse environment. Those algorithms focus on the point estimation of desired features. The point estimation of feature compensation method degrades speech recognition performance when incorrectly estimated features enter into the decoder of speech recognition. In this paper, we apply the uncertainty information from well-known feature compensation method, such as IMM, to the recognition engine. Applied technique shows better performance in the Aurora-2 DB.

본 논문은 잡음이 많이 존재할 경우 특징 보상 기법들의 불완전한 추정 방법으로 인하여 발생할 수 있는 불확실성 정보를 음성 인식의 디코딩에 반영해 줌으로써 좀 더 인식 성능을 향상시킬 수 있는 방법에 대한 연구이다. 기존의 특징 보상 기법들은 현재 시간에서의 깨끗한 특징 파라미터를 추정하는 단일점 추정 기법들이 대부분이다. 하지만 낮은 SNR 환경에서의 잘못된 추정 파라미터들이 음성 인식 엔진의 입력으로 사용될 경우 성능이 저하되기 때문에 추정된 파라미터의 불확실성 정보를 이용하여 디코딩을 해주면 추정 오류를 보완해줄 수 있다. 본 논문에서는 대표적인 Aurora-2 DB를 활용하여 적용된 기법의 성능 향상을 확인한다.



