Parameter Considering Variance Property for Speech Recognition in Noisy Environment

잡음환경에서의 음성인식을 위한 변이특성을 고려한 파라메터

  • Park, Jin-Young (Dept. of Electronic Engineering, Dong-A University) ;
  • Lee, Kwang-Seok (Dept of Electronics Engineering, JinJu National University) ;
  • Koh, Si-Young (Dept. of Electronic & Information Engineering, Kyung-il University) ;
  • Hur, Kang-In (Dept. of Electronic Engineering, Dong-A University)
  • Published : 2005.10.28

Abstract

This paper propose about effective speech feature parameter that have robust character in effect of noise in realizing speech recognition system. Established MFCC that is the basic parameter used to ASR(Automatic Speech Recognition) and DCTCs that use DCT in basic parameter. Also, proposed delta-Cepstrum and delta-delta-Cepstrum parameter that reconstruct Cepstrum to have information for variation of speech. And compared recognition performance in using HMM. For dimension reduction of each parameter LDA algorithm apply and compared recognition. Results are presented reduced dimension delta-delta-Cepstrum parameter in using LDA recognition performance that improve more than existent parameter in noise environment of various condition.

본 논문에서는 음석인식 시스템을 구현함에 있어서 잡음의 영향에 강인한 특성을 가지는 효과적인 음성특징 파라미터에 대해 제안한다. ASR(Automatic Speech Recognition)에 사용되는 가장 기본적인 파라미터인 MFCC와 DCT를 이용한 DCTCs를 기본적인 파라미터로 설정하였다. 또한, 음성의 변이구간에 대한 정보를 가지도록 Cepstrum을 재구성한 delta-Cepstrum, delta-delta-Cepstrum 파라미터를 제안하고, HMM을 이용하여 인식성능을 비교하였다. 그리고 각각의 파라미터의 차원을 축소하기 위해 LDA 알고리즘을 적용하고 이에 대한 인식성능을 비교하였다. 실험결과 다양한 조건의 잡은 환경에서 기존의 파라미터보다 LDA를 이용하여 차원 축소된 delta-delta-Cepstrum 파라미터가 향상된 인식성능을 나타내었다.

Keywords