A Study on the Neural Networks for Korean Phoneme Recognition

한국어 음소 인식을 위한 신경회로망에 관한 연구

  • 최영배 (광운대학교 전자계산기공학과) ;
  • 양진우 (광운대학교 전자계산기공학과) ;
  • 이형준 (한림전문대학 전자통신과) ;
  • 김순협 (광운대학교 전자계산기공학과)
  • Published : 1994.02.01

Abstract

This paper presents a study on Neural Networks for Phoneme Recognition and performs the Phoneme Recognition using TDNN (Time Delay Neural Network). Also, this paper proposes training algorithm for speech recognition using neural nets that is a proper to large scale TDNN. Because Phoneme Recognition is indispensable for continuous speech recognition, this paper uses TDNN to get accurate recognition result of phonemes. And this paper proposes new training algorithm that can converge TDNN to an optimal state regardless of the number of phonemes to be recognized. The recognition experiment was performed with new training algorithm for TDNN that combines backpropagation and Cauchy algorithm using stochastic approach. The results of the recognition experiment for three phoneme classes for two speakers show the recognition rates of $98.1\%$. And this paper yielded that the proposed algorithm is an efficient method for higher performance recognition and more reduced convergence time than TDNN.

본 논문은 음소인식을 위한 신경회로망에 관한 연구로서, 시간 지연 신경회로망을 이용하여 음소인식을 수행하였다. 또한, 본 논문은 대규모 시간지연 신경망에도 적합한 음성 인식 신경망의 학습 방법에 제안한다. 연속 음성의 인식을 위해 반드시 선행되어야 하는 음소의 정확한 인식을 위하여 우수한 성능을 보이고 있는 시간지연 신경망을 사용하였으며, 인식 대상 음소수가 증가하여도 신경망을 최적으로 수렴시킬 수 있는 시간지연 신경망의 새로운 알고리즘을 제시하였다. 확률론적 접근법인 코우쉬 알고리즘을 에러 역전파 알고리즘에 결합하는 시간지연 신경망의 새로운 학습 알고리즘을 사용한 실험이 수행되었다. 화자 2인을 대상으로 한 3분류의 음소군 인식 실험에서 $98.1\%$의 인식률을 얻었으며, 제안된 알고리즘이 시간지연 신경망의 더욱 우수한 인식률과 수렴 시간의 단축에 효율적이었음을 보였다.

Keywords