A Study On Continuous Digits Recognition Using the Neural Network

신경망을 이용한 연속 숫자음 인식에 관한 연구

  • 이성권 (광운대학교 컴퓨터 공학과) ;
  • 김순협 (광운대학교 컴퓨터 공학과)
  • Published : 1998.05.01

Abstract

본 논문은 음성 다이어링 시스템을 구현하기 위한 한국어 단독 숫자음 및 연속 숫 자음 인식에 관한 것이다. 단독 숫자음의 인식은 미지의 입력 음성을 재귀 신경망을 이용하 여 모델링된 각 모델에 인가하고, 신경 회로망의 출력 노드의 상태열을 검사하여 적절한 상 태 전이를 하며 최고의 확률값을 출력하는 모델을 인식된 결과로 출력한다. 연속 숫자음의 인식은 미지의 연속 숫자음을 재귀 신경 회로망을 이용한 연속 숫자음 모델에 입력하고, 신 경 회로망의 출력에 대하여 적절한 상태 전이에 대한 검사와 레벨 빌딩(Level Building)을 수행하여 최소의 오차를 가지는 모델열을 인식된 결과로 출력한다. 재귀 신경 회로망을 이 용하여 음절 모델을 만드는 과정에서 재귀 노드는 예상치가 주어지지 않으므로 신경 회로망 의 학습에서 제외되어 현저한 학습 속도의 저하를 가져온다. 따라서 본 논문에서는 재귀 신 경 회로망의 학습 속도를 향상시키기 위한 2가지 방법을 제안 한다. 첫 번째는 재귀 신경 회로망의 재귀 노드의 예상치를 실험적으로 주어줌으로써 학습 속도의 향상을 도모하였다. 두 번째는 음절 모델의 출력노드의 개수와 음절 모델의 세그먼트 경계를 알고리듬을 이용하 여 자동적으로 조절하였다. 실험결과, 단독어의 경우 음절 '에'에 포함하는 한국어 11개의 숫 자음에 대하여 화자 종속의 경우 97.3%, 화자 독립의 경우 80.5%의 인식률을 얻었으며, 연 속 숫자음의 경우는 21종류의 연속 숫자음에 대하여 화자 종속에서 88.2%, 화자 독립의 경 우 81.3%의 인식률을 얻을 수 있었다.

Keywords

References

  1. IEEE Trans. On Acoustics, Speech and Signal Processing v.26 no.1 Dynamic Programming Algorithm Optimization for Spoken Word Recognition Hiroaki Sakeo;Seibi
  2. IEEE Proceeding A Tutorial on Hidden Markov Models and Selected Application in Speech Recognition L.R.Rabiner
  3. IEEE ASSP Magazine An Introduction to Computing with Neural Nets R.P.Lipmann
  4. Journal of the Acoustical Society of America v.31 Results Abtained from a Vowel Recognition Computer Program J.W.Forgie;C.D.Forgie
  5. Technical Report 452, Research Laboratory of Electronics, M. I. T. Word Recognition Computer Program B.Gold
  6. The Bell System Technical Journal v.54 no.1 A Speaker Independent Digit Recognition System M.R.Sambur;L.R.Rabiner
  7. Proceedings of the IEEE v.64 no.6 Speech Recognition by Machine: A Review D.R.Reddy
  8. IEEE Trans. On Acoustics Speech and Signal Processing v.24 no.5 Distance Measure for Speech Processing A.J.Gray;J.D.Marker
  9. Trends in Speech Recognition The Harpy Speech Understanding System B.Lowerre
  10. Automatic Speech Recognition Kai-Fu Lee
  11. IEEE Trans. On Acoustics Speech and Signal Processing An Overview of the SPHINX Speech Recognition System Kai-Fu Lee;R.Reddy
  12. ICASSP-91 Incorporation LR Parsing into SPHINX Kenji Kita;Wayne H. Ward
  13. Bulletin of Mathematical Biophysics v.5 A Logical Calculus of The Ideas Immanent in Nervous Activity W.S.McCulloch;W.Pitts
  14. The Organization of Behavior Donald O. Hebb
  15. Psychological Review v.65 The Perceptron: A Probabilitic Model for Information Storage and Organization in The Brain F.Rosenblatt
  16. Perceptron M.Minsky;S.Papert
  17. IEEE Trans. On Neural Networks v.5 no.4 Acoustic to Phonetic Mapping using Recurrent Neural Networks M.D.Hanes;S.C.Ahalt;A.K.Krishnamurthy
  18. ICASSP 91 v.1 Application of Fully Recurrent Neural Networks for Speech Recognition S.J.Lee;K.C.Kim;H.Y.Yoon;J.W.Cho
  19. ICASSP 89 Consonant Recognition by Modular Construction of Large Phoneme Time Delay Neural Networks Alex Waibel;Hiderfumi Sawai;Kiyohiro Shikane
  20. EUROSPEECH 95 Recurrent Neural Networks For Speech Modeling and Speech Recognition Tan Lee;P.C.Ching;L.W.Chan
  21. Fuzzy Logic and Neural Network Handbook C.H.Chen
  22. Digital Neural Networks S.Y.Kung
  23. Neural Computation Learning Representations by Error Propagation Learning Rumelhart,D.E.;G.E.Hinton;R.J.Williams
  24. IEEE Trans. ASSP v.29 Connected Digit Recognition using a Level Building DTW Recognition C.S.Myers;L.R.Rabiner
  25. 국어 음운학 허웅
  26. 연결어 인식을 위한 음소 분류 신경 회로망과 LR 구문 분석법에 관한 연구 이강성
  27. 국어 음운론 김석득;김차균;이기백
  28. 표준 국어문법론 남기심;고영근
  29. Neural Networks v.3 Probabilitic Neural Networks D.F.Specht
  30. Fundamentals of Speech Recognition L.Rabiner;B.H.Juang