DOI QR코드

DOI QR Code

Implementation of Speech Recognizer using Relevance Vector Machine

RVM을 이용한 음성인식기의 구현

  • 김창근 (동아대학교 전자공학과) ;
  • 고시영 (경일대학교 전자정보통신공학부) ;
  • 허강인 (동아대학교 전자공학과) ;
  • 이광석 (진주산업대학교 전자공학과)
  • Published : 2007.08.31

Abstract

In this paper, we experimented by three kind of method for feature parameter, training method and recognition algorithm of most suitable for speech recognition system and considered. We decided speech recognition system of most suitable through two kind of experiment after we make speech recognizer. First, we did an experiment about three kind of feature parameter to evaluate recognition performance of it in speech recognizer using existent MFCC and MFCC new feature parameter that change characteristic space using PCA and ICA. Second, we experimented recognition performance or HMM, SVM and RVM by studying data number. By an experiment until now, feature parameter by ICA showed performance improvement of average 1.5% than MFCC by high linear discrimination from characteristic space. RVM showed performance improvement of maximum 3.25% than HMM in an experiment by decrease of studying data. As such result, effective method for speech recognition system to propose in this paper derives feature parameters using ICA and un recognition using RVM.

본 논문에서는 음성인식 시스템을 구현함에 있어 중요한 특징 파라미터와 학습, 인식 알고리즘의 선택을 위한 제안을 하기 위하여 각각 세 가지의 방법을 조합하여 인식 실험을 수행하고 검토하였다. 두 종류의 실험을 통하여 하드웨어 장치로 구현할 경우 보다 효과적인 음성 인식 시스템을 제안한다. 첫 번째로는 특징 파라미터의 성능을 평가하기 위하여 기존의 MFCC와 MFCC를 PCA와 ICA를 이용하여 특징 공간을 변화시킨 새로운 특징 파라미터를 제안하여 총 3종류의 특징파라미터에 대한 인식 실험을 수행하였으며, 두 번째로는 학습데이터 수에 따른 HMM, SVM, RVM의 인식 성능을 실험하였다. 이상의 실험에 의하여 ICA에 의한 특징 파라미터가 특징 공간상에서의 높은 선형 분별성에 의해 MFCC와 비교하여 평균 1.5%의 성능향상을 확인할 수 있었으며 학습데이터의 감소에 따른 인식실험에서는 HMM과 비교하여 RVM에서 최고 3.25%의 성능향상을 확인하였다. 이에 근거하여 TI사의 DSP(TMS320C32)를 사용하여 음성 인식기를 구현하여 실시간으로 실험하여 시뮬레이션과 비교하였다. 이와 같은 결과로서 본 논문에서 제안하는 음성인식시스템을 위한 효과적인 방법은 ICA를 이용한 특징 파라미터를 추출하고 RVM을 이용하여 인식을 수행하는 것이라 판단한다.

Keywords

References

  1. E. Osuna, R. Freund and F. Girosi, Support Vector Machines: Training and Applications, C.B.C.L Paper No. 144, 1997
  2. M. E. Tipping, 'The Relevance Vector Machine,' Advances in Neural Information Processing Systems 12, MIT Press. pp. 652 - 658. 2000
  3. Michael E. Tipping, 'Sparse Learning and the Relevance Vector Machine,' Journal of Machine Learning Research 1, pp.211-244, 2001 https://doi.org/10.1162/15324430152748236
  4. Application Notes, CPU & Memory Reqs for Real-Time Speech Recognition Systems Using TMS320C3x/C4x. Texas Instruments Inc., 1997.[1] S. Haykin, Neural Networks -A Comprehensive Foundation, Prentice Hall, 1999
  5. C.M. Bishop, Neural Networks for Pattern Recognition, Oxford University Press, 1995