Real-Time Implementation of Speaker Dependent Speech Recognition Hardware Module Using the TMS320C32 DSP : VR32

TMS320C32 DSP를 이용한 실시간 화자종속 음성인식 하드웨어 모듈(VR32) 구현

  • 정익주 (강원대학교 전자공학과) ;
  • 정훈 (강원대학교 전자공학과)
  • Published : 1998.05.01

Abstract

본 연구에서는 Texas Instruments 사의 저가형 부동소수점 디지털 신호 처리기 (Digital Singnal Processor, DSP)인 TMS320C32를 이용하여 실시간 화자종속 음성인식 하 드웨어 모듈(VR32)을 개발하였다. 하드웨어 모듈의 구성은 40MHz의 TMS320C32 DSP, 14bit 코덱인 TLC32044(또는 8bit μ-law PCM 코덱), EPROM과 SRAM 등의 메모리와 호 스트 인터페이스를 위한 로직 회로로 이루어졌다. 뿐만 아니라 이 하드웨어 모듈을 PC사에 서 평가해보기 위한 PC 인터페이스용 보드 및 소프트웨어도 개발하였다. 음성인식 알고리 즘의 구성은 에너지와 ZCR을 기반으로 한 끝점검출(Endpoint Detection) 침 10차 가중 LPC 켑스터럼(Weighted LPC Cepstrum) 분석이 실시간으로 이루어지며 이후 Dynamic Time Warping(DTW)를 통하여 최고 유사 단어를 결정하고 다시 검증과정을 거쳐 최종 인식을 수행한다. 끝점검출의 경우 적응 문턱값(Adaptive threshold)을 이용하여 잡음에 강인한 끝 점검출이 가능하며 DTW 알고리즘의 경우 C 및 어셈블리를 이용한 최적화를 통하여 계산 속도를 대폭 개선하였다. 현재 인식률은 일반 사무실 환경에서 통상 단축다이얼 용도로 사 용할 수 있는 30 단어에 대하여 95% 이상으로 매우 높은 편이며, 특히 배경음악이나 자동 차 소음과 같은 잡음환경에서도 잘 동작한다.

Keywords

References

  1. Digital Processing of Speech Signals L.R.Rabiner;R.W.Scafer
  2. Fundamentals of Speech Recognition L.R.Rabiner;B.H.Juang
  3. AT&T Tech. J. v.63 no.3 An improved word-detecton for telephone quality speech incorporating both syntactic and semantic constraint J.G.Wilpon;L.R.Rabiner
  4. IEEE, Trans. Acoust., Speech, Signal Processing v.ASSP-24 no.3 Pattern recognition approach to Voiced-Unvoiced Silence Classfication with Applications to speech Recognition B.S.Atal;L.R.Rabiner
  5. Bell Syst. Tech. J. v.54 An algorithm for detemining the endpoints of isolated utterances L.R.Rabiner;M.R.Sambur
  6. 제 7회 신호처리 합동학술대회 Windows용 음성인식 Software 'VoiceAccess' 개발에 관한 연구 정훈;정익주
  7. IEEE Transactions of Acoustics, Speech and Signal Processing v.35 no.7 On the Use of Bandpass Liftering in Speech Recognition B.H.Huang;L.R.Rabiner;J.G.Wilpon
  8. IEEE Transactions of Acoustics, Speech and Signal Processing v.ASSP-26 no.1 Dynamic Programming Algorithm Optimization for Spoken Word Recognition H.Sakoe;S.Chiba
  9. IEEE Transactions of Acoustics, Speech and Signal Processing v.ASSP-26 no.6 Performance Tradeoffs in Dynamic Time Warping Algorithms for Isolated Word Recognition Cory Myers;L.R.Rabiner;Arron E. Rosenberg
  10. IEEE Transactions of Acoustics, Speech and Signal Processing v.ASSP-23 Minimum prediction residual applied speech Recognition F.Itakura
  11. TMS320C3x User's Guide Texas Instrument
  12. TMS320 Floating-Point DSP Assembly Language Tools User's Guide Texas Instruments
  13. TMS320 Floating-Point DSP Optimizing C Compiler User's Guide Texas Instruments