The Design of Speech Recognition Chip for a Small Vocabulary as a Word-level

소어휘 단어단위의 음성인식 칩 설계

  • 안점영 (동의대학교 전자공학과) ;
  • 최영식 (동의대학교 전자공학과)
  • Published : 2002.04.01

Abstract

A speech recognition chip that can recognize a small vocabulary as a word-level has been designed. It is composed of EPD(Start and End-point detection) block, LPC block, DTW block and external memory interface block. It is made of 126,938 gates on 4x4mm2 area with a CMOS 0.35um TLM process. The speed of the chip varies from 5MHz to 60MHz because of its specific hardware designed for the purpose. It can compare 100,000 voices as a small vocabulary which has approximately 50∼60 frames at the clock of 5MHz and also up to 1,200,000 voices at the clock of 60MHz.

소어휘 단어단위의 음성을 인식할 수 있는 음성인식 칩을 설계하였다. 설계된 칩은 음성 신호의 시작과 끝점 검출 부분, LPC 켑스트럼 계수 추출 부분, DTW 실행 부분과 외부 메모리 인터페이스 부분으로 구성되어있다. CMOS 0.35um TLM 공정으로 설계된 이 칩은 4x4mm2의 면적에 126,938개의 게이트로 만들어져 있다. 그리고 전용 H/W의 동작 속도는 5MHz에서 60MHz까지 조정 가능하다. 5MHz 클록을 사용하는 경우, 50∼60 프레임 정도의 소어휘 단어 단위의 음성을 초당 100,000개까지 비교할 수 있는 능력이 있고, 60MHz의 클록을 사용하는 경우는 초당 1,200,000개의 단어를 비교할 수 있다.

Keywords

References

  1. Teh C C, Jong C C and Siek L, 'Low-cost speech recognition system for small vocabulary and speaker independent' Proceedings of SPIE Design, and Simulation in Microelectronics, pp. 208-211, Nov. 2000
  2. 윤대희 외 5인, 'TMS320C31을 이용한 차량항법 음성인식 시스템의 실시간 구현', TELECOMMUNICATIONS REVIEW, Vol. 9, No. 6, pp.984-991, 1999
  3. Soo-Won Kim, et al., ' A VLSI Chip for Isolated Speech Recognition System', IEEE Tr. on Consumer Electronics, Vol. 42, No. 3, pp. 458-468, Aug. 1996 https://doi.org/10.1109/30.536143
  4. An-Nan Suen, Jhing-Fa Wang, and Yuen-Lin Chiang, 'A Cepstrum Chip : Architecture and Implementation,' IEEE International Sym. on Circuit and Systems, Vol. 2, pp. 1428-1432, 1995
  5. Cody Myers, Lawrence R. Labiner, Arron E. Rosenberg, 'Performance Tradeoff in Dynamic Time Warping Algorithms for Isolated Word Recognition,' IEEE Tr. on Acoustics, Speech and Signal Processing, ASSP-28, No. 6, Dec. 1980
  6. Jia-Ching Wang, Jhing-Fa Wang, and Yu-Sheng Weng, 'Chip Design of MEL Frequency Cepstral Coefficients for Speech Recognition', Proceedings of the 2000 IEEE International Conference on Acoustics, Speech and Signal Processing, Vol. 6, pp. 3658-3661, July, 2000
  7. Chen DaoWen et al., 'Systolic Multiple -Valued DTW Processor', China 1991 International Conference on Circuits and Systems, pp. 859-862, June 1991
  8. M. J. Irwin, 'A Digit Pipelined Dynamic Time Warp Processor', IEEE Tr. on Acoustics, Speech, and Signal Processing, Vol. 36, No. 9, pp. 1412-1422, Sept. 1988 https://doi.org/10.1109/29.90369