Speaker Verification System Based on HMM Robust to Noise Environments

잡음환경에 강인한 HMM기반 화자 확인 시스템에 관한 연구

  • 위진우 (광운대학교 전자통신공학과) ;
  • 강철호 (광운대학교 전자통신공학과)
  • Published : 2001.10.01

Abstract

Intra-speaker variation, noise environments, and mismatch between training and test conditions are the major reasons for the speaker verification system unable to use it practically. In this study, we propose robust end-point detection algorithm, noise cancelling with the microphone property compensation technique, and inter-speaker discriminate technique by weighting cepstrum for robust speaker verification system. Simulation results show that the average speaker verification rate is improved in the rate of 17.65% with proposed end-point detection algorithm using LPC residue and is improved in the rate of 36.93% with proposed noise cancelling and microphone property compensation algorithm. The proposed weighting function for discriminating inter-speaker variations also improves the average speaker verification rate in the rate of 6.515%.

화자확인에서 화자내 변이, 잡음환경, 그리고 학습환경과 인식 환경의 불일치는 화자확인 시스템이 실용화될 수 없는 가장 큰 원인이다. 본 연구에서는, 실제 환경에 강인한 화자 확인 시스템의 구현에 초점을 맞추어 음성 전처리 과정인 잡음환경에 강인한 끝점추출 알고리즘, 잡음제거 및 마이크특성 보상기법, LPG(Linear Predictive Coefficient)켑스트럼 가중치에 의한 화자간 변별력 향상 기법을 제안한다. 실험 결과, LPC잔차신호(residue)를 이용한 끝점추출 알고리즘을 사용한 경우 약 17.65% 가량의 끝점 추출 에러율을 향상시켰으며, 제안한 잡음제거 및 마이크특성 보상기법을 사용한 경우 다른 마이크 환경에서 화자 오인식율이 약 36.93% 가량 개선되었다. 또한, 제안한 LPC켑스트럼 가중치에 의한 화자간 변별력 향상 기법은 평균 화자 오인식율을 약 6.515% 향상시켰다.

Keywords

References

  1. IEEE Communication Magazine Speaker verification: a turorial J. M. Naik
  2. IEEE v.ASSP-27 no.2 Suppression of acoustic noise in speech using spectral subtraction S. F. Boll
  3. Advances in Speech Signal Processing Recent research in automatic speaker recognition A. E. Rosenberg;F. K. Soong
  4. 5th Darpa Workshop on Speech and Natural Language Multiple approaches to robust speech recognition R. M. Stern;F-H. Liu;Y. Ohshima;T. M. Sullival;A. Acero
  5. Proc. ICASSP97 Microphone array based speech recognition with different talker-array positions M. Omologo;M. Matassoni;P. Svaizer;D. Giuliani
  6. Speech Communications v.17 no.1-2 On the use of residual cepstrum in speech recognition J. He.;L. Liu;G. Palm
  7. 한국음향학회지 v.19 no.5 화자 확인 시스템을 위한 적응적 모델갱신과 사전 문턱치 결정에 관한 연구 진세훈;이재희;강철호