DOI QR코드

DOI QR Code

웨이블렛 필터뱅크에 기반을 둔 강인한 화자식별 기법

A Robust Speaker Identification Method Based on the Wavelet Filter Banks

  • 이대종 (한국전기안전공사 전기안전시험연구원) ;
  • 곽근창 (충북대학교 전기전자 및 컴퓨터 공학과) ;
  • 유정웅 (충북대학교 전기전자 및 컴퓨터공학부 컴퓨터 정보텅신연구소) ;
  • 전명근 (충북대학교 전기전자 및 컴퓨터공학부 컴퓨터 정보텅신연구소)
  • 발행 : 2002.08.01

초록

본 논문에서는 웨이블렛 서브밴드 필터링기법을 이용하여 다중의사 결정기법에 기반을 둔 잡음에 강인한 화자식별 알고리즘을 제안한다. 제안된 방법은 잡음이 첨가된 음성신호를 웨이블렛 서브밴드 필터뱅크를 이용하여 각 주파수 대역별로 신호를 분리한 후 개별적인 대역별로 인식 알고리즘을 수행하기 때문에 어떤 서브밴드에서의 노이즈 영향이 상대적으로 적으므로 대역제약된 형태로 주어지는 일반적인 주변잡음이 있는 환경하에서 우수한 성능을 보일 수 있도록 시스템을 구성하였다. 제안된 알고리즘은 화자인식 기법으로 널리 쓰이고 있는 벡터양자화 알고리즘만을 적용한 경우에 비해 15∼60%의 향상된 인식률을 보였다.

This paper proposes a robust speaker identification algorithm based on the wavelet filter banks and multiple decision-making scheme. Since the proposed speaker identification algorithm has a structure performing the identification algorithm independently for each subband, the noise effect of an subband can be localized. Through this process, we can obtain more robust results for the environmental noises which generally have band limited frequency. In the experiments, the proposed method showed more 15∼60% improvement than the vector quantization method for the various noisy environments.

키워드

참고문헌

  1. A. Jain, R. Bolle, and S. Pankanti, 'Biometrics : Personal Identification in Networked Society,' Kluwer Academic Publish, 1999
  2. 특허청, '2001 신기술동향 조사 보고서-생체인식시스템-', 2001
  3. 한국전자통신연구원, '생체측정시스템', 2000
  4. 고현주, 이상원, 전명근, '개인확인 및 인증 알고리즘을 위한 홍채패턴인식', 정보처리학회논문지 C, 제8-C권 제5호, pp. 499-506, 2001
  5. J. G. Daugman, 'Complete Discreete 2-D Gabor Transforms by Neural Networks for Image Analysis and Compression,' IEEE Tr. on Acoustics, Speech and Signal Processing, Vol.7, pp.1169-1179, 1988
  6. J. P. Gampbell, Jr,. 'Speaker Recognition : a Tutorial,' Proceedings of the IEEE, Vol.85, pp.1436-1462, 1997 https://doi.org/10.1109/JPROC.1997.628713
  7. S. F. Boll, 'Suppression of Acoustic Noise in Speech using Spectral Subtraction,' IEEE, Trans., ASSP, Vol.37, No.2, pp.113-120, 1979
  8. R. J. Mammone, X. Zhang, and R.P. Ramachandran, 'Robust Speaker Recognition : a Feature-based Approach,' IEEE Signal Processing Magazine, pp.58-71, 1996 https://doi.org/10.1109/79.536825
  9. J. H. L. Hansen and M.A. Clements, 'Constrainted iterative speech enhancement with application to speech recognition.' IEEE Trans. Singal Processing, Vol.39, No.4, pp. 795-805, Apr., 1991 https://doi.org/10.1109/78.80901
  10. B. G. Lee, K. Y. Lee, and S. Ann, 'An EM-based Approach for Parameter Enhancement with an Application to Speech Signal,' Signal Processing, Vol.46, pp.1-14, 1995 https://doi.org/10.1016/0165-1684(95)00068-O
  11. Stephane Mallat, A wavelet tour of signal processing, Academic press, 1999
  12. Francis Phan, M. T. Evangelia, and Samuel Sideman, 'Speaker Identification Using Neural Networks and Wavelets,' IEEE Engineering in Medicine and Biology, Vol., pp.92-101, 2000 https://doi.org/10.1109/51.816248
  13. C. W. Woo, C. P. Lim, and R. Osman, 'Development of a Speaker Recognition System using Wavelets and Atrficial Neural Networks,' IEEE Proceeding on Intelligent Multimedia, Video and Speech Processing, Vol., pp.413-416, 2001
  14. S. George, A. Dibazar, J, S. Liaw, and T. W. Berger, 'Speaker Recognition using Dynamic Synapse Based Neural Networks with Wavelet Preprocessing,' IEEE Proceeding on Intelligent Multimedia, Video and Speech Processing, Vol., pp.413-416, 2001
  15. L. R. Rabiner and B. H. Juang, Fundamentals of speech recognition, Prentice-Hall, 1993