Unproved Speech Enhancement Algorithm employing Multi-band Power Subtraction and Wavelet Packets Decomposition

Multi-band Power Subtraction과 Wavelet Packets Decomposition을 이용한 개선된 음성 향상 방법

  • 이윤창 (고려대학교 전자및정보공학부 신호처리연구실) ;
  • 곽정훈 (LG전자 DMP연구소 Video 개발그룹) ;
  • 안상식 (고려대학교 전자및정보공학부)
  • Published : 2006.06.01

Abstract

잡음은 음성과 관련된 시스템의 성능을 제한하는 주된 원인이기 때문에 음성향상과 관련된 연구는 꾸준히 계속되어왔다. 전통적인 음성향상 방법은 무성음과 잡음을 구분하지 알기 때문에 잡음제거 과정에서 무성음이 함께 제거되는 단점이 있으며, 웨이블릿 기반의 전통적인 잡음제거 방법은 각 대역마다 동일한 문턱값을 사용하기 때문에 시변 환경에서 성능이 떨어지는 단점이 있다. 이 단점들을 개선하기위해 다중대역 파워 차감법과 Perceptual 웨이블릿 패킷 분해를 이용한 웨이블릿 기반의 개선된 음성향상 방법을 제안한다. 전처리 과정으로 다중대역 파워 차감법을 사용하여 광대역 잡음을 제거하고 뮤지컬 잡음의 발생을 줄이며, psycho-acoustic 모델 기반 Perceptual 웨이블릿 패킷으로 신호를 분해한 후 각 웨이블릿 노드의 엔트로피 비율과 음성검출을 이용하여 무성음/유성음/잡음을 구분한다. 구분된 신호에 따라 각 웨이블릿 노드마다의 문턱값을 기준으로 웨이블릿 Shrinkage를 적용하여 잡음을 제거하고 무성음이나 파워가 작은 유성음이 제거되는 오류를 최소화한다. 또한 잡음 파워 추정 과정에 적응적으로 망각 계수를 선택하여 잡음 파워 추정 오류를 최소화한다.

Keywords

References

  1. S. Boll, 'Suppression of acoustic noise in speech using spectral subtraction,' IEEE Trans. Acoust, Signal Processing, Vol.27, pp.113-120, 1979 https://doi.org/10.1109/TASSP.1979.1163209
  2. L.R. Rabiner and R.W. Schafer, Digital Processing of Speech Signal. Prentice-Hall, 1978
  3. Z. Goh, K.C. Tan, T.G. Tan, 'Postprocessing method for suppressing musical noise generated by spectral subtraction,' IEEE Transactions on Speech and Audio Processing, Vol.6, Issue 3, pp.287-292, May 1998 https://doi.org/10.1109/89.668822
  4. A. Juneja, O. Deshmukh, C. Espy-Wilson, 'A multi-band spectral subtraction method for enhancing speech corrupted by colored noise,' Acoustics, Speech, and Signal Processing, IEEE International Conference on, Vol.4, pp.IV-4164, May 2002
  5. C.Sidney and Burrus, Introduction to Wavelets and Wavelet Transforms A Primer. Prentice-Hall, 1998
  6. Stephane Mallat, A Wavelet Tour of Signal Processing, Academic Press, pp.321-327, 1998
  7. D.L. Donoho, and I.M. Jonstone, 'Ideal Spatial Adaptation by Wavelet Shrinkage,' Biometrika, Vol.81, pp.425-455. 1994 https://doi.org/10.1093/biomet/81.3.425
  8. H.Y. Gao and A.G. Bruce, 'WaveShrinkage with Semisoft Shrinkage,' StatSci Division of MathSoft. Inc. 1995
  9. M. Bahoura and J. Rouat, 'Wavelet Speech Enhancement based on The Teager Energy Operator,' IEEE Signal Processing Letter, Vol. 8, pp.10-12, 2001 https://doi.org/10.1109/97.889636
  10. J. Yang, 'Frequency Domain Noise Suppression Approaches in Mobile Telephone System,' Acoustics, Speech, and Signal Processing, IEEE International Conference on, Vol.2, pp.363-366, April, 1993
  11. S.H. Chen et al., 'Robust Voice Activity Detection Algorithm Based on the Perceptual Wavelet Packet Transform,' ISPACS 2005. Proceedings of International Symposium on., pp.45-48, December, 2005
  12. E.Zwicker and E.Terhardt, 'Analytical Expressions for Critical Band Rate and Critical Bandwidth as a Function of Frequency,' JASA, Vol.68, pp.1523-1525, 1980 https://doi.org/10.1121/1.385079
  13. A.M.Kondoz, Digital Speech coding for low bit rate communiucations systems, John Wiley & Sons, pp.142-160, 1995
  14. M. Berouti, R. Schwartz, J. Makhoul, 'Enhancement of speech corrupted by acoustic noise,' Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP '79. Vol.4, pp.208-211, April, 1979
  15. I.J. Kim, S.I. Yang, Y. Kwon, 'Speech enhancement using adaptive wavelet shrinkage,' Proceedings of IEEE International Symposium on Industrial Electronics, Vol.1, pp.501-504, 2001
  16. 이윤창, 안상식, '음성 향상 전처리와 문턱값 갱신을 적용한 향상된 음성검출 방법,' 한국통신학회논문지, Vol.28, No.11C, pp.1161-1168, 2003
  17. http://www.sipro.com. Sipro Lab. Telecom Inc
  18. http://spib.rice.edu, Rice University. DSP group
  19. Ryouichi Nishimura, Futoshi Asano, and Yoiti Susuki, 'Speech Enhancement Using Spectral Subtraction with Wavelet Transform,' Electronics and communications in Japan, Part3, Vol.81, No.1, 1998