음성 부재 확률을 이용한 음성 강화 이득 수정 기법

Robust Speech Reinforcement Based on Gain-Modification incorporating Speech Absence Probability

  • 최재훈 (인하대학교 전자공학부) ;
  • 장준혁 (인하대학교 전자공학부)
  • Choi, Jae-Hun (Department of Electronics Engineering, Inha University) ;
  • Chang, Joon-Hyuk (Department of Electronics Engineering, Inha University)
  • 발행 : 2010.01.25


본 논문에서는 배경 잡음 환경에서 배경 잡음에 의해 저하된 음성 신호의 명료도를 soft decision 기반의 음성 부재 확률을 이용하여 음성 강화 이득을 수정함으로써 음성의 명료도를 보다 향상시키는 기법을 제안한다. 배경 잡음 환경에서 저하된 음성의 명료도를 향상시키기 위한 기존의 음성 강화 기법으로써 soft decision을 이용하여 오염된 음성 신호로부터 깨끗한 음성 신호만 증폭시키는 알고리즘이 제안되었다. 기존의 음성 강화 기법 보다 음성 구간과 비음성 구간 및 전이 구간에서 강인한 음성 강화 이득을 추정하기 위하여 soft decision 기반의 음성 부재 확률 (Speech Absence Probability)을 음성 강화 이득에 통합한 음성 강화 이득 수정 알고리즘을 제안한다. 제안된 음성 강화 기법의 성능은 다양한 배경 잡음 환경에서 ITU-T P.800의 주관적인 음질 측정 방법인 (Comparison Category Rating) 테스트에 의해서 평가되었으며, 기존의 음성 강화 기법과 비교하여 향상된 성능을 보여주었다.

In this paper, we propose a robust speech reinforcement technique to enhance the intelligibility of the degraded speech signal under the ambient noise environments based on soft decision scheme incorporating a speech absence probability (SAP) with speech reinforcement gains. Since the ambient noise significantly decreases the intelligibility of the speech signal, the speech reinforcement approach to amplify the estimated clean speech signal from the background noise environments for improving the intelligibility and clarity of the corrupted speech signal was proposed. In order to estimate the robust reinforcement gain rather than the conventional speech reinforcement method between speech active periods and nonspeech periods or transient intervals, we propose the speech reinforcement algorithm based on soft decision applying the SAP to the estimation of speech reinforcement gains. The performances of the proposed algorithm are evaluated by the Comparison Category Rating (CCR) of the measurement for subjective determination of transmission quality in ITU-T P.800 under various ambient noise environments and show better performances compared with the conventional method.



  1. N. S. Kim, J.-H. Chang, "Spectral enhancement based on global soft decision," IEEE Signal Processing Letters, vol. 7, No. 5, May 2000, pp. 108-110. https://doi.org/10.1109/97.841154
  2. J.-H. Chang, N. S. Kim, "Speech enhancement: new approaches to soft decision," IEICE Trans. Inf. and Syst., vol E84-D, pp. 1231-1240, Sep. 2001.
  3. J.-H. Chang, S. Gazor, N. S. Kim and S. K. Mitra, "Multiple statistical models for soft decision in noisy speech enhancement," Pattern Recognition, vol. 40, no. 3, pp. 1123-1134, Mar. 2007. https://doi.org/10.1016/j.patcog.2006.07.006
  4. Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator," IEEE Trans. Acous., Speech, Signal Process., vol. ASSP-32, no. 6, pp. 1109-1121, Dec. 1984.
  5. J.-H. Chang, N. S. Kim and S. K. Mitra, "Voice activity detection based on multiple statistical models," IEEE Trans. Signal Processing, vol. 56, no. 6, pp. 1965-1976, June 2006.
  6. J. W. Shin and N. S. Kim, "Perceptual reinforcement of speech signal based on partial specific loudness," IEEE Signal Process. Lett., vol. 14, no. 11, pp. 887-890, Nov. 2007. https://doi.org/10.1109/LSP.2007.900222
  7. B. Sauert and P. Vary, "Near end listening enhancement:Speech intelligibility improvement in noisy environments," in Proc. IEEE Int. Conf. Acoustics., Speech, Signal Processing., vol. 1, pp. I-493-I-496, 2006.
  8. 최재훈, 장준혁, "원단 잡음 환경에서 Soft Decision에 기반한 새로운 음성 강화 기법," 한국 음향학회지, 제 27권, 제 7호, pp. 379-385, 2008년 10월.
  9. ITU-T P.800, Methods for Subjective Determination of Transmission Quality, Aug. 1996.