Design of the LSF Parameter Quantizer for the Wideband Speech Codec

광대역 음성 부호화기용 선 스펙트럼 주파수 계수 양자화기 설계

  • 지상현 (한양대학교 전자전기제어계측공학과) ;
  • 강상원 (한양대학교 전자전기제어계측공학과) ;
  • 윤병식 (한양대학교 전자전기제어계측공학과)
  • Published : 2001.05.01

Abstract

In this paper, we designed an LSF coefficient quantizer of the wideband speech codec that can produce high quality speech service. For the efficient LSF coefficient quantizer, the interframe correlation was used. Also we separately quantized the LSF coefficients with high and low interframe correlation. Predictive pyramid vector quantizer (PVQ) was used for quantizing the LSF coefficients with high interframe correlation, and PVQ was used for quantizing the LSF coefficients with low interframe correlation. Experiments show that the proposed UF quantizer can quantize LSF information in 40 bits/frame, with an average spectral distortion (SD) of 1 dB and less than 3.87% frames having SD greater than 2 dB.

본 논문에서는 고품질 음성 서비스를 가능하게 하는 광대역 음성 부호화기의 선 스펙트럼 주파수 (line spectral frequency: ISF) 계수 양자화기를 설계하였다. 광대역 음성 부호화기를 위한 효율적인 LSF 계수 양자화기를 설계하기 위하여, 인접 프레임간의 상관도를 이용하였으며, 각 해당 프레임의 ISF 계수에 대한 양자화를 인접 프레임간 상관도가 높은 프레임과 상관도가 낮은 프레임으로 나누어 독립적으로 수행하였다. 인접 프레임간 상관도가 높은 프레임의 LSF계수 양자화를 위하여 예측 피라미드형 벡터 양자화기 (predictive pyramid vector quantizer: PPVQ)를 사용하여 양자화하였고, 상관도가 낮은 프레임의 LSF 계수는 피라미드형 벡터 양자화기 (PVQ)를 사용하여 양자화 하였다. PPVQ에서 예측기로 1차 AR 예측기를 사용하였다. 광대역 음성 부호화기를 위해 본 논문에서 설계된 UF 계수양자화기를 평균스펙트럼 왜곡(spectral distortion: SD) 성능 관점에서 실험한 결과, LSF계수 양자화에 할당된 비트가 프레임당 40비트일 때, 평균 SD값이 1 dB 내외이고, 2 dB 이상 및 4 dB 이상 outlier가 각각 3.87%및 0.01%인 transparent한 성능을 얻을 수 있었다.

Keywords

References

  1. IEEE Trans. on Information Theory v.32 no.4 A pyramid vector quantizer T. R. Fischer
  2. IEEE Trans. Inform. Theory v.IT-26 Optimal encoding of discree-time continuous-amplitude meneryless sources with finite output alphabets W. A. Finamore;W. A. Pearlina
  3. IEEE Trans. Speech & Audio Processing v.7 no.5 Interframe LSF Quantization for Noisy Channels T. Eriksson;J. Linden;J. Skoglund
  4. Prco. IEEE Int. Conf. Acoustics, Speech, Signal Processing v.4 Vector predictive quantization of the spectral parameters for low rate speech coding Y. Shoham
  5. Proc. IEEE Int. Conf. Acoustics, Speech and Signal Processing v.1 Encoding of LPC spectral parameters using switched-adaptive interframe vector prediction M. Yong;G. Davidsson;A. Gersho
  6. IEEE Trans. Inform. Theory v.31 Finite-state vector quantization for waveform coding J. Foster;R.M. Gray;M. O. Dunham
  7. IEEE Workshop on Speech Coding Processing LSP quantization in wideband speech coders M. Ferhaoui;S.V. Gerven