DOI QR코드

DOI QR Code

Improvement of the Linear Predictive Coding with Windowed Autocorrelation

윈도우가 적용된 자기상관에 의한 선형예측부호의 개선

  • 이창영 (동서대학교 시스템경영공학과) ;
  • 이채봉 (동서대학교 전자공학과)
  • Received : 2011.02.26
  • Accepted : 2011.04.12
  • Published : 2011.04.30

Abstract

In this paper, we propose a new procedure for improvement of the linear predictive coding. To reduce the error power incurred by the coding, we interchanged the order of the two procedures of windowing on the signal and linear prediction. This scheme corresponds to LPC extraction with windowed autocorrelation. The proposed method requires more calculational time because it necessitates matrix inversion on more parameters than the conventional technique where an efficient Levinson-Durbin recursive procedure is applicable with smaller parameters. Experimental test over various speech phonemes showed, however, that our procedure yields about 5 % less power distortion compared to the conventional technique. Consequently, the proposed method in this paper is thought to be preferable to the conventional technique as far as the fidelity is concerned. In a separate study of speaker-dependent speech recognition test for 50 isolated words pronounced by 40 people, our approach yielded better performance too.

본 논문은 선형예측부호의 개선을 위한 새로운 과정을 제안한다. 코딩에 따른 오차를 줄이기 위하여, 신호에 윈도우를 적용하는 과정과 선형예측 과정의 순서를 바꾸었다. 이 처방은 윈도우를 적용한 자기상관을 이용하여 선형예측부호를 추출하는 것에 해당한다. 기존의 방법에서는 보다 적은 파라미터에 대해 레빈슨-더빈의 재귀적 계산법을 적용하는 것이 가능한 반면, 본 논문에서 제안된 방법에서는 더 많은 작업 파라미터에 대한 역행렬 계산이 필요하므로, 보다 긴 계산 시간이 요구된다. 하지만, 여러 음성 음소에 대해 테스트한 결과, 제안된 방법에 의하면 기존의 기술에 비해 약 5 % 적은 파워 왜곡이 얻어짐이 밝혀졌다. 따라서 부호화의 신뢰성에 관한 한, 기존의 기술에 비해 본 논문에서 제안된 방법이 더 나은 것으로 사료된다. 40명에 의해 발성된 50 고립단어에 대한 화자종속 음성인식 시험에서도 제안된 방법이 보다 우수한 성능을 보여주었다.

Keywords

References

  1. T. D. Pham, "Cancer Classification by Minimizing Fuzzy Scattering Effect", IEEE International Conference on Fuzzy Systems, pp. 377-380, 2008.
  2. V. S. Inamdar, P. P. Rege, and A. Bang, "Speech Based Watermarking for Digital Images", TENCON 2009, pp. 1-6, 2009.
  3. T. D. Pham, "LPC Cepstral Distortion Measure for Protein Sequence Comparison", IEEE Transactions on Nano-Bioscience, Vol. 5, No. 2, pp. 83-88, 2006. https://doi.org/10.1109/TNB.2006.875029
  4. D. Yao, M. R. Azimi-Sadjadi, A. A. Jamshidi, G. J. Dobeck, "A Study of Effects of Sonar Bandwidth for Underwater Target Classification", IEEE J. of Oceanic Engineering, Vol. 27, No. 3, pp. 619-627, 2002. https://doi.org/10.1109/JOE.2002.1040944
  5. G. P. Acharya, B. V. Reddy, and P. N. Kumar, "Analysis of the Encoding Scheme for CS-ACELP Codec for Secured VoIP Communication", 2nd IEEE International Conference on Computer Science and Information Technology, pp. 287-290, 2009.
  6. A. Harma, U. K. Laine, "A Comparison of Warped and Conventional Linear Predictive Coding", IEEE Transactions on Speech and Audio Processing, Vol. 9, No. 5, pp. 579-588, 2001. https://doi.org/10.1109/89.928922
  7. A. Harma, "Linear Predictive Coding with Modified Filter Structures", IEEE Transactions on Speech and Audio Processing, Vol. 9, No. 8, pp. 769-777, 2001. https://doi.org/10.1109/89.966080
  8. W. Han, E. Kim, and Y. Oh, "Natural Quality Two-Band LPC Coding of Speech at 880 bit/s with Frame Interpolation", Electronics Letters, Vol. 38, No. 6, pp. 292-294, 2002. https://doi.org/10.1049/el:20020182
  9. M. A. Raza and P. Akhtar, "Implementation of Voice Excited Linear Predictive Coding (VELP) on TMS320C6711 DSP Kit", IEEE INMIC 2005 9th International Multitopic Conference, pp. 1-5, 2005.
  10. B. Cornel, "Efficient LSP Computation and Quantization", International Symposium on Signals, Circuits and Systems, Vol. 1, pp. 175-178, 2005.
  11. J. D. Markel, and A. H. Gray, "Linear Prediction of Speech", Springer-Verlag, 1976.
  12. B. S. Atal, "The History of Linear Prediction", IEEE Signal Processing Magazine, Vol. 23, No. 2, pp. 154-161, 2006. https://doi.org/10.1109/MSP.2006.1598091