DOI QR코드

DOI QR Code

A Discrete Feature Vector for Endpoint Detection of Speech with Hidden Markov Model

숨은마코프모형을 이용하는 음성 끝점 검출을 위한 이산 특징벡터

  • Published : 2008.12.31

Abstract

The purpose of this paper is to suggest a discrete feature vector, robust in various levels of noisy environment and inexpensive in computation, for detection of speech segments and is to show such properties of the feature with real speech data. The suggested feature is one dimensional vector which represents slope of short term energies and is discretized into three values to reduce computational burden of computations in HMM. In experiments with speech data, the method with the suggested feature vector showed good performance even in noisy environments.

본 연구의 목적은 숨은마코프모형을 사용하여 음성구간의 끝점을 검출하는 문제에서 소음의 환경에서도 강건하며 계산의 부하가 적은 이산형 특징벡터를 제안하고 이의 성질을 실증적으로 밝히는 것이다. 제시된 특징벡터는 일차원의 소리 신호의 에너지의 변화율을 나타내는 경사도이며 숨은마코프모형과 관련된 계산에서의 부하를 감소하기 위하여 세 개의 값으로 이산화하였다. 여러 소음 수준의 끝점 검출의 실험에서, 제시된 특징벡터가 잡음 환경에서도 강건함을 보였다.

Keywords

References

  1. 김경태, 강성훈, 이용주, 정유현, 박찬경, 이정칠, 류준형, 한희일 (1990). <대어휘 연속음성 인식을 위한 음소인식 기술 개발>, 최종연구보고서, 과학기술처
  2. 박기상, 석수영, 정호열, 정현열 (2002). 대역에너지를 이용한잡음음성의 끝점검출 알고리즘,<한국음향학회 춘계 학술대회지>, 91-94
  3. 석증원, 배건성 (1996). Wavelet 변환을 이용한 잡음 음성의 끝점 검출,<대한전자공학회, 학술대회 논문집(신호 처리합동)>, 9, 69-72
  4. 이용형, 오창혁 (2001). HMM based endpoint detection for speech signals, <한국통계학회: 추계학술발표회 논문집>, 75-76
  5. 정대성, 김정곤, 김형순 (2003). 화자인식을 위한 강인한 끝점 검출 알고리즘,<대한음성학회: 학술대회지>, 137-140
  6. 흥정우, 오창혁 (2008). 숨은마코프모형을 이용하는 음성구간 추출을 위한 특정벡터,<한국통계학회 논문집>, 15, 293-302 https://doi.org/10.5351/CKSS.2008.15.2.293
  7. Acero, A., Crespo, C., Torre, C. de la and Torrecilla, J. C. (1993). Robust HMM-based endpoint detector, In EUROSPEECH '93, 1551-1554
  8. Chen, N. and Hu, Y. (2007). Pitch detection algorithm based on Teager energy operator and spatial cor- relation function, In Proceedings of the Sixth International Conference on Machine Learning and Cybernetics, 5, 2456-2460
  9. Kaiser, J. F. (1990). On a simple algorithm to calculate the 'energyapos' of a signal, In ICASSP '90, 1, 381-384
  10. Lamel, L. F., Rabiner, L. R., Rosenberg, A. E. and Wilpon, J. G. (1981). An improved endpoint detector for isolated word recognition, IEEE Transactions on Acoustics, Speech and Signal Processing, 29, 777-785
  11. Rabiner, L. R. (1989). A tutorial on hidden Markov models and selected applications in speech recognition, In Proceedings of the IEEE, 77, 257-285