DOI QR코드

DOI QR Code

A Study on Robust Emotion Classification Structure Between Heterogeneous Speech Databases

이종 음성 DB 환경에 강인한 감성 분류 체계에 대한 연구

  • Published : 2009.07.31

Abstract

The emotion recognition system in commercial environments such as call-center undergoes severe system performance degradation and instability due to the speech characteristic differences between the system training database and the input speech of unspecified customers. In order to alleviate these problems, this paper extends traditional method of emotion recognition of neutral/anger into two-step hierarchical structure by using emotional characteristic changes and differences of male and female. The experimental results indicate that the proposed method provides very stable and successful emotional classification performance about 25% over the traditional method of emotion recognition.

고객센터 (call-center)와 같은 기업환경의 감성인식 시스템은 감성 훈련용 음성과 불특정 고객들의 질의 음성간의 녹취 환경차이로 인해 상당한 시스템 성능 저하와 불안정성을 겪게 된다. 본 논문에서는 이러한 문제점을 극복하기 위해 기존의 전통적인 평상/화남 감성 분류체계를 남 녀 성별에 따른 감성별 특성 변화를 적용하여 2단계 분류체계로 확장하였다. 실험 결과, 제안한 방법은 녹취 환경 차이로 인한 시스템 불안정성을 해소할 수 있을 뿐 아니라 약 25% 가까운 인식 성능 개선을 가져올 수 있었다.

Keywords

References

  1. F. Dellaert, T. Poizin, and A. Waibel, "Recognizing Emotion in Speech," In Proc. International Conf. on Spoken Language Processing, pp. 1970-1973, Oct., 1996
  2. T. Moriyama and Oazwa, "Emotion Recognition and Synthesis System on Speech," IEEE International Conference on Multi-media Computing and Systems, vol. 1, pp, 840-844, July, 1999 https://doi.org/10.1109/MMCS.1999.779310
  3. A. Nogueiras, A. Moreno, A. Bonafonte, and J. B. Marino, "Speech Emotion Recognition Using Hidden Markov Models," In Eurospeech 2001 Poster Proceedings, pp. 2679-2682, Sep., 2001
  4. Guojun Zhou, John H. L. Hansen, and James F. Kaiser, "Nonlinear Feature Based Classification of Speech Under Stress," IEEE Transactions on Speech and Audio Processing, vol. 9, no. 3, pp. 201-216, 2001 https://doi.org/10.1109/89.905995
  5. Lingyun Gu and Stephen A. Zahorian, “A New Robust Algorithm for isolated Word Endpoint Detection,” International Conference on Acoustics, Speech, and Signal Processing, vol. 4. pp. 4161, May, 2002
  6. 강봉석, "음성 신호를 이용한 문장독립 감정 인식 시스템," 석사학위 논문, 연세대학교, 2001