Recognizing Five Emotional States Using Speech Signals

Kang Bong-Seok;Han Chul-Hee;Woo Kyoung-Ho;Yang Tae-Young;Lee Chungyong;Youn Dae-Hee;

Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)

autumn
/
Pages.101-104
/
1999

The Acoustical Society of Korea (한국음향학회)

Recognizing Five Emotional States Using Speech Signals

음성 신호를 이용한 화자의 5가지 감성 인식

Kang Bong-Seok (Department of Electrical Computer Engineering, Yonsei Univ.) ;
Han Chul-Hee (Center for Signal Processing Research, Yonsei Univ.) ;
Woo Kyoung-Ho (Department of Electrical Computer Engineering, Yonsei Univ.) ;
Yang Tae-Young (Department of Electrical Computer Engineering, Yonsei Univ.) ;
Lee Chungyong (Department of Electrical Computer Engineering, Yonsei Univ.) ;
Youn Dae-Hee (Department of Electrical Computer Engineering, Yonsei Univ.)

강봉석 (연세대학교 전기) ;
한철희 (연세대학교 신호처리 연구 센터) ;
우경호 (연세대학교 전기) ;
양태영 (연세대학교 전기) ;
이충용 (연세대학교 전기) ;
윤대희 (연세대학교 전기)

Published : 1999.11.06

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문에서는 음성 신호를 이용해서 화자의 감정을 인식하기 위해 3가지 시스템을 구축하고 이들의 성능을 비교해 보았다. 인식 대상으로 하는 감정은 기쁨, 슬픔, 화남, 두려움, 지루함, 평상시의 감정이고, 각 감정에 대한 감정 음성 데이터베이스를 직접 구축하였다. 피치와 에너지 정보를 감성 인식의 특징으로 이용하였고, 인식 알고리듬은 MLB(Maximum-Likelihood Bayes)분류기, NN(Nearest Neighbor)분류기 및 HMM(Hidden Markov Model)분류기를 이용하였다. 이 중 MLB 분류기와 NN 분류기에서는 특징벡터로 피치와 에너지의 평균과 표준편차, 최대값 등 통계적인 정보를 이용하였고, TMM 분류기에서는 각 프레임에서의 델타 피치와 델타델타 피치, 델타 에너지와 델타델타 에너지 등 시간적 정보를 이용하였다. 실험은 화자종속, 문장독립형 방식으로 하였고, 인식 실험 결과는 MLB를 이용해서 $68.9\%, NN을 이용해서 $66.7\%를 얻었고, HMM 분류기를 이용해서 $89.30\%를 얻었다.

Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)

Recognizing Five Emotional States Using Speech Signals

음성 신호를 이용한 화자의 5가지 감성 인식

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)