DOI QR코드

DOI QR Code

Data Sampling Strategy for Korean Speech Emotion Classification using wav2vec2.0

wav2vec2.0을 활용한 한국어 음성 감정 분류를 위한 데이터 샘플링 전략

  • Mirr-Shin (Dept. of Computer Science, Incheon National University) ;
  • Youhyun Shin (Dept. of Computer Science, Incheon National University)
  • 신미르 (인천대학교 컴퓨터공학부) ;
  • 신유현 (인천대학교 컴퓨터공학과 )
  • Published : 2023.11.02

Abstract

음성 기반의 감정 분석은 인간의 감정을 정확하게 파악하는 데 중요한 연구 분야로 자리잡고 있다. 최근에는 wav2vec2.0과 같은 트랜스포머 기반의 모델이 음성 인식 분야에서 뛰어난 성능을 보이며 주목받고 있다. 본 연구에서는 wav2vec2.0 모델을 활용하여 한국어 감성 발화 데이터에 대한 감정 분류를 위한 데이터 샘플링 전략을 제안한다. 실험을 통해 한국어 음성 감성분석을 위해 학습 데이터를 활용할 때 감정별로 샘플링하여 데이터의 개수를 유사하게 하는 것이 성능 향상에 도움이 되며, 긴 음성 데이터부터 이용하는 것이 성능 향상에 도움이 됨을 보인다.

Keywords

Acknowledgement

"본 연구는 과학기술정보통신부및정보통신기획평가원의 학석사연계ICT핵심인재양성사업의 연구결과로 수행되었음" (IITP-2023-RS-2023-00260175)