KE-T5-Based Text Emotion Classification in Korean Conversations

KE-T5 기반 한국어 대화 문장 감정 분류

  • Lim, Yeongbeom (Korea Electronics Technology Institute, Artificial Intelligence Research Center) ;
  • Kim, San (Korea Electronics Technology Institute, Artificial Intelligence Research Center) ;
  • Jang, Jin Yea (Korea Electronics Technology Institute, Artificial Intelligence Research Center) ;
  • Shin, Saim (Korea Electronics Technology Institute, Artificial Intelligence Research Center) ;
  • Jung, Minyoung (Korea Electronics Technology Institute, Artificial Intelligence Research Center)
  • 임영범 (한국전자기술연구원, 인공지능연구센터) ;
  • 김산 (한국전자기술연구원, 인공지능연구센터) ;
  • 장진예 (한국전자기술연구원, 인공지능연구센터) ;
  • 신사임 (한국전자기술연구원, 인공지능연구센터) ;
  • 정민영 (한국전자기술연구원, 인공지능연구센터)
  • Published : 2021.10.14

Abstract

감정 분류는 사람의 사고방식이나 행동양식을 구분하기 위한 중요한 열쇠로, 지난 수십 년간 감정 분석과 관련된 다양한 연구가 진행되었다. 감정 분류의 품질과 정확도를 높이기 위한 방법 중 하나로 단일 레이블링 대신 다중 레이블링된 데이터 세트를 감정 분석에 활용하는 연구가 제안되었고, 본 논문에서는 T5 모델을 한국어와 영어 코퍼스로 학습한 KE-T5 모델을 기반으로 한국어 발화 데이터를 단일 레이블링한 경우와 다중 레이블링한 경우의 감정 분류 성능을 비교한 결과 다중 레이블 데이터 세트가 단일 레이블 데이터 세트보다 23.3% 더 높은 정확도를 보임을 확인했다.

Keywords

Acknowledgement

이 논문은 2021년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임 (No.2021-0-00354, 비정형 텍스트를 학습하여 쟁점별 사실과 논리적 근거 추론이 가능한 인공지능 원천기술)