Semi-Supervised Learning for Sentiment Phrase Extraction by Combining Generative Model and Discriminative Model

의견 어구 추출을 위한 생성 모델과 분류 모델을 결합한 부분 지도 학습 방법

  • Nam, Sang-Hyob (Department of Computer Science and Engineering Division of Electrical and Computer Engineering Pohang University of Science and Technology) ;
  • Na, Seung-Hoon (Department of Computer Science and Engineering Division of Electrical and Computer Engineering Pohang University of Science and Technology) ;
  • Lee, Ya-Ha (Department of Computer Science and Engineering Division of Electrical and Computer Engineering Pohang University of Science and Technology) ;
  • Lee, Yong-Hun (Department of Computer Science and Engineering Division of Electrical and Computer Engineering Pohang University of Science and Technology) ;
  • Kim, Jun-Gi (Department of Computer Science and Engineering Division of Electrical and Computer Engineering Pohang University of Science and Technology) ;
  • Lee, Jong-Hyeok (Department of Computer Science and Engineering Division of Electrical and Computer Engineering Pohang University of Science and Technology)
  • 남상협 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과) ;
  • 나승훈 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과) ;
  • 이예하 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과) ;
  • 이용훈 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과) ;
  • 김준기 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과) ;
  • 이종혁 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과)
  • Published : 2008.06.30

Abstract

의견(Opinion) 분석은 도전적인 분야로 언어 자원 구축, 문서의 Sentiment 분류, 문장 내의 의견 어구 추출 등의 다양한 문제를 다룬다. 이 중 의견 어구 추출문제는 단순히 문장이나 문서 단위로 분류하는 수준을 뛰어 넘는 문장 내 의견 어구를 추출하는 문제로 최근 많은 관심을 받고 있는 연구 주제이다. 그러나 의견 어구 추출에 대한 기존 연구는 문장 내 의견 어구부분이 태깅(tagging)된 학습 데이터와 의견 어휘 자원을 이용한 지도(Supervised)학습을 이용한 접근이 대부분으로 실제 적용 상의 한계를 갖는다. 본 논문은 문장 내 의견 어구 부분이 태깅된 학습 데이터와 의견 어휘 자원이 없는 환경에서도 문장단위의 극성 정보를 이용하여 의견 어구를 추출하는 부분 지도(Semi-Supervised)학습 장법을 제안한다. 본 논문의 방법은 Baseline에 비하여 정확률(Precision)은 33%, F-Measure는 14% 가량 높은 성능을 냈다.

Keywords