효과적인 상품평 감정 분류를 위한 어휘 자질의 순차적 사용 방법

A method to sequentially use lexical features for effective sentiment categorization of Korean Customer Reviews

  • 신준수 (강원대학교 컴퓨터정보통신전공) ;
  • 김학수 (강원대학교 컴퓨터정보통신전공)
  • Shin, Jun-Soo (Program of Computer and Communications Engineering, Kangwon National University) ;
  • Kim, Harksoo (Program of Computer and Communications Engineering, Kangwon National University)
  • 발행 : 2009.10.09

초록

인터넷이 크게 발전하면서 현재는 인터넷으로 쉽게 쇼핑을 할 수 있다. 이 때 물건의 구입에 큰 영향력을 미치는 것이 바로 그 물건의 상품평이다. 하지만 실제로 수많은 상품평을 사용자가 일일이 확인하고 판단하는 데에는 많은 시간이 소모된다. 이러한 문제점을 해결하기 위해서 본 논문에서는 상품평 문장을 일반, 긍정, 부정의 세 단계로 나누는 시스템을 제안한다. 감정을 판단하는데 중요한 역할을 하는 품사에 따라 우선순위를 달리하여 자질을 추출한다. 추출된 자질을 사용하여 Paul Graham을 사용하여 가중치를 계산하고 기계학습을 한다. 실험은 일반과 감정(긍정, 부정)으로 분류하는 실험과 긍정과 부정으로 분류하는 실험을 하였다. 실험 결과 품사에 우선순위를 사용하여 만든 시스템이 기본 시스템보다 더 적은 자질을 사용하고 더 높은 성능을 보였다.

키워드