DOI QR코드

DOI QR Code

A Rating Inference of Movie Reviews Using Sentiment Patterns

감성 패턴을 이용한 영화평 평점 추론

  • Kim, Jung-Ho (Department of Computer Engineering, Korea Aerospace University) ;
  • In, Joo-Ho (Department of Computer Engineering, Korea Aerospace University) ;
  • Chae, Soo-Hoan (The School of Electronics and Telecommunication, Korea Aerospace University)
  • 김정호 (한국항공대학교 컴퓨터공학과) ;
  • 인주호 (한국항공대학교 컴퓨터공학과) ;
  • 채수환 (한국항공대학교 전자 및 정보통신공학부)
  • Received : 2013.09.09
  • Accepted : 2014.03.21
  • Published : 2014.03.30

Abstract

We propose the sentiment pattern as a novel sentiment feature for more accurate text sentiment analysis, and introduce the rating inference of movie reviews using it. The text sentiment analysis is a task that recognizes and classifies sentiment of text whether it is positive or negative. For that purpose, the sentiment feature is used, which includes sentiment words and phrase pattern that have specific sentiment like positive or negative. The previous researches for the sentiment analysis, however, have a limit to understand accurately total sentiment of either a sentence or text because they consider the sentiment of sentiment words and phrase patterns independently. Therefore, we propose the sentiment pattern that is defined by arranging semantically all sentiment in a sentence, and use them as a new sentiment feature for the rating inference that is one of the detail subjects of the sentiment analysis. In order to verify the effect of proposed sentiment pattern, we conducted experiments of rating inference. Ratings of test reviews is inferred by using a probabilistic method with sentiment features including sentiment patterns extracted from training reviews. As a result, it is shown that the result of rating inference with sentiment patterns are more accurate than that without sentiment patterns.

본 연구는 보다 정확한 텍스트의 감성 분석을 위해 새로운 감성 특징인 감성 패턴을 제안하고, 이를 이용한 영화평 평점 추론에 대해 소개한다. 텍스트 감성 분석은 텍스트에 포함된 감성인 긍정과 부정을 인식하고 분류하는 작업으로, 이를 위해 감성 특징인 감성 단어와 구문 패턴을 이용한다. 텍스트 내에 존재하는 감성 단어와 구문 패턴의 감성을 통해 텍스트 전체의 감성을 분류하는 것이다. 하지만, 기존 감성 분석은 감성 단어와 구문 패턴의 감성을 독립적으로 고려하기 때문에 문장 혹은 글 전체의 감성 정보를 정확히 파악하기 어렵다는 한계를 가지고 있다. 그러므로 본 연구는 기존 감성 특징들을 독립적으로 고려하는 것뿐만 아니라 문장 내에서 출현하는 감성들을 의미적으로 연결하여 하나의 패턴으로 정의한 감성 패턴을 제안하고, 감성 분석의 세부 연구 주제인 평점 추론에 감성 패턴을 새로운 감성 특징으로 사용하였다. 제안하는 감성 패턴의 효과를 검증하기 위해 영화평에 대한 평점 추론 실험을 수행하였다. 감성 패턴을 포함한 모든 감성 특징들을 사전에 정의한 학습 영화평들로부터 추출하고, 이를 확률 기법을 이용해 실험 영화평들의 평점을 추론하였다. 그 결과 감성 패턴을 사용하였을 경우 기존 감성 특징들만 사용했을 때 보다 추론한 평점이 더욱 정확함을 확인하였다.

Keywords

References

  1. Esuli, A. & Sebastiani, F. (2006). SENTIWORDNET: A Publicly Available Lexical Resource for Opinion Mining, 5th Conference on Language Resources and Evaluation, 417-422.
  2. Fei, Z., Liu, J., & Wu, G. (2004). Sentiment classification using phrase patterns, The Fourth International Conference on Computer and Information Technology, 1147-1152.
  3. Glorot, X., Bordes, A., & Bengio, Y. (2011). Domain Adaptation for Large-Scale Sentiment Classification: A Deep Learning Approach, Proceedings of the 28th International Conference on Machine learning, 513-520.
  4. Kim, J. H., Kim, M. K., Cha, M. H., In, J. H., & Chae, S. H. (2010). 한국어 특성을 고려한 감성 분류, 한국감성과학회, 13(3), 449-458.
  5. Liu, B. (2012). Sentiment Analysis and Opinion Mining, Synthesis Lectures on Human Language Technologies, 5(1), 1-167.
  6. Leung, C. W., Chan, S. C., Chung, F., & Ngai, G. (2011). A probabilistic rating inference framework for mining user preferences from reviews, World Wide Web, 14(2), 187-215. https://doi.org/10.1007/s11280-011-0117-5
  7. Li, S. & Zong, C. (2008). Multi-domain sentiment classification, Proceedings of the 46th Annual Meeting of the Association for Computational Linguistics on Human Language Technologies: Short Papers, 257-260.
  8. Pang, B., Lee, L., & Vaithyanathan, S. (2002). Thumbs up?: sentiment classification using machine learning techniques, Proceedings of the ACL-02 conference on Empirical methods in natural language processing, 79-86.
  9. Pang, B. & Lee, L. (2004). A sentimental education: sentiment analysis using subjectivity summarization based on minimum cuts, Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics.
  10. Pang, B. & Lee, L. (2005). Seeing stars: exploiting class relationships for sentiment categorization with respect to rating scales, Proceedings of the 43rd Annual Meeting on Association for Computational Linguistics, 115-124.
  11. Pan, S. J., Ni, X., Sun, J., Yang, Q., & Chen, Z. (2010). Cross-domain sentiment classification via spectral feature alignment, Proceedings of the 19th international conference on World wide web, 751-760.
  12. Strapparava, C. & Mihalcea, R. (2008). Learning to identify emotions in text, Proceedings of the 2008 ACM symposium on Applied computing, 1556-1560.
  13. Taboada, M., Brooke, J., Tofiloski, M., Voll, K., & Stede, M. 2011. Lexicon-Based Methods for Sentiment Analysis, Computational Linguistics, 37(2), 267-307. https://doi.org/10.1162/COLI_a_00049
  14. Thelwall, M., Buckley, K., & Paltoglou, G. (2012). Sentiment strength detection for the social web, Journal of the American Society for Information Science and Technology, 63(1), 163-173. https://doi.org/10.1002/asi.21662
  15. Turney, P. D. (2002). Thumbs up or thumbs down?: semantic orientation applied to unsupervised classification of reviews, Proceedings of the 40th Annual Meeting on Association for Computational Linguistics, 417-424.