DOI QR코드

DOI QR Code

A Syllable Kernel based Sentiment Classification for Movie Reviews

음절 커널 기반 영화평 감성 분류

  • Received : 2010.02.17
  • Accepted : 2010.03.22
  • Published : 2010.04.25

Abstract

In this paper, we present an automatic sentiment classification method for on-line movie reviews that do not contain explicit sentiment rating scores. For the sentiment polarity classification, positive or negative, we use a Support Vector Machine classifier based on syllable kernel that is an extended model of string kernel. We give some experimental results which show that proposed syllable kernel model can be effectively used in sentiment classification tasks for on-line movie reviews that usually contain a lot of grammatical errors such as spacing or spelling errors.

본 논문에서는 감성 점수가 명시적으로 부여되지 않은 온라인 영화평에 대해 자동으로 감성을 분류하는 방법을 제안한다. 긍정이나 부정과 같은 감성 극성 분류를 위해 문자열 커널의 확장 모델인 음절 커널에 기반한 지지벡터기계를 분류기로 사용한다. 실험을 통하여 띄어쓰기나 철자 오류 같은 문법적인 오류가 빈번한 온라인 영화평에 대한 감성 분류에서 제안한 음절 커널 방법이 효과적임을 보인다.

Keywords

References

  1. V. Hatzivassiloglou and K.R McKeown, "Predicting the semantic orientation of adjectives," Proceedings of the 8th conference on European chapter of the Association for Computational Linguistics, pp. 174-181, 1997.
  2. P.D. Turney and M.L. Littman, "Measuring praise and criticism: Inference of semantic orientation from association," ACM Trans. Inf. Syst. 21(4), pp. 315-346, 2003. https://doi.org/10.1145/944012.944013
  3. P. Chesley, B. Vincent, L. Xu, R.K. Srihari, "Using Verbs and Adjectives to Automatically Classify Blog Sentiment," Proceedings of American Association for Artificial Intelligence-Spring Symposium Series Technical Reports, pp. 27-30, 2006.
  4. WordNet (http://wordnet.princeton.edu)
  5. J. Kamps, M. Marx, R.J. Mokken, and M.D. Rijke, "Using WordNet to measure semantic orientation of adjectives," Proceedings of the 4th International Conference on Language Resources and Evaluation, pp. 1115-1118, 2004.
  6. B. Pang, L. Lee, S. Vaithyanathan, "Thumbs up? Sentiment classification using machine learning techniques," Proceedings of the ACL-02 conference on Empirical methods in natural language processing, Vol 10, pp. 79-86, 2002. https://doi.org/10.3115/1118693.1118704
  7. 황재원, 고영중, "감정 자질을 이용한 한국어 문장 및 문서 감정 분류 시스템," 정보과학회논문지, 제 14권, 제3호, pp. 336-340, 2008.
  8. 명재석, 이동주, 이상구, "반자동으로 구축된 의미 사전을 이용한 한국어 상품평 분석 시스템," 정보과학회논문지. 제35권, 제6호, pp. 392-403, 2008.
  9. 남상협, 나승훈, 이예하, 이용훈, 김준기, 이종혁, "의견 어구 추출을 위한 생성 모델과 분류 모델을 결합한 부분 지도 학습 방법," 한국컴퓨터종합학술대회 논문집, Vol.35, No.1(C), pp. 268-273, 2008.
  10. 김묘실, 강승식, "SVM을 이용한 악성 댓글 판별 시스템의 설계 및 구현," 한글 및 한국어 정보처리 학술대회논문집, pp. 285-289, 2006.
  11. H. Lodhi, C. Saunders, J. Shawe-Taylor, N. Cristianini, and C. Watkins, "Text Classification using String Kernels," Journal of Machine Learning Research, pp. 419-444, 2002.
  12. http://www.unicode.org/charts/PDF/"UAC00.pdf
  13. S. S. Kang, Korean Morphological Analysis and Information Retrieval, Hong-Reung publisher, 2002.

Cited by

  1. Empirical Sentiment Classification Using Psychological Emotions and Social Web Data vol.22, pp.5, 2012, https://doi.org/10.5391/JKIIS.2012.22.5.563
  2. A Comparative Study on Using SentiWordNet for English Twitter Sentiment Analysis vol.23, pp.4, 2013, https://doi.org/10.5391/JKIIS.2013.23.4.317