A Sentiment Analysis Algorithm for Automatic Product Reviews Classification in On-Line Shopping Mall

온라인 쇼핑몰의 상품평 자동분류를 위한 감성분석 알고리즘

  • 장재영 (한성대학교 컴퓨터공학과)
  • Published : 2009.11.30

Abstract

With the continuously increasing volume of e-commerce transactions, it is now popular to buy some products and to evaluate them on the World Wide Web. The product reviews are very useful to customers because they can make better decisions based on the indirect experiences obtainable through the reviews. Product Reviews are results expressing customer's sentiments and thus are divided into positive reviews and negative ones. However, as the number of reviews in on-line shopping increases, it is inefficient or sometimes impossible for users to read all the relevant review documents. In this paper, we present a sentiment analysis algorithm for automatically classifying subjective opinions of customer's reviews using opinion mining technology. The proposed algorithm is to focus on product reviews of on-line shopping, and provides summarized results from large product review data by determining whether they are positive or negative. Additionally, this paper introduces an automatic review analysis system implemented based on the proposed algorithm, and also present the experiment results for verifying the efficiency of the algorithm.

급속한 전자상거래의 발전으로 인하여 온라인상으로 상품을 구매하고 그에 대한 평가를 작성하는 것이 일반적인 구매 패턴이 되었다. 기존 구매자들의 상품평들은 다른 잠재적인 소비자들의 상품 구입을 이끌어내는데 큰 동기가 된다. 사용자가 작성한 상품평은 하나의 상품에 대해 실제 사용자의 좋고 나쁨에 대한 감정을 표현한 결과로, 개개인에 따라 긍정 또는 부정적인 의견으로 나눠진다. 상품평 중에서 소비자가 원하는 정보를 얻기 위해서는 이들을 일일이 수작업으로 확인해야하지만, 온라인 쇼핑몰에 상품평이 대용량으로 축적된 환경에서 이러한 작업은 비효율적일 수밖에 없다. 본 논문에서는 오피니언 마이닝 기술을 이용하여 제품 사용자의 주관적 의견을 자동으로 분류할 수 있는 감성분석 알고리즘을 제시한다. 본 논문에서 제시하는 알고리즘은 온라인 쇼핑몰에 등록된 개별 상품평을 대상으로 긍정 및 부정 의견으로 판단하여 요약된 결과를 제공하는 기능을 한다. 본 논문에서는 또한 제안된 알고리즘을 바탕으로 개발된 상품평 자동분석 시스템을 소개하고, 알고리즘의 효율성을 검증하기 위한 실험결과도 제시한다.

Keywords

References

  1. Liu, B., Hu, M., and Cheng, J., "Opinion observer:analyzing and comparing opinions on the Web," Proceedings of the 14th international conference on WWW, pp. 10-14, 2005.
  2. Narayanan, R., Liu, B., and Choudhary, A., "Sentiment Analysis of Conditional Sentences," Proceedings of Conference on Empirical Methods in Natural Language Processing (EMNLP-09), August 6-7, 2009, Singapore.
  3. Liu, B., "Sentiment Anlaysis and Subjectivity," Invited Chapter for the Handbook of Natural Language Processing, Second Edition, To appear in Oct/Nov, 2009.
  4. $Sca{\[,}di$, C., $Bierho{\circledR}$, K., Chang, E., Felker, M., Ng, H., and Jin, C., "Red Opal: Product-Feature Scoring from Reviews," Proceedings of the 8th ACM conference on Electronic commerce, 2007, pp. 11-15.
  5. Hu, M., and Liu, B., "Mining and summarizing customer reviews," Proceedings of the tenth ACM SIGKDD 04, 2004, pp. 22-25.
  6. Smrz, P., "Using WordNet for Opinion Mining," Proceedings of the Third International WordNet Conference (GWC 2006), pp. 333-335.
  7. Miao, Q., Li, Q., and Dai, R., "A sentiment mining and retrieval system," Expert Systems with Applications, Vol.36, 2009, pp. 7192-7198. https://doi.org/10.1016/j.eswa.2008.09.035
  8. Xiaowen Ding, and Bing Lui, "The Utility of Linguistic Rules in Opinion Mining," SIGIR 2007, pp. 811-812.
  9. Esuli, A., and Sebastiani, F., "Page-Ranking WordNet Synsets:An Application to Opinion Mining", 2007 Association for Computational Linguistics, 2007, pp. 424-431.
  10. Courses, E., and Surveys, T., "Using SentiWordNet for multilingual sentiment analysis," Data Engineering Workshop ICDEW 2008.
  11. Cover, T. M., and Thomas, J. A., "Elements of information theory", Wiley, New York, 1991, pp. 12-14.
  12. http://www.amazon.com.
  13. http://live.com.
  14. 양정연, 명재석, 이상구, "상품특징별 점수화를 이용한 상품리뷰요약 시스템의 설계 및 구현", 지식정보산업연합학회 창립기념 학술대회, 2008, pp.339-347.
  15. 명재석, 이동주, 이상구, "반자동으로 구축된 의미사전을 이용한 한국어 상품평 분석 시스템", 정보과학회논문지:소프트웨어 및 응용 제35권, 제6호, 2009.
  16. 강승식, 한국어 형태소 분석과 정보 검색, 홍릉과학출판사, 2003.