DOI QR코드

DOI QR Code

Sentiment Analysis Model with Semantic Topic Classification of Reviews

리뷰의 의미적 토픽 분류를 적용한 감성 분석 모델

  • 임명진 (조선대학교 컴퓨터공학과 대학원) ;
  • 김판구 (조선대학교 컴퓨터공학과) ;
  • 신주현 (조선대학교 신산업융합학부)
  • Received : 2020.05.20
  • Accepted : 2020.06.01
  • Published : 2020.06.30

Abstract

Unlike the past, which was limited to terrestrial broadcasts, many dramas are currently being broadcast on cable channels and the Internet web. After watching the drama, viewers actively express their opinions through reviews and studies related to the analysis of these reviews are actively being conducted. Due to the nature of the drama, the genre is not clear, and due to the various age groups of viewers, reviews and ratings from other viewers help to decide which drama to watch. However, since it is difficult for viewers to check and analyze many reviews individually, a data analysis technique is required to automatically analyze them. Accordingly, this paper classifies the topics of reviews that have an important influence on drama selection and reclassifies them into semantic topics according to the similarity of words. In addition, we propose a model that classifies reviews into sentences according to semantic topics and sentiment analysis through sentiment words.

지상파에 한정되어 방영되었던 과거와는 달리 현재는 케이블 채널과 인터넷 웹에서도 수많은 드라마가 방영되고 있다. 드라마를 보고난 후 시청자들은 리뷰를 통해 적극적으로 자신의 의견을 표현하고 이러한 리뷰의 분석에 관련된 연구들이 활발하게 진행되고 있다. 드라마의 특성상 장르가 뚜렷하지 않고 시청자의 다양한 연령층으로 인해 다른 시청자들의 리뷰와 평가는 어떤 드라마를 볼 것인지 결정하는데 도움이 된다. 하지만 많은 리뷰를 시청자가 일일이 확인하고 분석하는 것은 어렵기 때문에 자동으로 분석하기위한 데이터 분석 기법이 필요하다. 이에 본 논문에서는 드라마 선택에 중요한 영향을 미치는 리뷰의 토픽을 분류하고 단어의 의미 유사도에 따라 의미적 토픽으로 재분류한다. 그리고 리뷰를 의미적 토픽에 따른 문장으로 분류한 다음 감성단어를 통해 감성을 분석하는 모델을 제안한다.

Keywords

References

  1. Shuai Li, Fei Hao, Hee-Cheol Kim, "Online Social Media Review Mining for Living Items with Probabilistic Approach: A Case Study," 스마트 미디어저널, 제2권, 제2호, 20-27쪽, 2013년 6월
  2. 박승수, "온라인 리뷰와 머신러닝을 활용한 드라마 시청률 예측 모델 연구", 연세대학교 정보대학원 석사학위 논문, 2017. 2
  3. 홍택은, 김정인, 신주현, "인스타그램 이미지와 텍스트 분석을 통한 사용자 감정 분류," 스마트미디어저널, 제5권, 제1호, 61-68쪽, 2016년 3월
  4. 신수정, "글에서 감정을 읽다 감성 분석의 이해," IDG Tech Report, 1-11쪽, 2014
  5. 김혜원, "영화흥행과 온라인 구전 특성의 관련성에 관한 연구," 한국엔터테인먼트산업학회논문지, 제4권, 제2호, 1-14쪽, 2010년 6월
  6. 장재영, "온라인 쇼핑몰의 상품평 자동분류를 위한 감성분석 알고리즘," 한국전자거래학회지, 제14권, 제4호, 19-33쪽, 2009년 11월
  7. D.M. Blei, A.Y. Ng, and M.I. Jordan, "Latent Dirichlet Allocation," Journal of Machine Learning Research, vol. 3, pp. 993-1022, 2003.
  8. 박창용, 이재동, 박진희, 이지형, "TV 프로그램 줄거리를 이용한 LDA 클러스터링 기반의 콘텐츠추천 기법," 한국HCI학회 학술대회, 618-621쪽, 2013년 1월
  9. T. Mikolov, K. Chen, G. Corrado and J. Dean, "Efficient Estimation of Word Representations in Vector Space," arXiv preprint, arXiv:1301.3781, 2013.
  10. T. Mikolov, I. Sutskever, K. Chen, G. Corrado and J. Dean, "Distributed Representations of Words and Phrases and their Compositionality," Proc. of International conference on neural information processing systems, pp. 3111-3119, 2013.
  11. 김선미, 나인섭, 신주현, "단어 연관성 가중치를 적용한 연관 문서 추천 방법," 멀티미디어학회논문지, 제22권, 제2호, 250-259쪽, 2019년 2월
  12. 남민지, "SNS 해시태그를 이용한 사용자 감정 분류 방법에 관한 연구", 조선대학교 산업기술융합대학원 석사학위 논문, 2015. 2
  13. 이상훈, 최정, 김종우, "영역별 맞춤형 감성사전 구축을 통한 영화리뷰 감성분석," 지능정보연구, 제22권, 제2호, 97-113쪽, 2016년 6월 https://doi.org/10.13088/jiis.2016.22.2.097
  14. 송종석, 이수원, "상품평 극성 분류를 위한 특징별 서술어 긍정/부정 사전 자동 구축," 정보과학회논문지:소프트웨어 및 응용, 제38권, 제3호, 157-168쪽, 2011년 3월
  15. 오성호, 강신재, "사용자 영화평의 감정어휘 분석을 통한 영화검색시스템," 한국산학기술학회 논문지, 제14권, 제3호, 1422-1427쪽, 2013년 3월
  16. 시청소감 : 뷰티인사이드 : 프로그램 : JTBC(2018), http://tv.jtbc.joins.com/board/pr10010943/pm10049817 (accessed Mar., 15, 2020).
  17. TV 뷰티 인사이드 :: 네이버 TV 연예(2018), https://entertain.naver.com/tvBrand/6482355 (accessed Mar,. 10, 2020).
  18. 니우한잉. "LDA를 이용한 온라인 리뷰의 다중 토픽별 감성분석", 부산대학교 대학원 석사학위 논문, 2018. 2
  19. Topic Modeling Using R(2019), https://entertain.naver.com/tvBrand/6482355 (accessed Mar., 4, 2020).
  20. 임명진, 신주현, "리뷰 속성 분류를 통한 감성 판별 방법," 한국스마트미디어학회 학술대회, 제8권, 제1호, 22-24쪽, 2019년 4월
  21. 홍택은, 신주현, "이미지와 텍스트 정보의 카테고리 분류에 의한 SNS 팔로잉 추천 방법," 스마트미디어저널, 제5권, 제3호, 54-61쪽, 2016년 9월
  22. cosine similarity(2020), https://en.wikipedia.org/wiki/Cosine_similarity (accessed Mar., 17, 2020).
  23. KNU 한국어 감성사전(2020), http://dilab.kunsan.ac.kr/knusl.html (accessed Mar., 20, 2020).
  24. 한두진. "드라마 리뷰 속성별 감성분류 방법", 조선대학교 산업기술융합대학원 석사학위 논문, 2019. 2
  25. 곽창욱, 김선중, 박성배, 김권양, "무한 사전 온라인 LDA 토픽 모델에서 의미적 연관성을 사용한 토픽 확장," 정보과학회 컴퓨팅의 실제 논문지, 제22권, 제9호, 461-466쪽, 2016년 9월 https://doi.org/10.5626/KTCP.2016.22.9.461