DOI QR코드

DOI QR Code

Real-time Spatial Recommendation System based on Sentiment Analysis of Twitter

트위터의 감정 분석을 통한 실시간 장소 추천 시스템

  • Oh, Pyeonghwa (Department of Computer Science and Engineering, The Catholic University of Korea) ;
  • Hwang, Byung-Yeon (Department of Computer Science and Engineering, The Catholic University of Korea)
  • Received : 2016.03.28
  • Accepted : 2016.08.10
  • Published : 2016.08.31

Abstract

This paper proposes a system recommending spatial information what user wants with collecting and analyzing tweets around the user's location by using the GPS information acquired in mobile. This system has built an emotion dictionary and then derive the recommendation score of morphological analyzed tweets to provide not just simple information but recommendation through the emotion analysis information. The system also calculates distance between the recommended tweets and user's latitude-longitude coordinates and the results showed the close order. This paper evaluates the result of the emotion analysis in a total of 10 areas with two keyword 'Restaurants' and 'Performance.' In the result, the number of tweets containing the words positive or negative are 122 of the total 210. In addition, 65 tweets classified as positive or negative by analyzing emotions after a morphological analysis and only 46 tweets contained the meaning of the positive or negative actually. This result shows the system detected tweets containing the emotional element with recall of 38% and performed emotion analysis with precision of 71%.

본 논문에서는 모바일에서 획득한 GPS(Global Positioning System)를 활용하여 사용자의 위치 주변에서 발생한 SNS 데이터를 수집하고 분석을 통해 사용자가 원하는 장소를 추천하는 시스템을 제안한다. 이를 위해 트위터에서 위치정보를 포함하는 게시글을 표본 집합으로 정하고 모바일의 위치정보와 함께 활용했을 때, 사용자의 검색의도에 부합하는 양질의 정보를 제공할 수 있음을 실험을 통해 증명하였다. 이를 위해 2015년 11월부터 12월까지 수집한 트윗(Tweet)을 대상으로 임의의 위치정보와 검색어로 구성된 질의를 구성하고 형태소 분석을 거쳐 분석에 적합한 형태의 데이터로 변환하였다. 또한 장소 추천을 위해 감정사전을 구축하여 긍정 및 부정을 의미하는 극성 키워드들을 정의하고 레이블을 구성한 후, 감정사전과 극성키워드를 이용해 개별 트윗의 추천 점수를 도출하였다. 논문은 추천 점수와 사용자의 현재 위치, 트윗이 작성된 위치와 사용자 위치 사이의 거리 계산을 통해 가까운 거리 순으로 10개의 장소 정보를 정렬하여 결과를 보인다. 또한 성능평가를 위해 감정 분석된 트윗에 대한 정밀도와 재현율을 도출하여 시스템의 성능을 확인한다. 실험은 '맛집', '공연' 2개의 키워드와 10개 지역을 기준으로 수행하였다. 실험 결과 키워드 1개당 수집된 트윗은 평균 10.5개였으며, 총 10번의 실험에 사용된 평균 210개의 트윗 중 긍정 또는 부정의 단어를 포함한 트윗의 개수는 평균 122개였다. 또한 감정 분석을 통해 긍정 또는 부정으로 분류된 트윗은 평균 65개였으며 그 중 실제로 긍정 또는 부정의 의미를 담은 트윗은 평균 46개였다. 이를 통해 시스템은 38%의 재현율로 감정요소를 담은 트윗을 탐지하고, 71%의 정밀도로 감정 분석을 수행했음을 확인했다.

Keywords

References

  1. Alexa, "Top Sites in South Korea," http://www.alexa.com/topsites/countries/KR, 2015.
  2. Google Play, "The popular App," https://pl ay.google.com/store/apps/top. 2015.
  3. Hu, B., Jamali, M., and Ester, M., "Spatio-Temporal Topic Modeling in Mobile Social Media for Location Recommendation," IEEE International Conference on Data Mining, pp. 1073-1078, 2013.
  4. KLDP.net, "Hanannum morpheme Analy ser 0.8.3 manual for user," http://kldp.net/projects/hannanum/forum/316173, 2011.
  5. KT economy management lab, "The first half 2015 mobile trend report," http://www.digieco.co.kr/KTData/Report/FILE/PDF/2015%EB%85%84%20%EC%83%81%EB%B0%98%EA%B8%B0%20%EB%AA%A8%EB%B0%94%EC%9D%BC%20%ED%8A%B8%EB%A0%8C%EB%93%9C201507091436405462845.pdf?, 2015.
  6. Lee, G. H. and Lee, K. J., "Twitter sentiment Analysis for the Recent Trend Extracted from the Newspaper Article," Korea Information Processing Society, Vol. 2, No. 10, pp. 731-738, 2013.
  7. Lee, J. Y., "Development of a spatial information extraction and representation systems utilizing social media as spatial big data," Master's thesis, The Graduate School University of Seoul, 2014.
  8. Lim, J.-S. and Kim, J. M., "An Empirical Comparison of Machine Learning Models for Classifying Emotions in Korean Twitter," Journal of Korea Multimedia Society, Vol. 17, No. 2, pp. 232-239, 2014. https://doi.org/10.9717/kmms.2014.17.2.232
  9. Oh, S. J., "A Model for Ranking Semantic Associations in a Social Network," The Journal of Society for e-Business Studies, Vol. 18, No. 3, pp. 93-105, 2013. https://doi.org/10.7838/jsebs.2013.18.3.093
  10. Park, I. J. and Min, K. H., "Making a List of Korean Emotion Terms and Exploring Dimensions Underlying Them," Korean Journal of Social and Personality Psychology, Vol. 19, No.1, pp. 109-129, 2005.
  11. Shin, J. H., Han. Y. S, Park, Y. C., and Choi, K. S., "An HMM Part-of-Speech Tagger for Korean Based on Wordphrase," Proceedings of the 6th Annual Conference on Human and Cognitive Language Technology, pp. 389-394, 1994.
  12. Twitter4j standard library, http://twitter4j.org, 2015.
  13. Wikipedia, "List of countries by Internet connection speeds," https://en.wikipedia.org/wiki/List_of_countries_by_Internet_connection_speeds, 2015.
  14. Yoo, J. H., "A Study on Place Search Behaviors of Mobile Users : Focusing on analysis of place search log of mobile users," Master's thesis, The Graduate School Seoul National University, 2014.

Cited by

  1. Social Emotional Opinion Decision with Newly Coined Words and Emoticon Polarity of Social Networks Services vol.11, pp.8, 2016, https://doi.org/10.3390/fi11080165
  2. A Study on the Emotion Analysis of Instagram Using Images and Hashtags vol.17, pp.9, 2019, https://doi.org/10.14801/jkiit.2019.17.9.123
  3. 웹 검색 기반으로 한 제주 오름의 콘셉트 분류 시스템 vol.19, pp.8, 2016, https://doi.org/10.14400/jdc.2021.19.8.235
  4. 웹 검색 기반으로 한 제주 오름의 콘셉트 분류 시스템 vol.19, pp.8, 2016, https://doi.org/10.14400/jdc.2021.19.8.235