머신 러닝을 활용한 회사 SNS 메시지에 내포된 심리적 거리 추출 연구

A Study on the Extraction of Psychological Distance Embedded in Company's SNS Messages Using Machine Learning

  • 이성원 (아주대학교 의과대학 의료정보학과) ;
  • 김진혁 (단국대학교 공과대학 컴퓨터과학과)
  • Seongwon Lee (Department of Biomedical Informatics, School of Medicine, Ajou University) ;
  • Jin Hyuk Kim (Department of Computer Science, College of Engineering, Dankook University)
  • 투고 : 2018.11.05
  • 심사 : 2018.12.26
  • 발행 : 2019.02.28


소셜 네트워크 서비스(이하 SNS)는 회사의 마케팅 채널로 적극 활용되고 있으며, 회사들의 고객층에 적합한 내용과 어조를 활용하여 주기적으로 SNS 메시지를 작성하는 등 활발한 마케팅을 펼치고 있다. 본 논문에서는 이제까지 간과되었던 SNS 메시지에 내포된 심리적 거리에 초점을 맞춰 전통적인 코더를 활용한 내용 분석(content analysis)과 자연어 처리 기법 및 머신 러닝 방법을 혼합하여 심리적 거리를 측정하는 분석 방법을 연구하였다. SNS 메시지의 심리적 거리 분석을 위해 코더들을 활용하여 내용분석을 수행하였으며, 이와 같은 방법으로 레이블링된 데이터를 자연어 처리 방법을 이용하여 워드 임베딩을 수행함으로써 머신 러닝 수행을 위한 입력 데이터를 마련하였다. 머신 러닝 분석법 중 Support Vector Machine(SVM)을 이용하여 SNS 메시지와 심리적 거리 간의 관계를 학습시켰으며, 마지막으로 테스트 데이터를 이용하여 심리적 거리를 예측함으로써 머신 러닝 분석의 성과를 검증하였다. 심리적 거리측정 방법론 수행 결과, 코더들의 내용분석 결과가 특정 값으로 편향되어 SVM 예측의 민감도와 정밀도가 낮은 결과가 도출되었다. 심리적 거리 응답 비율을 보정하고 코더들의 1차 내용분석 결과 중 답변이 일치한 데이터로 한정지어 머신 러닝을 실행한 결과 심리적 거리 예측의 정확도, 민감도, 특이도, 정밀도 모두 향상되어 심리적 거리가 70% 이상 예측되는 성과를 보였다. 본 연구는 SNS 메시지의 심리적 거리를 측정하는 방법을 제시함으로써 독자와의 심리적 거리를 제어 가능한 전략 요소로 활용 가능하게 할 것이라 기대된다.

The social network service (SNS) is one of the important marketing channels, so many companies actively exploit SNSs by posting SNS messages with appropriate content and style for their customers. In this paper, we focused on the psychological distances embedded in the SNS messages and developed a method to measure the psychological distance in SNS message by mixing a traditional content analysis, natural language processing (NLP), and machine learning. Through a traditional content analysis by human coding, the psychological distance was extracted from the SNS message, and these coding results were used for input data for NLP and machine learning. With NLP, word embedding was executed and Bag of Word was created. The Support Vector Machine, one of machine learning techniques was performed to train and test the psychological distance in SNS message. As a result, sensitivity and precision of SVM prediction were significantly low because of the extreme skewness of dataset. We improved the performance of SVM by balancing the ratio of data by upsampling technique and using data coded with the same value in first content analysis. All performance index was more than 70%, which showed that psychological distance can be measured well.



이 논문은 2016년 대한민국 교육부와 한국연구재단의 지원을 받아 수행된 연구임(NRF-2016S1A5A8020010).


  1. 강명수, "온라인 커뮤니티 형성과 유지에 관한 연구: 규범적 몰입과 감성적 몰입의 매개역할을 중심으로", 대한경영학회지, 제18권, 제1호, 2005, pp. 67-87.
  2. 김재휘, 김희연, 부수현, "소셜 미디어를 활용한 공공캠페인 커뮤니케이션 전략: 해석수준 이론에 따른 메시지 구성과 미디어에 대한 사회적 거리를 중심으로", 광고학연구, 제23권, 제1호, 2012, pp. 183-205.
  3. 김태환, 정우진, 이상용, "기업의 SNS 노출과 주식 수익률간의 관계 분석", Asia Pacific Journal of Information Systems, 제24권, 제2호, 2014, pp. 233-253.
  4. 박종필, 손재열, "B2C 마이크로블로깅을 통한 고객참여 메커니즘의 이해", Asia Pacific Journal of Information Systems, 제22권, 제4호, 2012, pp. 51-73.
  5. 배정환, 한남기, 송민, "토픽 모델링을 이용한 트위터 이슈 트래킹 시스템", Journal of Intelligence and Information Systems, 제20호, 제2권, 2014. pp. 109-122.
  6. 안대천, 김상훈, "SNS 유형별 광고속성 평가 및 태도에 관한 연구: 블로그, 트위터, 페이스북, 유튜브의 비교", 광고학연구, 제23권, 제3호, 2012, pp. 53-84.
  7. 이수범, 김남이, "페이스북 팬페이지의 메시지 및 크리에이티브 전략에 관한 연구", 소비자문제연구, 제42권, 2012, pp. 123-148.
  8. 이은선, 김미경, "마케팅 커뮤니케이션 수단으로서의 기업 페이스북 팬페이지 이용행태 분석", 광고학연구, 제23권, 제2호, 2012, pp. 31-55.
  9. 이태원, 홍태호, "Support Vector Machine을 이용한 온라인 리뷰의 용어기반 감성분류모형", Information Systems Review, 제17권, 제1호, 2015, pp. 49-64.
  10. 이희경, "공감수준과 친소관계가 따돌림에 대한 심리적 반응에 미치는 효과", 敎育心理硏究, 제15권, 제3호, 2001, pp. 281-297.
  11. 조태종, 윤혜정, 이중정, "기업의 홍보 마케팅용 트위터의 리트윗 현황 분석: 이용자 특성과 콘텐츠 속성을 중심으로", Information Systems Review, 제14권, 제1호, 2012, pp. 21-35.
  12. Adler, P. S. and S. W. Kwon, "Social capital: Prospects for a new concept", The Academy of Management Review, Vol.27, No.1, 2002, pp. 17-40.
  13. Al-garadi, M. A., K. D. Varathan, and S. D. Ravana, "Cybercrime detection in online communications: The experimental case of cyberbullying detection in the Twitter network", Computers in Human Behavior, Vol.63, 2016, pp. 433-443.
  14. Altman, I., The Environment and Social Behavior: Privacy, Personal Space, Territory, Crowding, Brooks/Cole Publishing Company, Monterey, California, 1975.
  15. Argyle, M. and J. Dean, "Eye-contact, distance and affiliation", Sociometry, Vol.28, No.3, 1965, pp. 289-304.
  16. Bar-Anan, Y. and N. Liberman, "The association between psychological distance and construal level: Evidence from an Implicit Association Test", Journal of Experimental Psychology: General, Vol.135, No.4, 2006, pp. 609-622.
  17. Barnes, N. G. and S. Pavao, "The 2017 Fortune 500 go visual and increase use of Instagram, Snapchat, and Youtube", 2018, Available at
  18. Bogardus, E. S., "A social distance scale", Sociology & Social Research, Vol.17, 1933, pp. 265-271.
  19. Burson-Marsteller, "Global Social Media Check-up", 2012, Available at
  20. Cho, S. W., M. S. Cha, S. Y. Kim, J. C. Son, and K. Sohn, "Investigating temporal and spatial trends of brand images using Twitter opinion mining", 2014 International Conference on Information Science & Applications (ICISA), 2014.
  21. Cortes, C. and V. Vapnik, "Support-vector networks", Machine learning, Vol. 20, 1995, pp. 273-297.
  22. Eliacik, A. B. and N. Erdogan, "User-weighted sentiment analysis for financial community on Twitter", 2015 11th International Conference on Innovations Information Technology(IIT), 2015, pp. 46-51.
  23. Goldberg, Y., Neural Network Methods for Natural Language Processing, Morgan & Claypool Publishers, 2017.
  24. Hall, E. T., The Hidden Dimension, Anchor Books, Doubleday & Company, inc., Garden City, NY., 1969.
  25. Hemalatha, I., G. P. S. Varma, and A. Govardhan, "Sentiment analysis tool using machine learning algorithms", International Journal of Emerging Trends & Technology in Computer Science, Vol.2, No.2, 2013, pp. 105-109.
  26. Hum, N. J., P. E. Chamberlin, B. L. Hambright, A. C. Portwood, A. C. Schat, and J. L. Bevan, "A picture is worth a thousand words: a content analysis of Facebook profile photographs", Computers in Human Behavior, Vol.27, 2011, pp. 1828-1833.
  27. Kaur, J. and J. R. Saini, "Emotion detection and sentiment analysis in text corpus: A differential study with informal and formal writing styles", International Journal of Computer Applications, Vol.101, No.9, 2014, pp. 1-9.
  28. Kim, B. K. and K. H. Kim, "The impact that social distance perceived by SNS affects communication", ADADA2011 Kitakyushu, 2011, pp. 201-202.
  29. Lee, H., Y. S. Choi, S. Lee, and I. P. Park, "Towards unobtrusive emotion recognition for affective social communication", The 9th Annual IEEE Consumer Communications and Networking Conference, 2012, pp. 260-264.
  30. Liviatan, I., Y. Trope, and N. Liberman, "Interpersonal similarity as a social distance dimension: Implications for perception of others' actions", Journal of Experimental Social Psychology, Vol.44, 2008, pp. 1256-1269.
  31. Marwick, A. E. and D. Boyd, "I tweet honestly, I tweet passionately: Twitter users, context collapse, and the imagined audience", New Media & Society, Vol.13, No.1, 2010, pp. 114-133.
  32. McCorkindale, T., "Can you see the writing on my wall? A content analysis of the Fortune 50's Facebook social networking sites", Public Relations Journal, Vol.4, No.3, 2010.
  33. Naaman, M., J. Boase, and C. Lai, "Is it really about me? Message content in social awareness streams", The Proceedings of CMC, 2010, pp. 189-192.
  34. Nahapiet, J. and S. Ghoshal, "Social capital, intellectual capital and the organizational advantage", Academy of Management Review, Vol.23, 1998, pp. 242-266.
  35. Rheingold, H., "Virtual communities", in Frances Hesselbein et al.(eds.), Academy The community of the future, New York: The Drucker Foundation, 1998, pp. 115-122.
  36. Shen, G. C. C., J. S. Chiou, C. H. Hsiao, C. H. Wang, and H. N. Li, "Effective marketing communication via social networking site: The moderating role of the social tie", Journal of Business Research, Vol.69, No.6, 2016, pp. 2265-2270.
  37. Stephan, E., N. Liberman, and Y. Trope, "Politeness and psychological distance: A construal level perspective", Journal of Personality and Social Psychology, Vol.98, No.2, 2010, pp. 268-280.
  38. Stephan, E., N. Liberman, and Y. Trope, "The effects of time perspective and level of construal on social distance", Journal of Experimental Social Psychology, Vol.47, 2011, pp. 397-402.
  39. Tripath, A., A. Agrawal, and S. K. Rath, "Classification of sentimental reviews using machine learning techniquest", Procedia Computer Science, Vol.57, 2015, pp. 821-829.
  40. Trope, Y., "Theory in social psychology: Seeing the forest and the trees", Personality and Social Psychology Review, Vol.8, No.2, 2004, pp. 193-200.
  41. Wang, X., C. Zhang, Y. Ji, L. Sun, L. Wu, and Z. Bao, "A depression detection model based on sentiment analysis in micro-blog social network", The Proceedings of Pacific-Asia Conference on Knowledge Discovery and Data Mining, 2013, pp. 201-213.
  42. Wellman, B. and S. D. Berkowitz, Social Structures: A Network Approach, Cambridge University Press, 1998.
  43. Zhang, J., Y. Sung, and W. N. Lee, "To play or not to play: An exploratory content analysis of branded entertainment in Facebook", American Journal of Business, Vol.25, No.1, 2010, pp. 53-64.