DOI QR코드

DOI QR Code

자연어처리와 기계학습을 통한 우울 감정 분석과 인식

Analysis and Recognition of Depressive Emotion through NLP and Machine Learning

  • 김규리 (이화여자대학교 컴퓨터공학과) ;
  • 문지현 (이화여자대학교 컴퓨터공학과) ;
  • 오유란 (이화여자대학교 컴퓨터공학과)
  • 투고 : 2020.01.30
  • 심사 : 2020.02.27
  • 발행 : 2020.05.31

초록

본 논문에서는 SNS에 게시된 글의 내용을 통해 사용자의 우울함을 검출하는 기계학습 기반 감성 분석 시스템을 제안한다. 게시한 글의 작성자가 기분을 파악하는 시스템을 구현하기 위해 먼저 감정 사전에서 우울한 감정의 단어와 그렇지 않은 감정과 관련된 단어를 목록화하였다. 그 후, SNS를 대표하는 서비스 중 하나인 트위터의 텍스트 자료에서 검색 키워드를 선정하고 크롤링을 시행하여 우울한 감정을 띤 문장 1297개와 그렇지 않은 문장 1032개로 이뤄진 학습 데이터셋을 구축하였다. 마지막으로 텍스트 기반 우울감 검출 목적에 가정 적합한 기계학습 모델을 찾기 위해 수집한 데이터셋을 바탕으로 순환신경망, 장단기메모리, 그리고 게이트 순환 유닛을 비교 평가하였고, 그 결과 GRU 모델이 다른 모델들보다 2~4%가량의 높은 92.2%의 정확도를 보임을 확인하였다. 이 연구 결과는 SNS상의 게시글을 토대로 사용자의 우울증을 예방하거나 치료를 유도하는 데 활용될 수 있을 것이다.

This paper proposes a machine learning-based emotion analysis system that detects a user's depression through their SNS posts. We first made a list of keywords related to depression in Korean, then used these to create a training data by crawling Twitter data - 1,297 positive and 1,032 negative tweets in total. Lastly, to identify the best machine learning model for text-based depression detection purposes, we compared RNN, LSTM, and GRU in terms of performance. Our experiment results verified that the GRU model had the accuracy of 92.2%, which is 2~4% higher than other models. We expect that the finding of this paper can be used to prevent depression by analyzing the users' SNS posts.

키워드

참고문헌

  1. Yoon Hyung Yang, "Relationships between depressive mood shown in Facebook status updates and comments, depressive symptoms and daily activities: using Ecological Mementary Assessment(EMA)", Graduate School, Kangwon National University, pp.1-10 , June 2018. http://dcollection.kangwon.ac.kr/public_resource/pdf/000000029790_20200515001120.pdf
  2. Moreno, M. A., Jelenchick, L. A., Egan, K. G., Cox, E., Young, H., Gannon, K. E., Becker, T, "Feeling bad on facebook: Depression disclosures by college students on a social networking site. Depression and Anxiet" ,Published in Depression and anxiety 2011 Psychology, Medicine, pp.447-455, June 2011.
  3. KimYun-suk, "Sentiment Classification of Korean Text Using Naive Bayesian Algorithms", Department of Computer Engineering Graduate School Chungbuk National University Cheongju in Korea, pp.2-13, February 2014. https://dcollection.chungbuk.ac.kr/public_resource/pdf/000000037574_20200515001741.pdf
  4. Sunju Sohn, Mi-Sook Park, Ji-Eun Park, Jin-Hun Sohn, "Korean Emotion Vocabulary: Extraction and Categorization of Feeling Words", Korean Society for Emotion and Sensibility,Vol. 15, No. 1, pp. 105-120, March 2012.
  5. Jeongyong Choi, "A Study on the Text-based Emotion Classification", Department of Data Science Graduate School, Inje University, pp.3-18, December 2016. http://inje.dcollection.net/public_resource/pdf/200000203337_20200515002517.pdf
  6. Soowook Lee, "Deep Structured Learning: Architectures and Applications", International Journal of Advanced Culture Technology (IJACT) Vol.6, No.4, pp.262-265, June 4, 2018. https://doi.org/10.17703//IJACT2018.6.4.262
  7. Jin-mo Im, Weol-Youg Kim, Woo-Jin Byoun, Seung-Jung Shin, "Fruit price prediction study using artificial intelligence" ,The Journal of the Convergence on Culture Technology (JCCT) Vol.4, No.2, pp. 197-204, May 31, 2018. https://doi.org/10.17703/JCCT.2018.4.2.197
  8. Junyoung Chung, Caglar Gulcehre, KyungHyun Cho, Yoshua Bengio, "Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling", arXiv:1412.3555v1 [cs.NE] 11 Dec 2014.
  9. Hyun Ju Kwon, "Depression, AI that senses or diagnoses in life.", Artificial Inteligence Times, [Last modified: 02-Sep-2018], [Accessed: 28-Mar-2020], http://www.aitimes.kr/news/articleView.html?idxno=12301
  10. Ji Hyung Jung, "Facebook's Anti-suicide AI Prog ram Enlarges.", SE Daily, [Last modified: 28-Nov-2017], [Accessed: 28-Mar-2020], https://www.sedaily.com/NewsVIew/1ONR614AL0