DOI QR코드

DOI QR Code

Emotion Classification System for Chatting Data

채팅 데이터의 기분 분류 시스템

  • 윤영미 (가천의과대학교 정보공학부) ;
  • 이영호 (가천의과대학교 정보공학부)
  • Published : 2009.05.31

Abstract

It's a trend that the proportion of using an internet messenger among on-line communication methods is getting increased. However, there are not many applications which efficiently utilize these messenger communication data. Messenger communication data have specific characteristics that reflect the user's linguistic habits. The linguistic habits are revealed through frequently used words and emoticons, and user's emotions can be grasped by these. This paper proposes the method that efficiently classifies the emotions of a messenger user using frequently used words or symbols. The emotion classifier from repeated experiments achieves high accuracy of more than 95%.

온라인 커뮤니케이션 중 인터넷 메신저를 이용한 대화의 비중이 점점 증가하는 추세이나, 이러한 메신저 대화정보를 효율적으로 재사용할 수 있는 어플리케이션은 많지 않다. 메신저 대화 정보는 사용자의 언어 습관이 반영된다는 특성을 가진다. 이러한 언어 습관은 자주 쓰이는 단어나 이모티콘으로 나타나며, 이들로써 사용자의 기분을 잘 파악할 수 있다는 특성이 있다. 그러므로 본 연구에서는 자주 쓰이는 단어들이나, 기호 등을 이용해서 효과적으로 대화 내용 작성자의 기분 등을 분류할 수 있는 기법을 제안한다. 이러한 기법은 충분한 반복 실험을 통해서 95% 이상의 높은 정확성으로 기분을 분류할 수 있음을 보여주고 있다.

Keywords

References

  1. L. Holzman and W. Pottenger, "Classification of emotions in internet chat: An application of machine learning using speech phonemes," Technical Report LU-CSE-03-002, Lehigh University, 2003.
  2. A. Z. Abbasi and Z. A. Shaikh, "An Approach Towards Emotion Estimation During Chat Sessions Using Software Agents," 4th International Conference on Innovations in Information Technology, pp. 511-515, 2007.
  3. G. Mishne, "Experiments with Mood Classification in Blog Posts," In Workshop on Stylistic Analysis of Text for Information Access, 2005.
  4. Y. Jung, H. Park and S. H. Myaeng, "A Hybrid Mood Classification Approach for Blog Text," In Lecture Notes in Computer Science, Vol. 4099, pp. 1099-1103, 2006.
  5. D. B. Bracewell, J. Minato, F. Ren and S. Kuroiwa, "Determining the Emotion of News Articles," In Proceedings of the 2006 International Conference on Intelligent Computing (ICIC 2006), pp.918-923, 2006.
  6. C. Strapparava and R. Mihalcea, "Learning to Identify Emotions in Text," Proceedings of the 2008 ACM symposium on Applied computing, March 16-20. 2008, Fortaleza, Ceara, Brazil.
  7. 김묘실, 강승식, "SVM"을 이용한 악성 댓글 판별 시스템의 설계 및 구현," 제18회 한글 및 한국어 정보처리 학술대회, 285-289쪽, 2006년 10월.
  8. 강승식, "한국어 형태소 분석과 정보 검색", 홍릉과학출판사, 2002년, http://nlp.kookmin.ac.kr/.
  9. 여상화, "한영 모바일 번역기를 위한 강건하고 경량화된 한국어 형태소 분석기," 한국컴퓨터정보학회, 제14권, 제2호, 191-199쪽, 2009년 2월.
  10. W. Frakes, "Stemming algorithms," In W. Frakes & R. Vaeza-Yates(Eds.), Information retrieval: Data structures and algorithms, Englewood Cliffs, NJ: Prentice Hall, 1992.
  11. I. H. Witten and E. Frank, "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations," Morgan Kaufmann, San Francisco, CA. Available on WWW: www.cs.waikato.ac.nz/ml/weka.
  12. 김진용, 유재휘, "아바타 통신에서의 얼굴 표정의 생성방법," 한국컴퓨터정보학회, 제12권, 제5권, 55-64쪽 2007년 11월.
  13. B. Pang, L. Lee and S. Vaithyanathan, "Thumbs up? Sentiment Classification USing Machine Learning Techniques," EMNLP, pp. 79-86, 2002.
  14. K. Dave, S. Lawrence, D. M. Pennock, "Mining the Peanut Callery: Opinion Extraction and Sematic Classification of Product Reviews," In Proceedings of WWW 2003, Budapest, Hungry, 2003.