DOI QR코드

DOI QR Code

User Characterization from Replying Comment Structures in Online Discussion

온라인 토론의 댓글 응답 구조를 이용한 사용자 특성 분석

  • 김성환 (부산대학교 전기전자컴퓨터공학과) ;
  • 탁해성 (부산대학교 전기전자컴퓨터공학과) ;
  • 조환규 (부산대학교 전기전자컴퓨터공학과)
  • Received : 2018.09.18
  • Accepted : 2018.10.24
  • Published : 2018.11.28

Abstract

In online communities, users use comments to exchange their opinions and feelings on various subjects. Communication based on comments is quick and convenient, but sometimes this light-weight characteristic makes users use impolite and aggressive words, which leads to an online conflict. Therefore, it is important to analyze and classify users according to their characteristics in order to predict and take action for this kind of troubles. In this paper, we present several quantitative measures for describing the structures of comments trees based on the assumption that the user characteristics be observed as a form of some structural feature in comment trees of articles in which they posted comments. We examine the distribution of the proposed measures over article posters and commenters, and in addition, we show the effectiveness of the presented structural features by conducting experiments to classify users who have received warnings of the administrator from benign users.

온라인 커뮤니티에서는 사용자들이 댓글을 이용하여 다양한 주제에 대한 의견과 감정을 교환한다. 댓글을 통한 의사소통은 신속하고 편리하지만 때로는 이러한 무게감이 덜한 특성이 사용자로 하여금 무례하고 공격적인 언사를 쉽게 행하도록 만들어 분쟁을 쉽게 유발하기도 한다. 따라서 이러한 분쟁을 미리 예측하고 대응하기 위하여 사용자들의 특성을 미리 파악하고 분류하는 작업이 중요하다. 본 논문에서는 이러한 사용자의 특성이 해당 사용자들이 참여한 발제글을 나타내는 댓글트리의 구조적인 특징에 나타난다는 가정을 바탕으로 댓글트리 구조를 서술하기 위한 여러 가지 정량적인 지표를 제안한다. 제안하는 정량 지표들의 분포를 통하여 발제글 작성자 및 댓글 작성자에 따른 지표의 분포를 살펴보고, 추가적으로 관리자에 의하여 경고를 받은 사용자들을 분류하는 실험을 통하여 제안하는 구조적 지표의 효과성을 보인다.

Keywords

CCTHCV_2018_v18n11_135_f0001.png 이미지

그림 1. 발제글의 특성을 나타내는 댓글 트리의 예(a) 두 사용자가 토론을 벌이고 있는 경우 (b) 다수의 사용자가 공감을 표현하는 경우

CCTHCV_2018_v18n11_135_f0002.png 이미지

그림 2. 성차별과 관련된 발제글의 댓글 트리 예시 (댓글수=455, 사용자수=92, 최대깊이=14, 최대너비=Depth1댓글수=64, 빨간색 노드는 차단된 댓글)

CCTHCV_2018_v18n11_135_f0003.png 이미지

그림 3. 분석 데이터 특성. 발제글 별 댓글, 차단댓글, Depth-1 댓글, 최대 깊이를 내림차순으로 나타내었다.

CCTHCV_2018_v18n11_135_f0004.png 이미지

그림 4. 댓글 트리 구조적 지표의 예

CCTHCV_2018_v18n11_135_f0005.png 이미지

그림 5. 발제글 작성자 별 구조적 특성 지표 값의 분포

CCTHCV_2018_v18n11_135_f0006.png 이미지

그림 6. 댓글 작성자 별 구조적 특성 지표 값의 분포

CCTHCV_2018_v18n11_135_f0007.png 이미지

그림 7. 댓글 작성자 별 구조적 특성 지표 평균값의 분포

CCTHCV_2018_v18n11_135_f0008.png 이미지

그림 8. 사용자 분류 실험 결과

표 1. 발제글 작성자 분류를 위한 특징

CCTHCV_2018_v18n11_135_t0001.png 이미지

표 2. 댓글 작성자 분류를 위한 특징

CCTHCV_2018_v18n11_135_t0002.png 이미지

표3. θ에 따른 분류 대상 사용자 수

CCTHCV_2018_v18n11_135_t0003.png 이미지

표 4. 발제글 게시자 분류를 위한 특징 집합

CCTHCV_2018_v18n11_135_t0004.png 이미지

References

  1. S. Gonzalez-Bailon, A. Kaltenbrunner, and R. E. Banchs, “The Structure of Political Discussion Networks: A Model for the Analysis of Online Deliberation,” Journal of Information Technology, Vol. 25, No. 2, pp. 230-243, 2010. https://doi.org/10.1057/jit.2010.2
  2. J. Cheng, M. Bernstein, C. Danescu-Niculescu-Mizil, and J. Lekovec, "Anyone Can Become a Troll: Cause of Trolling Behavior in Online Discussions," in Proc. ACM CSCW, pp. 1217-1230, 2017.
  3. E. E. Buckels, P. D. Trapnell, and D. L. Paulhus, "Trolls Just Want to Have Fun," Personality and Individual Differences, Vol. 67, pp. 97-102, 2014. https://doi.org/10.1016/j.paid.2014.01.016
  4. A. J. Morales, J. Borondo, J. C. Losada, and R. M. Benito, "Measuring Political Polarization: Twitter Shows the Two Sides of Venezuela," Chaos, Vol. 25, No. 033114, 2015.
  5. P. Singer, F. Flock, C. Meinhart, E. Zeitfogel, and M. Strohmaier, "Evolution of Reddit: From the Front Page of the Internet to a Self-Referential Community," In Proc. WWW, pp. 517-522, 2014.
  6. V. Gomez, A. Kaltenbrunner, and V. Lopez, "Statistical Analysis of the Social Network and Discussion Threads in Slashdot," in Proc. WWW, pp. 645-654, 2008
  7. K. Allen, G. Carenini, and R. T. Ng, "Detecting Disagreement in Conversations using Pseudo-Monologic Rhetorical Structure," in Proc. EMNLP, pp. 1160-1180, 2014.
  8. M. Qui, Y. Sim, N. A. Smith, and J. Jiang, "Modeling User Arguments, Interactions, and Attributes for Stance Prediction in Online Debate Forum," In Proc. SDM, pp. 855-863, 2015.
  9. P. Biyani, S. Bhatia, C. Caragea, and P. Mitra, "Using Non-Lexical Features for Identifying Factual and Opinionative Threads in Online Forums," Knowledge-Based Systems, Vol. 69, pp. 170-178, 2014. https://doi.org/10.1016/j.knosys.2014.04.048
  10. J. Cheng, C. Danescu-Niculescu-Mizil, and J. Leskovec, "How Community Feedback Shapes User Behavior," In Proc. ICWSM, pp. 41-50, 2014.
  11. B. A. Coles and M. West, "Trolling the Trolls: Online Forum Users Constructions of the Nature and Properties of Trolling," Computers in Human Behavior, Vol. 60, pp. 233-244, 2016. https://doi.org/10.1016/j.chb.2016.02.070
  12. T. C. Li, J. Gharibshah, E. E. Papalexakis, and M. Faloutsos, "TrollSpot: Detecting Misbehavior in Commenting Platforms," in Proc. IEEE/ACM ASONAM, pp. 171-175, 2017.