DOI QR코드

DOI QR Code

Extracting and Visualizing Dispute comments and Relations on Internet Forum Site

인터넷 토론 사이트의 논쟁댓글 및 논쟁관계 시각화

  • 이윤정 (부산대학교 U-Port 정보기술사업단) ;
  • 정인준 (부산대학교 컴퓨터공학과) ;
  • 우균 (부산대학교 컴퓨터공학과)
  • Received : 2011.12.13
  • Accepted : 2012.01.19
  • Published : 2012.02.28

Abstract

Recently, many users discuss and argue with others using replying comments. This implies that a series of comments can be a new source of information since various opinions can be appeared in the dispute. It is important to understand the implicit dispute structure immanent in the comment set. In this paper, we examine the characteristics of disputes using replying comments in the Internet forum sites using a set of test articles with the comments collected from SketicalLeft and Agora, which are famous Internet forum sites in Korea. And we propose a new method for detecting and visualizing the dispute sections and relations from a large set of replying comments. To show the performance of our method, we measured precision, recall, and F-measure. According to the experimental results, the F-measures of the detection of the comments in dispute are about 0.84 (SketpcialLeft) and 0.83 (Agora); those of the detection of the commenter pairs in dispute are 0.75 (SketpcialLeft) and 0.82 (Agora), respectively. Since our method exploits the temporal order of commenters to detect the disputes, it is not dependent on the host language nor on the typos in comments. Also, our method can help the readers to grasp the structure of controversy hidden in the comment set through the visualized view.

최근에는 인터넷 토론 사이트에서 댓글을 이용해 다른 사람들과 토론이나 논쟁하는 경우를 흔히 볼 수 있다. 논쟁을 통해 게시물의 내용과는 다른 새로운 의견이 나타날 수도 있으므로 논쟁댓글을 파악하고 식별하는 것은 중요한 문제라고 할 수 있다. 본 논문에서는 국내의 인터넷 토론 사이트인 SkepticalLeft와 아고라에서 수집한 댓글을 통해 인터넷 토론 게시판에서 논쟁댓글의 특성을 분석하였다. 그리고 이를 바탕으로 댓글 목록의 논쟁구간과 논쟁관계를 검출하고 이를 시각화하는 방법을 제안한다. 제안 방법의 성능을 보이기 위해 논쟁댓글과 논쟁 쌍을 검출하고 정확도와 재현율 그리고 F-measure를 측정하였다. 논쟁댓글검출 성능은 F-measure가 0.84(SkepticalLeft)와 0.83(아고라)으로 측정되었고, 논쟁 쌍 검출은 각각 0.75(SketpcialLeft)와 0.82(아고라)로 측정되었다. 제안 방법은 댓글 작성자의 순서관계만을 이용하므로 사용언어나 철자법에 제약받지 않는다. 또한 시각화된 뷰를 통해 게시판 이용자들이 댓글에 내포된 논쟁구조를 파악하는데 도움을 줄 것이다.

Keywords

References

  1. C. Marlow, "Audience, structure and authority in the weblog community," In The 54th Annual Conference of the International Communication Association, 2004.
  2. 심재민, 조찬형, 양효진, 안인회, 나은아, 웹 2.0 시대의 네티즌 인터넷 이용 현황, 한국인터넷진흥원, 2006.
  3. http://forums.canadiancontent.net/
  4. http://politics.conforums.com/
  5. G. Mishne and N. Glance, "Leave a reply: An analysis of weblog comments," In Third annual workshop on the Weblogging ecosystem. Citeseer, 2006.
  6. Y. Lee., M. Bae, G. Woo, and H. Cho, "A Personalized Visualizing and Filtering system for a Large Set of Responding Messages on Internet Discussion Forums," In Proc. of the CIT09, Vol.2, pp.160-165, 2009.
  7. 이윤정, 지정훈, 우균, 조환규, "인터넷 게시물의 댓글 분석 및 시각화", 한국콘텐츠학회논문지, 제 9권, 제7호, pp.45-56, 2009. https://doi.org/10.5392/JKCA.2009.9.7.045
  8. 이윤정, 김은경, 조환규, 우균, "스킵리스트를 이용한 인터넷 토론 게시판 댓글 관리", 한국콘텐츠학회논문지, 제10권, 제8호, pp.38-50, 2010. https://doi.org/10.5392/JKCA.2010.10.8.038
  9. M. Hu, A. Sun, and E. Lim, "Comments-oriented blog summarization by sentence extraction," Proceedings of the sixteenth ACM conference on Conference on information and knowledge management, pp.901-904, 2007.
  10. L. Zhou and E. Hovy, "On the summarization of dynamically introduced information: Online discussions and blogs," Proceedings of AAAI-2006 Spring Symposium on Computational Approaches to Analyzing Weblogs, Standford, 2006.
  11. T. Kamada and S. Kawai, "An algorithm for drawing general undirected graphs," Information processing letters, Vol.31, No.1, pp.7-15, 1989. https://doi.org/10.1016/0020-0190(89)90102-6
  12. http://skepticalleft.com
  13. http://agora.media.daum.net