Analysis of Social Network According to The Distance of Characters Statements

소설 등장인물의 텍스트 거리를 이용한 사회 구성망 분석

  • 박경미 (부산대학교 U-Port 정보기술산학공동 사업부) ;
  • 김성환 (부산대학교 정보컴퓨터공학부) ;
  • 조환규 (부산대학교 정보컴퓨터공학부)
  • Received : 2013.02.12
  • Accepted : 2013.03.27
  • Published : 2013.04.28


With the fast development of complex science, lots of social networks are studied. We know that the social network is widely applied in analyzing issues in human culture, economics and web sciences. Recently we witness that some researchers began to compare the social network constructed from fiction literatures(literature social network) and the real social network obtained from practice. But we point that previous approaches for literature social network have some drawbacks since they completely depend on the biographical dictionary constructed for a designated literature. So since the previous approach focus on the few important characters and peoples around them, we can not understand the global structure of all characters appeared in the literature at least once. We propose one method to extract all characters appeared in the literature and how to make the social network from that information. Also we newly propose K-critical network by applying frequency of the named characters and the strength of relationship among all textual characters. Our experiment shows that the K-critical measure could be one crucial quantitative measure to compute the relationship strength among characters appeared in the object literature.

복잡계 과학의 발달에 따라 많은 사회 네트워크들이 분석되고 있다. 사회 네트워크는 현재 인문, 경제, 웹 사이언스 등 다양한 분야에 응용되고 있다. 최근, 소설의 등장인물을 이용한 네트워크와 실제 사회 네트워크의 특성을 비교하는 다양한 연구가 진행되고 있다. 그러나 기존의 등장인물 네트워크는 대부분 미리 정리된 인명사전을 이용하므로 주요한 몇몇 인물들 사이의 연관성은 밝힐 수 있으나, 한번 이상 등장한 모든 인물의 전체적인 사회적 구조는 설명하지 못하고 있다. 본 연구에서는 소설로부터 등장인물을 직접 추출하고, 등장인물 사이의 거리를 사용하여 상관관계를 설정하여 네트워크를 구축한다. 제안방법은 소설 텍스트로부터 등장인물의 출현빈도와 등장인물들 사이의 연관성의 발생 빈도를 이용하여 연관성 가중치를 구할 수 있으며, 이 연관성 가중치를 사용하여 노드의 수를 조절하여 K-critical 네트워크를 구성한다. 제시한 K-critical 네트워크는 분석대상 소설에 등장하는 인물들끼리 얼마나 긴밀하게 연관되어 있는지를 정량적으로 파악하는 매우 중요한 정보를 줄 수 있음을 실험을 통하여 제시할 수 있었다.



  1. R. Solomonoff and A. Rapoport, "Connectivity of random nets," Bull. Math. Biophys, Vol.13, No.1, pp.107-117, 1951.
  2. P. Erdos and A. Renyi, "On random graphs," Publicat. Math., Vol.6, No.2 pp.290-297, 1959.
  3. Y. Y. Liu, J. J. Slotine, and A. L. Barabasi, "Controllability of complex network," Nature, Vol.473, No.7346, pp.167-173, 2011.
  4. Linton Freeman, "The Deveolpment of Social Network Analysis," Empirical Press, 2006.
  5. D. K. Elson, N. Dames, and K. R. McKeown "Extracting Social Networks from Literary Fiction," Proc. ACL, pp.138-147, 2010.
  6. P. Matthews and L. Barrett, "Small-screen social groups: soap operas and social networks," J. Cul. Evol. Psychol, Vol.3, No.1, pp75-86, 2005.
  7. 김윤경, 신현일, 구자을, 김학용, "소설 삼국지 등장인물 네트워크의 동적 변화 분석," 한국콘텐츠학회논문지, 제9권, 제4호, pp.364-371, 2009.
  8. 김학용, "대하소설 토지 등장인물 네트워크의 동적 변화 분석", 한국콘텐츠학회논문지, 제12권, 제 11호, pp.519-526, 2012.
  9. D. N. Stiller and R. Dunbar, "The small world of Shakespeare's play", Proc. Nat'l. Acad. Sci, Vol.14, No.4, pp.397-408, 2003.
  10. 최연무, "복잡계 네트워크로서의 그리스 신화", 물리, 제49권, 제3호, pp.298-302, 2004.
  11. 김상락, "문학 작품에서의 복잡계 연결망 분석: 소설 토지를 중심으로", 물리, 제50권, 제4호, pp.267-271, 2004.
  12. J. Fukumoto, F. Masui, M. Shimohata, and M. Sasaki, "Oki Electric Industry: Description of the Oki System as Used for MET-2," MUC-7, Columbia, MD, 1998.
  13. K. Fukuda, T. Tsunoda, A. Tamura, and T. Takagi, "Toward Information Extraction: Identifying protein names from biological papers," PSB'98, 1998.
  14. 노태길, 이상조, "규칙 기반의 기계학습을 통한 고유 명사의 추출과 분류", 한국정보과학회 논문집, 제27권, 제2호, pp.170-172, 2000.
  15. K. Uchimoto, O. Ma, M. Murata, H. Ozaku, and H. Isahara, "Named entity extraction based on a maximum entropy model and transformation rules," Proc. ACL pp.152-160, 1998.
  16. G. D. Zhouand and J. Su, "Named Entity Recognition using an HMM-based Chunk Tagger," Proc. ACL, pp.473-480-201, 2002.
  17. M. Collins and Y. Singer, "Unsupervised Models for Named Entity Classification," EMNLP/VLC-99, 1999.
  18. M. Sassano and T. Utsuro, "Named Entity Chunking Techniques in Supervised Learning for Japanese Named Entity Recognition," Proc. ACL, pp.705-711, 2000.
  19. H. Isozaki, "Japanese named entity recognition based on a simple rule generator and decision tree learning," ACL, pp.314-321, 2001.
  20. 이경희, 이주호, 최명석, 김길창, "한국어 문서에서 개체명 인식에 관한 연구", 제12회 한글 및 한국어 정보처리 학술대회 발표 논문집, pp.292-299, 2000.
  21. 양장모, 김민정, 권혁철, "언어정보를 이용한 한국어미등록어 추정", 한국정보과학회, pp.957-960, 1996.
  22. A. A. j. Ahmed Hassan and D. Radev. "Extracting Signed Social Networks From Text," Proc. ACL, pp.4-12, 2012.
  23. 정진수, 김학용, "고구려, 백제, 신라 왕조실록 인명 네크워크 분석", 한국콘텐츠학회논문지, 제11권, 제5호, pp.474-480, 2011.