DOI QR코드

DOI QR Code

Book Genre Visualization based on Genre Identification Algorithm

장르 판별 알고리즘을 이용한 책 장르 시각화

  • 김효영 (중앙대학교 첨단영상대학원) ;
  • 박진완 (중앙대학교 첨단영상대학원)
  • Received : 2012.02.21
  • Accepted : 2012.04.26
  • Published : 2012.05.28

Abstract

Text visualization is one of sectors in data visualization. This study is on methods to visually represent text's contents, structure, and form aspects based on various analytic techniques about wide range of text data. In this study -as a text visualization study-, 1) a method to find out the characteristics of a book's genre using words in the text of the book was looked into, 2) elements of visualization of a book's genre based on verification through an experiment were drew, and 3) the ways to intuitionally and efficiently visualize this were explained. According to visualization suggested by this study, first, actual genre of a book can be understood based on words used in the book. Second, with which genre is closed to the book can be found out with one glance through images of visualization. Moreover, the characteristics of complicated genres included in a book can be understood. Furthermore, the level of closeness (similarity) of a genre -which is found to be a representative genre using the number of dots, curvature of a curve, and brightness in the image- can be assumed. Finally, the outcome of this study can be used for a variety of fields including book customizing service such as a book recommendation system that provides images of personal preference books or genres through application of books favored by individual customers.

텍스트 시각화는 데이터 시각화의 한 분야로, 방대한 텍스트 데이터에 대한 다양한 분석 기법을 바탕으로 텍스트의 내용적 측면은 물론 구조적, 형식적 측면을 시각적으로 재현(represent)해내는 방법에 관한 연구이다. 본 연구에서는 이러한 텍스트 시각화 연구의 일환으로, 서적이 갖는 장르적 특성을 서적 본문에 직접 사용된 단어들을 바탕으로 파악해낼 수 있는 방법에 대해 고찰하고, 실험을 통한 검증을 바탕으로 서적 장르 시각화의 요소를 도출한 후, 이를 직관적이고 효율적으로 시각화하는 방법에 대해 서술하였다. 본 연구에서 제안하는 시각화는 첫째, 책에 직접 사용된 단어를 토대로 책의 실질적 장르를 파악할 수 있으며, 둘째, 시각화 결과 이미지를 통해 해당 서적이 어떤 장르와 가장 가까운지 한 눈에 파악할 수 있을 뿐 아니라, 한 책이 갖는 복합 장르적 특성을 알 수 있도록 해주고, 이미지 내의 점(dot)의 개수와 곡선의 곡률, 밝기 등을 통해 대표 장르로 파악된 장르의 근접도(유사도)를 짐작할 수 있다는 점에서 그 의의를 갖는다. 나아가 개별 소비자 자신이 선호하는 서적들에 대한 적용을 통해 개인별 선호 서적(또는 장르) 이미지를 제공하는 등 서적 추천 시스템과 같은 북 커스터마이징(book customizing)과 같은 분야에도 다양하게 활용될 수 있다.

Keywords

References

  1. H. Kim and J. W. Park, "Textual Visualization based on Readability," Proceeding of ACM SIGGRAPH Asia 2011, 2011.
  2. 김효영, 박진완, "텍스트의 난이도 파악을 위한 가독성 정보의 시각화", 한국디지털디자인학회, Vol.12, No.2, 2012.
  3. T. Legan and L. Becker, "Visualizing the Text of Philip Pullman's Trilogy His Dark Materials," Proceeding of NordiCHI 2010, 2010.
  4. http://chrisharrison.net/index.php/Visualizations/BibleViz
  5. http://itsbeenreal.co.uk/index.php?/wwwords/about-this-project/
  6. http://textarc.org/
  7. www.amazon.com