A preliminary Study on Text Categorization of Book using Table of Contents and Book Description

목차, 책 소개를 이용한 단행본 문서 범주화에 관한 기초연구

  • 도현호 (BK21플러스팀, 계명대학교 문헌정보학과) ;
  • 이용구 (계명대학교 문헌정보학과)
  • Published : 2014.08.21

Abstract

이 연구에서는 도서관의 주요 장서에 해당하는 단행본 도서에 대한 자동 분류를 적용가능한지 알아보고자 하였다. 분류자질로 메타데이터인 서명, 목차, 책 소개를 사용하였으며, 다양한 자질 가중치를 적용하여 581건의 단행본 도서를 통해 kNN 분류기의 분류성능을 파악하였다. 실험 결과 이들 메타데이터를 모두 사용하였을 때 가장 좋은 분류성능을 가져왔으며, 실험문헌집단의 규모가 작은 한계가 있지만 로그 TF를 취한 가중치 방법이 좋은 성능을 가져왔다.

Keywords