Improvement of A Concept-Based Text Categorization System(TAXON) Using Weight Determination Heuristic

가중치 부여 휴리스틱을 이용한 개념 기반 문서분류기 TAXON의 개선

  • 강원석 (안동대학교 컴퓨터공학교육과) ;
  • 강현규 (한국전자통신연구원) ;
  • 김영섬 (한국전자통신연구원)
  • Published : 1998.10.01

Abstract

본 논문에서는 개념을 기반으로 문서의 분류를 하는 확률벡터 모델의 분류기TAXON(Concept-based Text Categorization System)의 개선을 도모한다. TAXON은 한국어 문장을 분석하여 명사를 추출하고 명사의 개념을 시소러스 도구를 통해 획득한 후 이를 벡터화하여 주제와 입력 문서와의 관계성을 검사하는 문서 분류기이다. 본 논문은 문서 분류기 TAXON의 성능을 향상시키기 위하여 확률벡터 계산에 가중치 부여 휴리스틱을 도입한다. 그리고 시소러스 도구를 확장하여 문서 분류의 질을 높인다.

Keywords