Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)
- 1998.10c
- /
- Pages.153-155
- /
- 1998
- /
- 1598-5164(pISSN)
Improvement of A Concept-Based Text Categorization System(TAXON) Using Weight Determination Heuristic
가중치 부여 휴리스틱을 이용한 개념 기반 문서분류기 TAXON의 개선
Abstract
본 논문에서는 개념을 기반으로 문서의 분류를 하는 확률벡터 모델의 분류기TAXON(Concept-based Text Categorization System)의 개선을 도모한다. TAXON은 한국어 문장을 분석하여 명사를 추출하고 명사의 개념을 시소러스 도구를 통해 획득한 후 이를 벡터화하여 주제와 입력 문서와의 관계성을 검사하는 문서 분류기이다. 본 논문은 문서 분류기 TAXON의 성능을 향상시키기 위하여 확률벡터 계산에 가중치 부여 휴리스틱을 도입한다. 그리고 시소러스 도구를 확장하여 문서 분류의 질을 높인다.
Keywords