A Method of Descriptor Extraction for Automatic Document Clustering

자동 문서 클러스터링을 위한 디스크립터 추출 방안

  • 윤보현 (한국전자통신연구원 언어공학연구부) ;
  • 강현규 (한국전자통신연구원 언어공학연구부) ;
  • 고형대 (목포대학교 정보공학부)
  • Published : 2000.04.14

Abstract

기존의 검색엔진은 검색결과를 적합도 순서로 나열하여 사용자가 원하는 문서를 찾는데 어려움이 있다. 이러한 문제의 해결책으로 검색결과 문서에 대해 자동 클러스터링을 수행하여 문서 내용이 유사한 문서가 하나의 클러스터내에 존재하도록 한다. 본 논문에서는 검색 결과 문서의 클러스터링에서 필요한 디스크립터 추출 방안을 제안한다. 각 클러스터 내에서 디스크립터를 추출하기 위해 정보검색의 색인과정에서 사용하는 용어 가중치 계산 방법을 이용한다.

Keywords