Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)
- 2000.04a
- /
- Pages.230-233
- /
- 2000
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
A Method of Descriptor Extraction for Automatic Document Clustering
자동 문서 클러스터링을 위한 디스크립터 추출 방안
- Yun, Bo-Hyun (Dept. of Language Engineering, ETRI) ;
- Kang, Hyun-Kyu (Dept. of Language Engineering, ETRI) ;
- Ko, Hyung-Dae (Dept. of Information Engineering, Mokpo National University)
- Published : 2000.04.14
Abstract
기존의 검색엔진은 검색결과를 적합도 순서로 나열하여 사용자가 원하는 문서를 찾는데 어려움이 있다. 이러한 문제의 해결책으로 검색결과 문서에 대해 자동 클러스터링을 수행하여 문서 내용이 유사한 문서가 하나의 클러스터내에 존재하도록 한다. 본 논문에서는 검색 결과 문서의 클러스터링에서 필요한 디스크립터 추출 방안을 제안한다. 각 클러스터 내에서 디스크립터를 추출하기 위해 정보검색의 색인과정에서 사용하는 용어 가중치 계산 방법을 이용한다.
Keywords