A Hierarchical Clustering for Browsing Retrieval Results

검색결과의 브라우징을 위한 계층적 클러스터링

  • 윤보현 (지식정보연구부, 한국전자통신연구원) ;
  • 김현기 (지식정보연구부, 한국전자통신연구원) ;
  • 노대식 (지식정보연구부, 한국전자통신연구원) ;
  • 강현규 (지식정보연구부, 한국전자통신연구원)
  • Published : 2000.04.01

Abstract

대부분 웹 검색엔진들의 검색결과로 수십 혹은 수백만건의 문서가 제시되어 사용자가 원하는 문서를 찾는데 어려움이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 검색 결과의 브라우징을 위한 검색 결과 문서에 대한 자동 클러스터링 방법을 제안한다. 문서간 유사도를 계산하기 위해 공통 키워드 빈도를 이용하고, 클러스터링 방법은 계층적 클러스터링을 사용하고, 각 클러스터에 대한 디스트립터를 추출하기 위해 빈도를 이용한다. 실험 결과, 완전 연결 방법이 가장 나은 정확도를 보였지만 계산시간이 많이 소요되어 동적 환경에 부적합하다는 것을 보였다. 아울러 집단 평균 연결이 정확도나 계산 시간 측면에서 우수함을 알수 있었다.

Keywords