Extraction of Concept by Latent Semantic Indexing and k-means Clustering

잠재적 의미와 k-means 군집화를 이용한 개념추출 검색

  • 장유진 (아주대학교 정보통신전문대학원) ;
  • 임호섭 (아주대학교 정보통신전문대학원) ;
  • 박기림 (아주대학교 정보통신전문대학원) ;
  • 김민구 (아주대학교 정보통신전문대학원)
  • Published : 2001.10.01

Abstract

정보검색 시스템에서 사용자의 질의어가 불완전함에 따라 생기는 검색 효율의 저하를 줄이기 위하여 용어의 상호관련성을 반영함과 동시에 벡터의 공간을 축소하는 LSI 모델을 사용하여 문서 집합으로부터 잠재적 의미 공간을 구축하였다. 또한 의미 공간상에 있는 문서의 분포에 따라 \"개념\"을 추출하기 하기 위해 k-means algorithm을 사용하여 군집화 시켰다. 이로부터 불완전한 초기 사용자 질의어를 의미 공간에 구축된 클러스터링 정보로 수정하여 새로운 질의어를 생성함으로 검색의 효율을 높이고자 하였다. 검색 효율을 측정하기 위해 TREC 데이터를 이용하여 분석하였으며 결과는 질의어의 성격에 따라 달라졌으나 대체적으로 우수한 성능을 보였다.한 성능을 보였다.

Keywords