Latent Semantic Indexing Using Semantic Diffusion

의미 확산을 이용한 잠재 의미 색인 방법

  • Kim, Jin-Hwa (Department of Computer Science and Engineering Kwangwoon University) ;
  • Kim, Yong-Hyuk (Department of Computer Science and Engineering Kwangwoon University)
  • 김진화 (광운대학교 컴퓨터소프트웨어학과) ;
  • 김용혁 (광운대학교 컴퓨터소프트웨어학과)
  • Published : 2010.06.30

Abstract

잠재 의미를 색인하는 것은 문서 색인에 있어서 그 색인 품질에 주요한 요인을 차지한다. 본 논문에서 살펴보는 의미 확산 방법은 문서 집합에 나타나는 단어들의 의미적 연관성을 바탕으로 활성화 작용 모델(spreading activation model)을 구축하고 색인 대상 문서의 단어 분포를 출발점으로 삼아, 그 모델 안에서 의미적으로 수렴할 수 있도록 랜덤 워크 방법(random walk method)1)을 수정한 변형 방법을 이용해 확률을 확산시킨다. 이 방법은 단어 사이의 연관성을 따라 탐색하며 동의어와 다의어 등 단순 단어 일치로는 알 수 없는 의미적 유사 단어들이 의미 있는 확률 분포를 갖게 한다. 이는 단어들의 의미 분포를 가중치 그래프를 통해 보다 합리적으로 다루게 된다. 실험에서는 문서 분류를 시행하여 평균 정확도 및 정확도-재현율 곡선을 산출하였고, 비교 실험을 통해서 전반적인 우수성을 관찰할 수 있었다.

Keywords