DOI QR코드

DOI QR Code

Enhancing Document Clustering Method using Synonym of Cluster Topic and Similarity

군집 주제의 유의어와 유사도를 이용한 문서군집 향상 방법

  • Park, Sun (Research Faculty Institute of Information Science and Engineering Research, Mokpo National University) ;
  • Kim, Chul-Won (Dept of Computer Engineering, Honam University)
  • 박선 (목포대학교 정보산업연구소) ;
  • 김철원 (호남대학교 컴퓨터공학과)
  • Published : 2011.04.30

Abstract

본 논문은 군집 주제의 유의어와 유사도를 이용하여 문서군집의 성능을 향상시키는 방법을 제안한다. 제안된 방법은 비음수행렬분해의 의미특징을 이용하여 군집 주제(topic)의 용어들을 선택함으로서 문서 군집 집합의 내부구조를 잘 표현할 수 있으며, 군집 주제의 용어들에 워드넷의 유의어를 사용하여서 확장함으로써 문서를 용어집합(bag-of-words)으로 표현하는 문제를 해결할 수 있다. 또한 확장된 군집 주제의 용어와 문서집합에 코사인 유사도를 이용하여서 군집의 주제에 적합한 문서를 잘 군집하여서 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

Keywords