DOI QR코드

DOI QR Code

Cluster-based keyword Ranking Technique

클러스터 기반 키워드 랭킹 기법

  • Yoo, Han-mook (School of Electrical and Computer Engineering, University of Seoul) ;
  • Kim, Han-joon (School of Electrical and Computer Engineering, University of Seoul)
  • 유한묵 (서울시립대학교 전자전기컴퓨터공학과) ;
  • 김한준 (서울시립대학교 전자전기컴퓨터공학과)
  • Published : 2016.10.27

Abstract

본 논문은 기존의 TextRank 알고리즘에 상호정보량 척도를 결합하여 군집 기반에서 키워드 추출하는 ClusterTextRank 기법을 제안한다. 제안 기법은 k-means 군집화 알고리즘을 이용하여 문서들을 여러 군집으로 나누고, 각 군집에 포함된 단어들을 최소신장트리 그래프로 표현한 후 이에 근거한 군집 정보량을 고려하여 키워드를 추출한다. 제안 기법의 성능을 평가하기 위해 여행 관련 블로그 데이터를 이용하였으며, 제안 기법이 기존 TextRank 알고리즘보다 키워드 추출의 정확도가 약 13% 가량 개선됨을 보인다.

Keywords