DOI QR코드

DOI QR Code

Design and Implementation of Paper Classification Systems based on Keyword Extraction and Clustering

키워드 추출과 군집화 기반의 논문 분류 시스템의 설계 및 구현

  • Lee, Yun-Soo (Dept. of Computer Information & Communication Engs., Deagu Catholic University) ;
  • Pheaktra, They (Dept. of Computer Information & Communication Engs., Deagu Catholic University) ;
  • Lee, Jong-Hyuk (Dept. of Big Data Engineering, Deagu Catholic University) ;
  • Gil, Joon-Min (School of Information Technology Eng., Deagu Catholic University)
  • 이윤수 (대구가톨릭대학교 컴퓨터정보통신공학과) ;
  • 테이퍼악떠라 (대구가톨릭대학교 컴퓨터정보통신공학과) ;
  • 이종혁 (대구가톨릭대학교 빅데이터공학과) ;
  • 길준민 (대구가톨릭대학교 IT공학과)
  • Published : 2018.05.11

Abstract

컴퓨터 및 기술의 발전으로 힘입어 수많은 논문이 오프라인뿐 아니라 온라인으로 발행되고 있고, 새로운 분야들도 계속 생기면서 사용자들은 방대한 논문들 중 자신이 필요로 하는 논문을 검색하거나 분류하기에 많은 어려움을 겪고 있다. 이러한 한계를 극복하기 위해 본 논문에서는 유사 내용의 논문을 분류하고 이를 군집화하는 방법을 제안한다. 제안하는 방법은 TF-IDF를 이용하여 각 논문의 초록으로 부터 대표 주제어를 추출하고, K-means 클러스터링 알고리즘을 이용하여 추출한 TF-IDF 값을 근거로 논문들을 유사 내용의 논문으로 군집화한다.

Keywords