Design and Implementation of Keyword Extractor based on Synonyms and Related Terms

동의어와 유의어 개념에 기반 한 키워드 추출기의 설계 및 구현

  • 박은석 (전주대학교 컴퓨터공학과 언어과학실) ;
  • 박현진 (전주대학교 컴퓨터공학과 언어과학실) ;
  • 이상곤 (전주대학교 컴퓨터공학과 언어과학실)
  • Published : 2007.06.25

Abstract

인간은 문서를 읽고 그 내용을 머릿속에서 개념적으로 정리하여 몇 개의 명사를 이용하여 키워드로 인지한다. 본 논문은 이러한 점에 착안하여 문서를 대표하는 키워드를 추출하는 시스템을 설계하고 구현하였다. 본 논문에서는 단어의 개별적인 개념 정보를 동의어와 유의어 사전을 통해 주요 개념어를 추출하고, 추출된 개념어들 사이의 공기 관계를 계산하여 키워드로써의 중요도를 계산하고자 한다. 이를 통해 문서를 대표할 수 있는 키워드 후보를 생성하는 생성 규칙을 자동화하고 문서를 잘 대표할 수 있는 키워드 추출기를 제안하였다.

Keywords