Automatic Text Summarization with Lexical Clustering

어휘 클러스터링을 이용한 자동 문서 요약

  • 김건오 (서강대학교 컴퓨터학과 자연어처리연구실) ;
  • 고영중 (서강대학교 컴퓨터학과 자연어처리연구실) ;
  • 서정연 (서강대학교 컴퓨터학과 자연어처리연구실)
  • Published : 2002.04.01

Abstract

자동 문서 요약 시스템은 문서내 담겨있는 정보를 최대만 표현하면서 문서의 크기를 줄이는 시스템이다. 본 논문에서는 어휘를 자동으로 클러스터링하여 문서 대표어를 찾고, 이를 제목과 조합하여 요약을 수행하는 시스템을 제안한다. 특히 이 시스템은 제목이 없는 문서도 요약을 수행할 수 있는 장점이 있다. 비교시스템으로는 제목, 위치, 빈도를 이용만 시스템을 구축하여 사용하였으며 30%, 10%, 그리고 4문장 요약에서 제안한 시스템은 모두 우수한 성능을 보였다.

Keywords