Automatic Text Summarization with Two Step Sentence Extraction

2단계 문장 추출방법을 이용한 자동 문서 요약

  • 정운철 (서강대학교 컴퓨터학과 자연어처리연구실) ;
  • 고영중 (서강대학교 컴퓨터학과 자연어처리연구) ;
  • 서정연 (서강대학교 컴퓨터학과 자연어처리연구실)
  • Published : 2004.04.01

Abstract

자동 문서 요약 시스템은 문서내에 담겨있는 정보를 최대한 표현하면서 문서의 크기를 줄이는 시스템이다. 본 논문에서는 문서 요약을 크게 2단계로 나누어서 수행한다. 문장내 요약본으로써의 불필요한 문장을 미리 제거하고 이에 더해 다양한 통계적 방법의 여러 장점들을 수용함으로써 보다 나은 성능 향상을 얻을 수 있었다. 비교시스템으로는 제목, 위치, 빈도, 도합유사도, 어휘 클러스터링을 이용한 시스템을 구축하여 사용하였으며 30%, 10% 문장요약에서 제안한 시스템은 모두 우수한 성능을 보였다.

Keywords