Measuring Improvement of Sentence-Redundancy in Multi-Document Summarization

다중 문서요약에서 문장의 중복도 측정방법 개선

  • 임정민 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과, 첨단정보기술 연구센터) ;
  • 강인수 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과, 첨단정보기술 연구센터) ;
  • 배재학 (울산대학교 컴퓨터정보통신공학부) ;
  • 이종혁 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과, 첨단정보기술 연구센터)
  • Published : 2003.10.01

Abstract

다중문서요약에서는 단일문서요약과 달리 문장간의 중복도를 측정하는 방법이 요구된다. 기존에는 중복된 단어의 빈도수를 이용하거나, 구문트리 구조를 이용한 방법이 있으나, 중복도를 측정하는데 도움이 되지 못하는 단어와, 구문분석기 성능에 따라서 중복도 측정에 오류를 발생시킨다. 본 논문은 주절 종속절의 구분, 문장성분, 주절 용언의 의미를 이용하는 문장간 중복도 측정방법을 제안한다. 위의 방법으로 구현된 시스템은 기존의 중복된 단어 빈도수 방식에 비해 정확율에서 56%의 성능 향상이 있었다.

Keywords