Automatic Generic Summarization Based on Non-negative Semantic Variable Matrix

비음수 의미 가변 행렬을 기반으로 한 자동 포괄적 문서 요약

  • Park Sun (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Lee Ju-Hong (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Ahn Chan-Min (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Park Tae-Su (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Kim Deok-Hwan (School of Electronic and Electrical Engineering, Inha University)
  • 박선 (인하대학교 컴퓨터정보공학과) ;
  • 이주홍 (인하대학교 컴퓨터정보공학과) ;
  • 안찬민 (인하대학교 컴퓨터정보공학과) ;
  • 박태수 (인하대학교 컴퓨터정보공학과) ;
  • 김덕환 (인하대학교 전자전기공학부)
  • Published : 2006.06.01

Abstract

인터넷의 급속한 확산과 대량 정보의 이동은 문서의 요약을 더욱 필요로 하고 있다. 본 논문은 비음수 행렬 인수분해로(NMF, non-negative matrix factorization) 얻어진 비음수 의미 가변 행렬(NSVM, non-negative semantic variable matrix)을 이용하여 자동으로 포괄적 문서요약 하는 새로운 방범을 제안하였다. 제안된 방법은 인간의 인식 과정과 유사한 비음수 제약을 사용한다. 이 결과 잠재의미색인에 비해 더욱 의미 있는 문장을 선택하여 문서를 요약할 수 있다. 또한, 비지도 학습에 의한 문서요약으로 사전 전문가에 의한 학습문장이 필요 없으며, 적은 계산비용을 통하여 쉽게 문장을 추출할 수 있는 장점을 갖는다.

Keywords