DOI QR코드

DOI QR Code

비음수 행렬 인수분해와 NMF 군집방법을 이용한 다중문서요약

Multi-document Summarization using Non-negative Matrix Factorization and NMF Clustering Method

  • 박선 (호남대학교 컴퓨터공학과) ;
  • 이주홍 (인하대학교 컴퓨터정보공학과) ;
  • 김철원 (호남대학교 컴퓨터공학과)
  • Park, Sun (Dept. of Computer Engineering, Honam University) ;
  • Lee, Ju-Hong (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Kim, Chul-Won (Dept. of Computer Engineering, Honam University)
  • 발행 : 2008.05.16

초록

본 논문은 비음수 행렬 인수분해(NMF, non-negative matrix factorization)와 NMF 군집방법을 이용하여 다중문서를 요약하는 새로운 방법을 제안하였다. 본 논문에서 NMF에 의해 계산된 의미 특징(semantic feature)은 문서의 고유 구조(inherent structure)를 반영하여 문장을 추출함으로써 요약의 질을 높일 수 있고, 의미 변수(semantic variable)를 이용한 문장의 군집은 문장 간의 유사성과 다양성 고려하여서 쉽게 과잉정보를 제거하여 문장을 요약할 수 있는 장점을 갖는다.

키워드