Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)
- 2006.06a
- /
- Pages.391-393
- /
- 2006
- /
- 1598-5164(pISSN)
Automatic Generic Summarization Based on Non-negative Semantic Variable Matrix
비음수 의미 가변 행렬을 기반으로 한 자동 포괄적 문서 요약
- Park Sun (Dept. of Computer Science and Information Engineering, Inha University) ;
- Lee Ju-Hong (Dept. of Computer Science and Information Engineering, Inha University) ;
- Ahn Chan-Min (Dept. of Computer Science and Information Engineering, Inha University) ;
- Park Tae-Su (Dept. of Computer Science and Information Engineering, Inha University) ;
- Kim Deok-Hwan (School of Electronic and Electrical Engineering, Inha University)
- 박선 (인하대학교 컴퓨터정보공학과) ;
- 이주홍 (인하대학교 컴퓨터정보공학과) ;
- 안찬민 (인하대학교 컴퓨터정보공학과) ;
- 박태수 (인하대학교 컴퓨터정보공학과) ;
- 김덕환 (인하대학교 전자전기공학부)
- Published : 2006.06.01
Abstract
인터넷의 급속한 확산과 대량 정보의 이동은 문서의 요약을 더욱 필요로 하고 있다. 본 논문은 비음수 행렬 인수분해로(NMF, non-negative matrix factorization) 얻어진 비음수 의미 가변 행렬(NSVM, non-negative semantic variable matrix)을 이용하여 자동으로 포괄적 문서요약 하는 새로운 방범을 제안하였다. 제안된 방법은 인간의 인식 과정과 유사한 비음수 제약을 사용한다. 이 결과 잠재의미색인에 비해 더욱 의미 있는 문장을 선택하여 문서를 요약할 수 있다. 또한, 비지도 학습에 의한 문서요약으로 사전 전문가에 의한 학습문장이 필요 없으며, 적은 계산비용을 통하여 쉽게 문장을 추출할 수 있는 장점을 갖는다.
Keywords