DOI QR코드

DOI QR Code

Multi Sentence Summarization Method using Similarity Clustering of Word Embedding

워드 임베딩의 유사도 클러스터링을 통한 다중 문장 요약 생성 기법

  • Lee, Pil-Won (Department of Computer Science, Soongsil Univ.) ;
  • Song, Jin-su (Department of Computer Science, Soongsil Univ.) ;
  • Shin, Yong-Tae (Dept of Computer Science and Engineering, Soongsil Univ.)
  • 이필원 (숭실대학교 컴퓨터학과) ;
  • 송진수 (숭실대학교 컴퓨터학과) ;
  • 신용태 (숭실대학교 컴퓨터학부)
  • Published : 2021.05.12

Abstract

최근 인코더-디코더 구조의 자연어 처리모델이 활발하게 연구가 이루어지고 있다. 인코더-디코더기반의 언어모델은 특히 본문의 내용을 새로운 문장으로 요약하는 추상(Abstractive) 요약 분야에서 널리 사용된다. 그러나 기존의 언어모델은 단일 문서 및 문장을 전제로 설계되었기 때문에 기존의 언어모델에 다중 문장을 요약을 적용하기 어렵고 주제가 다양한 여러 문장을 요약하면 요약의 성능이 떨어지는 문제가 있다. 따라서 본 논문에서는 다중 문장으로 대표적이고 상품 리뷰를 워드 임베딩의 유사도를 기준으로 클러스터를 구성하여 관련성이 높은 문장 별로 인공 신경망 기반 언어모델을 통해 요약을 수행한다. 제안하는 모델의 성능을 평가하기 위해 전체 문장과 요약 문장의 유사도를 측정하여 요약문이 원문의 정보를 얼마나 포함하는지 실험한다. 실험 결과 기존의 RNN 기반의 요약 모델보다 뛰어난 성능의 요약을 수행했다.

Keywords

Acknowledgement

본 연구는 과학기술정보통신부 및 정보통신기획평가원의 대학ICT연구센터지원사업의 연구결과로 수행되었음 (IITP-2020-2020-0-01602)