Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2002.10e
- /
- Pages.285-291
- /
- 2002
- /
- 2005-3053(pISSN)
Query-Based Document Summarization using Important Sentence Selection Heuristics and MMR.
중요 문장추출 휴리스틱과 MMR을 이용한 질의기반 문서요약.
- Kim, Dong-Hyun (Dept. of Computer Science & Engineering, POSTECH) ;
- Lee, Seung-Woo (Dept. of Computer Science & Engineering, POSTECH) ;
- Lee, Gary Geun-Bae (Dept. of Computer Science & Engineering, POSTECH)
- Published : 2002.10.11
Abstract
본 논문은 자연어 검색엔진에서의 검색결과에 대한 HIT LIST[6]와 검색 문서의 요약을 위하여 질의 기반의 3단계 문서요약을 제안한다. 첫째단계로 IR에 주어지는 질의를 유의어 DB를 통해 질의확장을 거친다. 둘째로 질의와 검색문서상의 문장의 유사도 계산을 통해 문장의 중요도 점수를 구한다. 좀더 정확한 요약을 위해 4가지 방법론을 적용하여 각 문장의 중요도를 ranking한다. 셋째로 MMR (Maximal Marginal Relevance)방식을 적용하여 요약 시 중복이 되는 부분을 줄인다. 이때 요약 압축률을 임의로 조절할 수 있다. 실험은 KORDIC의 신문기사로 구성된 문서요약 테스트 집합을 사용하여 좋은 요약결과를 얻었다.
Keywords