Passage Segmentation based on Topic Appearance, Continuity, and Transition

화제 출현.계속.전환 처리를 이용한 한국어 문서의 단락분할

  • 임수정 (전주대학교 교육대학원 컴퓨터교육과) ;
  • 이원휘 (전북대학교 대학원 컴퓨터공학과 지능공학실) ;
  • 이상곤 (전주대학교 정보기술공학부 언어과학실)
  • Published : 2005.05.13

Abstract

복수의 화제가 혼합되어 있는 문서에서 각 화제의 경계부분을 구분하여 결정하는 단락분할 시스템을 개발한다. 이 기술은 정보검색의 분야에만 한정되지 않고 다양한 분야 예를 들면, 문서분류 및 요약 등의 기초연구에서 중요한 역할을 담당할 기술이다. 본 논문에서는 화제의 출현, 계속, 전환 시점을 고려하여 출현하는 각 화제의 단락구분 방법에 대하여 제안한다. 단락 구분 시 문서의 의미적인 실마리가 끊어지지 않도록 단락을 추출하는 방법을 제안한다.

Keywords