Event Clustering Using Automatically Extracted Temporal Information

자동 추출된 시간정보를 이용한 사건 클러스터링

  • Kim Pyung (Korea Institute of Science and Technology Information) ;
  • Nam Dukyun (Korea Institute of Science and Technology Information) ;
  • Choi KiSeok (Korea Institute of Science and Technology Information) ;
  • Myaeng SungHyun (Information & Communications University)
  • 김평 (한국과학기술정보연구원) ;
  • 남덕윤 (한국과학기술정보연구원) ;
  • 최기석 (한국과학기술정보연구원) ;
  • 맹성현 (한국정보통신대학교)
  • Published : 2005.07.01

Abstract

신문기사를 대상으로 사건 단위로 문서를 클러스터링 하기 위해서, 기존의 연구에서는 기사의 발행일 또는 기사의 내용만 사용하여 하나의 사건을 다른 사건과 구분하는 방법을 사용해 오고 있다. 하지만 사건의 전개가 시간 차이를 두고 진행되는 경우 또는 비슷한 시간대에 같은 범주에 속하는 사건이 발생하는 경우 기사의 발행일만 사용하여 사건 관련 기사를 구분하는 것은 한계가 있다. 본 연구에서는 한국어 신문기사를 대상으로 신문기사에 나타난 시간정보를 자동 추출하고, 이를 기사의 발행일을 기준으로 정규화 한 후 사용하여 사건단위로 기사를 클러스터링 하는 방법을 개발하였다. 즉 한국어 신문 기사를 대상으로 기사에 나타난 시간 표현을 자동으로 추출한 후, 사건과의 유사도 비교에 사용함으로써 사건 단위 클러스터링의 정확도를 높이기 위한 방법을 제안한다.

Keywords