Bootstrap Mining for Searching Similar Content of XML Data

XML 데이터의 유사내용 검색을 위한 Bootstrap Mining

  • Lee Han-Su (Dept. of Computer Science, Chungnam National University) ;
  • Park Jong-Hyun (Dept. of Computer Science, Chungnam National University) ;
  • Kang Ji-Hoon (Dept. of Computer Science, Chungnam National University)
  • 이한수 (충남대학교 컴퓨터과학과) ;
  • 박종현 (충남대학교 컴퓨터과학과) ;
  • 강지훈 (충남대학교 컴퓨터과학과)
  • Published : 2005.11.01

Abstract

인터넷 상의 정보교환을 위한 국제표준인 XML은 여러 분야의 응용에 사용되며 응용의 특성에 따라 다양한 형태의 구조로 정의되어 사용된다. 이러한 XML은 응용에 따라 의미적으로 유사한 정보라 하더라도 서로 다른 구조정보를 가질 수 있으며 때로는 스키마(DTD)가 없는 XML문서 형태로 존재하기도 한다. 그 결과 특정 영역(동일 스키마 따르는)의 응용들 사이의 통합은 용이해 졌으나 서로 다른 영역 또는 영역에서 소외된 응용과의 통합은 여전히 문제로 남아있다. 본 연구에서는 대부분의 XML문서는 구조정보에 의미를 내포하고 있다는 특성을 고려하여 문서의 구조정보만을 이용하여 서로 다른 영역의 정보들 사이의 유사성을 판단하고 이를 이용하여 의미적으로 유사한 정보를 찾는다. 또한 XML 문서의 특성을 고려하여 보다 정확한 유사정보를 찾기 위하여 처리의 단위를 정의하고 이를 기반으로 프로토타입 시스템을 구현하였다.

Keywords