An Efficient Technique for Extracting Lower Bound Schema from Semistructured Data

반구조적 데이터의 효율적인 최소경계 스키마 추출 기법

  • 박경현 (충북대학교 데이터베이스 연구실) ;
  • 김록원 (한국전자통신연구원 전자상거래 연구부) ;
  • 양은주 (충북대학교 데이터베이스 연구실) ;
  • 최은선 (충북대학교 데이터베이스 연구실) ;
  • 류근호 (충북대학교 데이터베이스 연구실)
  • Published : 2000.10.01

Abstract

반구조적 데이터는 기존의 스키마와는 달리 고정된 스키마가 없고 주어진 데이터 인스턴스에 대해 하나 이상의 스키마가 존재한다. 따라서 여러 개의 스키마 추출이 가능한데 그중 가장 정확한 스키마를 추출해야 하는 문제(S초듬 Fxtraction)가 발생한다. 이러한 문제를 해결하기 위해 지금까지 여러 가지 스키마 추출 기번들이 제안되었는데 대표적인 것으로 데이터가이드(DataGuide)를 이용하여 최대경계 스키마를 추출하는 방법과 데이터로그(DataLog)를 이용하여 최소경계 스키마를 추출하는 방법이 있다. 이 논문에서는 기존의 데이터로그를 이용하는 방법보다 최소경계 스키마 추출 기법을 제안하고 이전의 스키마 추출 기법들과 비교함으로써 알고리즘의 성능을 살펴본다.

Keywords