The Levelized Schema Extraction in XML Documents

XML 문서에서의 단계화된 스키마 추출

  • 김성림 (동덕여자대학교 정보학부 컴퓨터학 전공 강의) ;
  • 윤용익 (숙명여자대학교 정보과학부 멀티미디어학과)
  • Published : 2002.02.01

Abstract

XML documents, which are becoming new standard for expressing and exchanging data in the Internet, don't have defined schema. It is not adequate to directly apply XML documents to the existing SQL or OQL. Research on how to extract schema for XML documents and query language is going on actively. Fer users' query, the results could be too many or too less. It is important to give the users adequate results. This paper suggests the way to extract many levelized schema according to the frequency of element occurrence in XML documents. The Schema can be reduced or extended to correspond to the users'query more flexibly.

인터넷상에서 데이터를 표현하고 교환하는 새로운 표준으로 등장하는 XML 문서는 정해진 스키마를 가지고 있지 않다. XML 문서를 기존의 관계형 데이터베이스나 객체 지향 데이터 베이스 질의어에 바로 적용하기에는 부적합하여 이러한 XML문서에 대해 스키마를 추출하는 방법과 질의어에 대한 연구가 활발히 진행되고 있다. 스키마가 있다면 XML 문서에 대 해 사용자 질의를 효율적으로 처리할 수 있다. 그리고 수많은 데이터에서 사용자의 질의에 대한 결과는 너무 많거나 적을 수가 있다. 사용자에게 알맞은 질의 결과를 보여주는 것은 중요하다. 본 논문에서는 XML문서의 엘리먼트 정보를 바탕으로 스키마를 추출하고, 그 발생 빈도 수에 따라 여러 단계의 스키마를 추출하는 방법을 제시하고, 이를 구현하여 그 결과를 분석해본다.

Keywords