• 제목/요약/키워드: XML Query

검색결과 357건 처리시간 0.022초

압축된 문서에 대한 질의 처리를 지원하는 XML 압축 알고리즘의 설계 및 구현 (Design and Implementation of a XML Compression Algorithm Supporting Query Processing for Compressed Documents)

  • 이석재;강영준;유재수;조기형
    • 한국콘텐츠학회논문지
    • /
    • 제4권1호
    • /
    • pp.90-99
    • /
    • 2004
  • 인터넷의 급속한 확산에 따라 사회 전반의 디지털화와 지식정보화가 급속도로 진행되고 있다. 많은 사용자들은 웹 상에서 다양한 작업을 하고 서비스를 이용하고 있다. 이러한 작업들의 대부분은 XML을 이용한다. XML은 개발자가 필요시 문서의 논리 구조를 정의할 수 있으며, 내용과 스타일이 분리되어있어 문서의 재사용성이 뛰어나다. 하지만 XML은 문서의 내용을 단순히 텍스트 형태로 다루고 문서의 구조를 표현하기 위해 많은 태그들이 추가되기 때문에 문서의 크기가 커질 수 밖에 없다. 팜탑, PDA등 용량이 제한된 기기에서 XML 문서를 보다 잘 활용하기 위해서는 XML문서를 효율적으로 압축해서 사용할 필요가 있다. 이러한 이유로 최근 XML 문서를 효과적으로 압축하고 다루기 위한 XML 압축 기법에 대한 연구가 일부 이루어지고 있지만, 기존 연구들의 대부분은 압축된 XML문서에 대한 질의 처리를 고려하지 않았다. 본 연구에서는 기존의 방법들보다 XML 문서를 효과적으로 압축을 하여 저장 공간의 활용도를 놓이고, 압축된 XML 문서에 대해 질의처리를 가능하게 하여 보다 빠른 질의 처리를 할 수 있는 XML 압축 알고리즘을 설계 및 구현한다.

  • PDF

스트리밍 XML 데이터의 빈발 구조 마이닝 (Mining of Frequent Structures over Streaming XML Data)

  • 황정희
    • 정보처리학회논문지D
    • /
    • 제15D권1호
    • /
    • pp.23-30
    • /
    • 2008
  • 유비쿼터스 환경에서 상황정보 인식 분야를 연구하면서 가장 밑바탕에서 기초가 될 수 있는 것은 인터넷 기술과 XML(Extensible Markup Language)이다. 인터넷을 통한 통신에서 XML 데이터의 사용이 일반화되고 있으며 데이터의 형태는 연속적이다. 그리고 XML 스트림 데이터에 대한 질의를 처리하기 위한 방안들이 제시되고 있다. 이 논문에서는 스트림 데이터에 대한 질의처리를 효율적으로 수행하기 위한 기반연구로써 XML을 레이블의 순서화된 트리로 모델링하여 온라인 환경에서 빈발한 구조를 추출하는 마이닝 방법을 제안한다. 즉, 지속적으로 입력되는 XML 데이터의 구조를 트리로 모델링하고 각각의 트리를 하나의 트리 집합의 구조로 표현하여 현재 윈도우 시점에서 빈발한 구조를 정확하고 빠르게 추출하는 방법을 제시한다. 제시하는 방법은 XML의 질의 처리 및 색인 구성의 기초 자료로 활용될 수 있다.

UML 클래스 다이어그램을 이용한 XML-GL 질의 모델링 (XML-GL Query Modelling using UML Class Diagram)

  • 최봉진;유춘식;김용성
    • 정보처리학회논문지B
    • /
    • 제14B권1호
    • /
    • pp.23-32
    • /
    • 2007
  • 최근 다양한 분야에서 폭넓게 활용되고 있는 XML 문서는 유연하고도 개방적인 특성으로 인해 정보교환이나 전송을 위한 수단으로 널리 이용되고 있다. 한편 XML 문서를 위한 시각적, 직관적 질의 언어인 XML-GL은 질의에 대한 의미와 결과 문서의 구조를 시각적으로 표현할 수 있기 때문에 XML 문서에 대한 구조 검색과 정보의 공유가 용이하다. 그리고 UML은 정해진 표기법과 다양한 다이어그램을 이용하여 객체지향 분석과 설계를 위한 도구로 사용되고 있다. 본 논문은 UML 클래스 다이어그램을 이용한 XML-GL 질의 모델링 방안을 제안한다. 또한, 모델 구성요소에 대한 제약사항을 정확하게 묘사하기 위하여 객체제약언어(Object Constraint Language)로 정의하였다. 이를 통해 XML 문서를 객체지향 데이터로 변환하여 저장/관리할 수 있으며, UML 클래스 다이어그램을 이용한 질의 모델링 방법을 적용하여 보다 효율적으로 XML 문서를 검색할 수 있다.

XML 데이타의 경로 유사성에 기반한 클러스터링 기법 (A Clustering Method Based on Path Similarities of XML Data)

  • 최일환;문봉기;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권3호
    • /
    • pp.342-352
    • /
    • 2006
  • 최근의 XML 저장소에 관한 연구들은 기존의 데이타 저장을 위해 주로 사용해 왔던 관계형 데이타베이스에 효율적으로 XML 데이타를 매핑하는 기법이나 XML 데이타를 위한 새로운 전용 저장소에 대한 연구들이 주를 이룬다. XML 전용 저장소에서 많이 사용되는 방식으로 XML 문서를 파싱하여 각 노드들을 개별적인 객체로 생성한 후 이를 저장하는 방식이 있다. 이러한 저장 방식에서는 개별적인 객체들의 물리적 배치, 즉 클러스터링이 성능에 영향을 미칠 수 있다. 본 논문에서는 하나의 XML 문서를 보다 효율적으로 저장하는 클러스터링 기법을 제안한다. 제안하는 기법은 데이타 노드들의 경로 유사도를 기반으로 클러스터링을 수행하여 질의 요청에 대한 결과를 반환할 때 발생하는 페이지 I/O를 줄인다. 또한 경로 질의 처리시 필요한 클러스터만을 이용하여 질의 처리를 수행하는 방법을 제안한다. 이는 질의 처리과정에서 불필요한 데이타를 제외함으로써 결과적으로 탐색 공간의 크기를 줄일 수 있어 보다 효율적인 경로 질의 처리를 가능하게 한다. 이밖에 본 논문에서는 기존의 다른 클러스터링 기법들과 제안한 기법들과의 성능 비교를 수행하고, 이를 통해 적절한 클러스터링 기법을 이용하면 XML 저장소의 성능을 향상시킬 수 있음을 보인다.

효율적인 질의 기반 XML 접근제어 수행 메커니즘 (An Efficient Query-based XML Access Control Enforcement Mechanism)

  • 변창우;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권1호
    • /
    • pp.1-17
    • /
    • 2007
  • 다양한 사용자 및 응용 프로그램들이 XML을 기반으로 정보의 분산과 공유를 요구함에 따라 안전하고 효율적으로 XML 데이타를 접근하는 요구가 중요한 이슈로 부각되고 있다. 특히, 접근제어 규칙을 XPath로 표현함으로써 문서 단위 접근 범위의 한계를 극복하고 문서의 일부분 단위의 접근을 해결하면서 접근제어를 수행할 때 발생될 수 있는 충돌에 대한 해결책을 마련하는 안전성에 초점을 둔 연구들은 많았으나 접근제어를 수행할 때의 효율성에 초점을 둔 연구는 미비하다. 본 논문은 안정성뿐만 아니라 효율성을 고려한 XML 접근제어 시스템을 내용으로 하고 있다. 제안하는 방법은 사용자의 질의와 그 사용자의 접근제어 규칙들 중에 질의와 관련된 접근제어 규칙들만을 선택하게 하고 XPath 2.0에서 지원하고 있는 집합 연산을 적절히 연결시켜 접근 제어 정책을 준수하는 새로운 대체 질의로 변경하는 선처리 방법이다. 본 논문에서 제안하고 있는 방법은 어떠한 XML 데이타베이스 관리 시스템에도 적용가능하며 최소 단위의 접근제어 수행, 구현의 용이성, 낮은 실행시간, 그리고 안전하고 정확한 대체 질의 생성을 보장한다. 이와 같은 장점들을 실험을 통해 분석한다.

S-XML 데이터의 효율적인 X-Path 처리를 위한 색인 구조 (An Index Structure for Efficient X-Path Processing on S-XML Data)

  • 장기;장용일;박순영;오영환;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.51-54
    • /
    • 2005
  • This paper proposes an index structure which is used to process X-Path on S-XML data. There are many previous index structures based on tree structure for X-Path processing. Because of general tree index's top-down query fashion, the unnecessary node traversal makes heavy access and decreases the query processing performance. And both of the two query types for X-Path called single-path query and branching query need to be supported in proposed index structure. This method uses a combination of path summary and the node indexing. First, it manages hashing on hierarchy elements which are presented in tag in S-XML. Second, array blocks named path summary array is created in each node of hashing to store the path information. The X-Path processing finds the tag element using hashing and checks array blocks in each node to determine the path of query's result. Based on this structure, it supports both single-path query and branching path query and improves the X-Path processing performance.

  • PDF

An Analysis of Element Information in XML Documents

  • Kim, Sungrim;Yoon, Yong-ik
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.834-837
    • /
    • 2002
  • This paper proposes the way to analyse XML docuements according to the element information. XML documents, which are becoming new standard for expressing and exchanging data in the Internet, don't have defined schema. It is not adequate to directly apply XML documents to the existing relational database or object-oriented database query language. Research on how to extract schema for XML documents and query language is going on actively For users' query, the results could be too many or too less. It is important to give the users adequate results. Our proposed analysis method can be reduced or extended to correspond to the users' query more flexibly.

  • PDF

경로 서명 : XML문서 검색을 위한 경로-지향 질의처리 시스템 (Path Signatures : Path-oriented Query Processing System for XML document Retrieval)

  • 박희숙;박주현;조우현
    • 한국정보통신학회논문지
    • /
    • 제11권7호
    • /
    • pp.1311-1317
    • /
    • 2007
  • 최근 인터넷의 폭발적인 성장과 인기로 인하여, 인터넷상에서 정보의 교환이 매우 빠르게 증가하고 있다. 또한 XML은 인터넷상에서 정보교환의 수단인 동시에 표준으로서 자리를 잡아 가고 있다. 따라서 본 논문에서는 경로-지향 질의어를 평가하기 위한 새로운 인덱싱 기법과 사용자들에게 편리한 XML문서 검색 결과를 제공하기 위한 경로-지향 질의 처리 시스템의 설계 및 구현을 제공한다. 제안된 인덱싱 기법은 XML문서의 검색 성능을 향상시키기 위하여 이진 트라이 구조와 경로서명 파일을 결합하였다.

다중 정규 경로 질의 처리를 위한 효율적 기법 (An Efficient Technique for Evaluating Queries with Multiple Regular Path Expressions)

  • 정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.449-457
    • /
    • 2001
  • 최근에 XML이 웹 상에서 문서 교환의 표준으로 등장하면서 XML로 표현된 데이터에 대한 질의 처리 분야가 주목받고 있다. 이때 XML 질의는 그래프로 표현된 데이터 그래프에서 특정 정규식으로 도달되는 객체를 찾는 정규 경로 질의 (regular path query)를 기반으로 한다. 그런데 사용자의 다양한 형태의 질의를 처리하기 위해서는 질의에 하나 이상의 정규 식을 가지는 질의의 처리가 필요함에도 기존의 연구 즉, 비정형 데이터 모델 하에서의 부를 이용한 질의 변환(query rewriting)이나, 질의 최적화 기법에서는 주로 단일 정규식으로 이 루어진 질의를 다루었다. 본 논문에서는 이러한 다중 정규식을 가지는 질의의 처리에서 1. 뷰의 몸체에서 질의 몸체로의 변수 매핑을 통한 질의 변환과정과 2. 변환된 질의의 각 조각 (conjunct)의 질의 결과를 효율적으로 구하고 결과를 조합하는 두 단계로 이루어진 효율적 인 질의 처리 기법을 제안한다. 제안하는 질의 변환 알고리즘이 안전성(soundness)을 가짐 을 보이고, 질의 처리 기법이 기존 질의 처리 방식에 비하여 효율적임을 보인다.

  • PDF

XML문서를 위한 족보 기반 인덱싱 기법 (Genealogy-based Indexing Technique for XML Documents)

  • 이월영;용환승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.72-81
    • /
    • 2004
  • 오늘날 인터넷 상의 많은 데이타들은 XML의 여러 장점들로 인하여 XML을 이용하여 표현되고 있다. 이렇게 XML 데이타가 늘어가는 것에 비례하여 XML 문서상에서 유용한 정보를 검색하기 위하여 다양한 질의를 빠르고 효율적으로 지원할 수 있는 질의 처리 기법이 요구되고 있다. 그러나 현재까지는 XML 데이타를 위한 질의 최적화 연구는 정규 경로 표현을 다루는 방법론에 국한되어 있다. 본 논문은 새로운 족보 기반 인덱싱 기법을 개발하여 정규 경로 표현뿐 아니라, 단순 경로 표현과 다른 엘리먼트를 참조하고 있는 경로 표현과 같은 다양한 질의 처리를 해결하였다. 또한 이 인덱싱 기법을 객체-관계형 모델에 적용하여 여러 종류의 문서와 다양한 질의 종류에 대해 성능을 평가하였고, 다른 저장 기법과 비교하여 성능의 우수성을 입증하였다.