• 제목/요약/키워드: XML Index

Search Result 121, Processing Time 0.022 seconds

2D-THI: XML 데이테베이스를 위한 이차원 타입상속 계층색인 (2D-THI: Two-Dimensional Type Hierarchy Index for XML Databases)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제9권3호
    • /
    • pp.265-278
    • /
    • 2006
  • 본 논문에서는 XML 데이터베이스의 타입상속 계층에 대한 색인기법으로 이차원 색인구조를 이용하는 이차원 타입상속 색인기법인 2D-THI를 제안한다. XML 스키마는 타입상속을 지원하는 XML 문서를 위한 스키마 모델 중에 하나이다. 기존의 XML 데이터베이스를 위한 색인기법은 XML 스키마상의 타입상속 계층에 대한 XML 질의를 지원하지 못한다. 따라서 본 논문에서는 XML 질의의 타입상속 계층을 지원하기 위한 색인기법으로 다차원 파일구조를 이용하는 이차원 색인구조를 구성한다. 이차원 색인구조에서 한 축은 색인된 엘리먼트의 킷값 도메인으로 구성하고 다른 한 축은 타입상속 계층의 타입 식별자 도메인으로 구성한다. 이와 같은 이차원 색인구조를 이용함으로써 사용자 질의 패턴에 따라 두 도메인 사이에서 객인 엔트리들의 클러스터링 정도를 조정함으로써 질의처리의 성능을 향상시킬 수 있다. 본 논문에서 제안한 2D-THI의 성능 평가를 위하여, 비용 모델을 개발하고 이를 통하여 2D-THI를 기존의 객체지향 데이터베이스에서 사용하고 있는 CH-index와 CG-tree와 같은 클래스 계층 색인기법들과 색인의 성능을 비교평가 한다. 성능평가의 결과로서, CH-index와 CG-tree에서는 특정 형태의 XML 질의의 경우에만 좋은 성능을 보인 반면, 본 논문에서 제안한 2D-THI에서는 주어진 질의 형태에 따라 최적의 질의처리 성능을 제공할 수 있음을 보인다.

  • PDF

XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법 (Two-Dimensional Grouping Index for Efficient Processing of XML Filtering Queries)

  • 여대휘;이종학
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.123-135
    • /
    • 2013
  • 본 논문에서는 XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법인 2DG-index를 제안한다. 최근 XML데이터의 질의 처리를 위해 조상-후손관계 또는 부모-자식관계 등의 구조적 관계를 효율적으로 처리하기 위한 많은 연구들이 수행되었다. 그러나 이러한 연구들은 경로 질의에만 초점을 두고 있으며 특정 조건 값을 포함하는 필터링 질의에 대해서는 고려하지 않고 있다. 2DGindex는 필터링 질의를 효율적으로 처리하기 위한 방안으로 XML 스키마의 경로 도메인과 필터링 데이터 값의 도메인으로 구성된 이차원 도메인 공간상의 색인 엔트리들의 클러스터링을 다루는 색인기법이다. 2DG-index의 성능평가를 위하여 특정 조건 값을 포함하는 질의의 유형을 세 가지로 분류하고, 이러한 질의 유형별로 2DG-index의 질의처리 성능을 기존의 일차원 색인구조를 이용하는 색인기법인 데이터 값별로 그룹핑한 DG-index와 경로별로 그룹핑한 PG-index와 비교하여 2DG-inedx의 효율성을 입증한다.

XML 포함질의를 위한 확장형 인덱스 (An Extensible Index for XML Containment Queries)

  • 이상원
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.317-324
    • /
    • 2004
  • XML 문서에 대한 포함질의는 XML의 핵심 질의 중의 하나이다. 따라서, XML 데이터를 지원하는 DBMS에서 이런 유형의 질의를 효과적으로 처리하는 것은 매우 중요한 문제이다. 최근 들어, 객체관계형 DBMS에 XML 데이터를 저장하려는 많은 노력들이 시도되고 있다. 본 논문에서는 객체관계형 DBMS에 BLOB 형태로 저장된 XML 데이터를 대상으로 포함질의를 효과적으로 처리하기 위한 확장형 인덱스를 제시한다. 즉, 객체관계형 DBMS의 확장성을 이용해서 포함질의 처리를 위한 효과적으로 처리하는 확장형 인덱스의 구현과 이 인덱스의 사용 방법을 기술한다.

의미 기반의 XML키워드 검색을 위한 효율적인 인덱스 구조 (An Efficient Index Structure for Semantic-based XML Keyword Search)

  • 이형동;김성진;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.513-525
    • /
    • 2006
  • XML 키워드 검색에서의 검색 결과는 일반적으로 질의 키워드를 모두 포함하는 원소 중 가장 구체적 원소들로 정의된다. 키워드 검색의 정확도 향상을 위하여 XML 원소의 레이블과 온톨로지, 개념모델, 시소러스 둥의 의미 정보가 사용되고 있다. 본 논문에서는 의미 정보를 이용하여 검색 결과로 반환 가능한 개념들이 정의되고 사용자가 검색하려는 개념이 해석 가능할 경우 효율적 질의 처리를 위한 계층 인덱스를 제안한다. 계층 인덱스는 각 키워드 포스팅의 XML 원소들을 원소가 속한 개념들의 상하 관계에 따라 구별하여 저장하고, 검색 결과 산출 가능성이 있는 개념에 속한 원소들만을 선별적으로 읽어서 제한된 조합으로 질의 결과 후보가 되는 최소 공통 선조들을 산출할 수 있도록 한다. 본 논문에서는 계층 인덱스의 구성 원리와 구성 방법, 계층 인덱스를 이용한 질의 처리 방법을 기술한다. DBLP의 XML문서와 INEX2003의 XML 문서 집합을 이용한 실험에서 의미 기반 계층 인덱스는 우수한 성능을 나타내었다.

XML 데이터베이스 다차원 타입상속 색인구조의 조율 알고리즘 (A Tuning Algorithm for the Multidimensional Type Inheritance Index of XML Databases)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제14권2호
    • /
    • pp.269-281
    • /
    • 2011
  • XML 데이터베이스에서 타입상속 개념의 질의처리를 지원하기 위한 다차원 타입상속 색인구조(Multidimensional Type Inheritance Index: MD-TIX)에 대하여, 본 논문에서는 질의 패턴에 따라 색인성능을 향상시키기 위한 색인구조의 조율 알고리즘을 제안한다. MD-TIX는 중첩 엘리먼트와 타입상속 계층이 포함된 복합 형태의 XML 질의처리를 지원하기 위하여 다차원 색인구조를 이용한다. MD-TIX의 조율 알고리즘에서는 먼저 사용자 질의 형태에 대한 질의 정보로서 색인구조를 구성할 색인 페이지 영역들의 모양을 결정하고, 이러한 모양의 페이지 영역들을 갖도록 하는 구간반분 전략을 적용함으로써 최적의 MD-TIX 색인구조를 구성한다. 성능평가의 결과에 의하면, 주어진 질의 패턴에 따라 제안한 조율 알고리즘을 적용함으로서 최적의 MD-TIX를 구성할 수 있었으며, 경로 길이가 2인 경우에 주어지는 중첩 술어에 대한 삼차원 질의 영역의 경우, 모양이 편향된 정도에 따라 질의처리의 성능이 매우 크게 향상됨을 알 수 있었다.

조상-자손 관계 탐색을 지원하기 위한 XML 타입상속 색인구조의 계층적 구성기법 (XML Type Inheritance Index Hierarchies for Supporting Ancestor-descendant Exploration)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제15권9호
    • /
    • pp.1133-1148
    • /
    • 2012
  • 본 논문에서는 XML 데이터베이스에서 XML 질의처리를 효율적으로 지원하기 위한 다차원 타입상속 색인구조(MD-TIX)들의 계층적 구성기법을 제시한다. MD-TIX는 중첩요소와 여러 타입상속 계층으로 이루어진 중첩술어의 조상-자손 관계 탐색을 효율적으로 지원하기 위하여 다차원 색인구조를 이용하는 색인기법이다. 그러나 이러한 MD-TIX는 질의에 주어진 Xpath의 길이가 긴 경우에 색인 엔트리의 구성문제 때문에 색인구조의 구축과 유지관리에 어려움이 있다. 이를 극복하기 위해서, 본 논문에서는 먼저 주어진 Xpath에서 인접한 두 타입 사이의 직접 관계 탐색을 지원하는 기본 색인구조들을 구축하고, 이들을 바탕으로 Xpath상의 임의의 두 타입 사이의 간접 관계 탐색을 지원하는 유도 색인구조들을 구축한다. 이러한 과정을 전체 길이의 Xpath를 지원하는 하나의 목표 색인구조를 구축하기까지 계층적으로 구성하는 방법을 제시한다. 또한 Xpath 상에 주어진 몇 개의 부경로 탐색만을 지원하기 위한 부분적인 색인계층을 효율적으로 구축하기 위한 알고리즘을 제안한다.

XML 문서의 효율적인 저장을 위한 경로 통합 기법 (A Path Combining Strategy for Efficient Storing of XML Documents)

  • 이범석;황병연
    • 한국멀티미디어학회논문지
    • /
    • 제9권10호
    • /
    • pp.1257-1265
    • /
    • 2006
  • XML의 사용이 증가함에 따라서 XML과 관련된 다양한 분야에 대한 연구의 필요성도 증대되고 있는데, 특히 XML로 표현된 문서를 효과적으로 저장, 관리, 검색하기 위한 XML 문서 관리 시스템에 대한 많은 연구들이 활발하게 진행되어 왔다. 이러한 시스템들 중 BitCube는 검색에서 빠른 속도를 통해 뛰어난 성능을 입증한 3차원 비트맵 인덱스 시스템이다. 그러나 문서, 경로, 단어의 세 축으로 이루어진 3차원 메모리 구조를 사용하기 때문에 클러스터 내의 문서가 증가함에 따라 인덱스의 크기가 급격하게 증가하고, 이로 인해 연산 수행속도가 저하되는 문제점을 가지고 있다. 본 논문에서는 BitCube시스템의 문제점을 개선하기 위해 XML 문서의 경로 통합 기법을 제안한다. 이 기법은 XML문서를 시스템의 하부구조에 사용되는 관계형 DBMS에 저장할 때, 유사한 경로들을 통합하여 저장하고, 기존의 3차원 비트맵 인덱스에서 단어로 구성했던 한 축을 value 단위로 구성하여 인덱스 크기를 줄인다 제안한 방법은 3차원 비트맵 인덱스를 구성할 때 인덱스의 크기를 줄이고, 이로 인하여 검객 속도 향상과 디스크 저장 공간의 효율을 가진다.

  • PDF

효율적인 XML 질의 처리를 위한 적응형 경로 인덱스 (Adaptive Path Index for Efficient U Query Processing)

  • 민준기;심규석;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.61-71
    • /
    • 2004
  • XML은 정형적(regular) 구조로부터 비정형적(irregular) 구조, 평탄한(flat) 구조로부터 깊게 내포된(deeply nested) 구조에 이르기까지 다양한 형태의 자료를 표현할 수 있다. 따라서, 현재 XML은 효율적인 데이타 교환 및 통합 기능을 제공하면서 웹 문서 표준으로 부각되고 있다. 또한, XML로 표현되어 있는 정보를 검색하기 위한 다양한 질의 언어들이 제안되었다. XPath와 XQuery같은 XML 질의 언어들은 XML 엘리먼트(element)로 이루어진 비정형적 구조를 탐색하기 위하여 경로 표현식(path expression)을 기반으로 한다. 이러한 경로 표현식을 효율적으로 처리하기 위하여 다양한 경로 인덱스들이 제안되었으나, 기존의 경로 인덱스들은 XML 데이타의 구조 정보만을 이용하여 생성된다. 따라서, 본 논문에서는 XML 데이타의 구조 정보와 질의 부하(workload)를 이용한 적응형 경로 인덱스를 제안한다. 본 논문에서 제안하는 적응형 경로 인덱스는 질의 성능을 향상하기 위하여 해쉬 트리와 그래프 구조를 이용하여 자주 사용되는 경로 정보와 XML 데이타의 구조 요약을 관리한다. 실험 결과로서, 적응형 경로 인덱스가 기존의 경로 인덱스들에 비하야 평균적으로 2배에서 69배 좋은 성능을 보였다.

대용량 XML 문서의 효율적인 질의 처리를 위한 세그먼트 기반 역 인덱스 (Segment-Based Inverted Index for Querying Large XML Documents)

  • 정병수;이혜자
    • 한국IT서비스학회지
    • /
    • 제7권3호
    • /
    • pp.145-157
    • /
    • 2008
  • The existing XML storage methods which use relational data model, usually store path information for every node type including literal contents in order to keep the structural information of XML documents. Such path information is usually maintained by an inverted index to efficiently process XPath queries for large XML documents. In this study, We propose an improved approach that retrieve information from the large volume of XML documents stored in a relational database, while using a segment-based inverted index for path searches. Our new approach can reduce the number of searching an inverted index for getting target path information. We show the effectiveness of this approach through several experiments that compare XPath query performance with the existing methods.

무선 XML 스트림을 위한 색인 기법 (An Index Method for Wireless XML Streams)

  • 정연돈;이지연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.416-428
    • /
    • 2005
  • 본 논문은 무선 정보 시스템 환경에서, 서버가 다수의 클라이언트들에게 무선 방송 기법을 통해 XML 데이타를 스트리밍 서비스할 때 필요한 색인 기법을 제안한다. 제안 하는 색인 방법은 XML 데이타의 스트리밍시 클라이언트들의 접근 시간 및 튜닝 시간을 효과적으로 제어하기 위하여, XML 데이터 및 색인 정보를 부분적으로 반복, 배치하여 스트림을 구성한다. 이를 위하여 트리형태로 표현되는 XML 데이타와 색인 정보를 2-레벨로 구분하여, 색인 및 데이타의 중복 배치 영역을 설정한다. 제안하는 색인 기법의 성능을 접근 시간 및 튜닝 시간 측면에서 분석하여, 분석의 결과로 최적의 레벨 깊이를 결정한다.