• 제목/요약/키워드: XML 인덱스

검색결과 117건 처리시간 0.024초

대용량 XML 문서의 효율적인 질의 처리를 위한 세그먼트 기반 역 인덱스 (Segment-Based Inverted Index for Querying Large XML Documents)

  • 정병수;이혜자
    • 한국IT서비스학회지
    • /
    • 제7권3호
    • /
    • pp.145-157
    • /
    • 2008
  • The existing XML storage methods which use relational data model, usually store path information for every node type including literal contents in order to keep the structural information of XML documents. Such path information is usually maintained by an inverted index to efficiently process XPath queries for large XML documents. In this study, We propose an improved approach that retrieve information from the large volume of XML documents stored in a relational database, while using a segment-based inverted index for path searches. Our new approach can reduce the number of searching an inverted index for getting target path information. We show the effectiveness of this approach through several experiments that compare XPath query performance with the existing methods.

주기억 상주형 XML DBMS 저장 구조 설계 (Design of a Storage Structure for Main Memory XML DBMS)

  • 임혁수;노현종;이규철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.7-10
    • /
    • 2005
  • 최근 인터넷을 중심으로 한 첨단 기술 산업이 발달함에 따라 고성능 트랜잭션 처리가 요구되고, XML 관련 기술들 역시 확대 적용되고 있다. 이에 따라 디스크 기반 DBMS 의 한계를 극복하고, 점차 사용 범위가 확대되고 있는 XML 기술을 지원하기 위한 시스템의 필요성이 대두되고 있다. 기존의 XML 저장 방법은 대부분 XML DOM 구조 정보만을 저장하는 것이었으나, 이 방법은 XQuery를 처리하는 속도면에 한계가 있었다. 본 논문에서는 이 점을 해결하기 위해 2 중의 인덱스 구조를 두어, XQuery 처리 속도를 향상시킬 수 있는 주기억 상주형 XML DBMS 의 저장 구조를 설계 한다.

  • PDF

XML 문서에서 엘리먼트 타입을 이용한 구조적 검색 기법의 설계 (Design of Structural Retrieval Scheme Using Element Type in XML Documents)

  • 김성완;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.584-586
    • /
    • 2003
  • XML 문서의 검색을 위한 많은 연구들이 수행되고 있지만 순수하게 구조적 관계성만을 대상으로 하는 검색 즉, 구조적 검색 처리 기법에 대해서는 많이 다루지 않고 있거나 XML 문서 트리에 대한 반복적인 순회를 기반으로 처리하는 방법들이 제안되었다. 또한, 사용자가 원하지 않는 엘리먼트들을 제외하기 위해서는 부가적인 필터링 과정을 필요로 한다. 한편, 대부분의 XML 문서의 검색 관련 연구들은 엘리먼트의 삽입 또는 삭제 등 XML 문서의 부분적인 갱신 및 변경이 발생하는 환경을 고려하지 않고 있다. 본 논문에서는 사용자로부터 주어지는 질의에 포함된 엘리먼트 타입 정보 이용하여 XML 문서 트리에 대한 순회를 없애거나 최소화시키고, 필터링 과정도 필요로 하지 않는 구조적 검색 기법을 설계한다. 또한, 엘리먼트의 삭제 및 삽입 등 동적인 변경에 빠르고 유연하게 대처할 수 있는 인덱스 구조를 설계하고 이를 기반으로 구조적 검색 질의의 주요 유형에 대한 처리 방안을 예를 들어 설명한다.

  • PDF

Edge-Labeled Graph에 기반 한 XML 인스턴스의 RDB 저장 모델 (RDB Storage Model of XML Instance based on the Edge-Lageled Graph)

  • 김정희;김정필;곽호영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.545-547
    • /
    • 2003
  • 본 논문에서는 Edge-Labeled Graph에 기반하여 XML 인스턴스들을 관계형 데이터베이스(RDB)로 저장하는 모델을 제안하고 구현한다. 저장되는 XML 인스턴스들은 Edge-Libeled Graph에 기반 한 Data Graph로 표현되고 이를 이용하여 데이터 경로(Data Path), 요소(Element), 속성(Attribute), 테이블 인덱스(Table Index) 테이블에 정의된 값들이 추출된 후 Napper를 이용하여 데이터베이스 스키마를 정의하고 추출된 값들을 저장한다. 그리고, RDB 저장 모델은 질의를 지원하기 위해, XPATH를 따르는 질의 언어로 사용되는 XQL을 SQL로 변환하는 변환기를 제공하며, 또한 저장된 XML 인스턴스를 복원하는 DBtoXML 처리기를 갖도록 하였다. 구현 결과, XML 인스턴스들과 RDB 구조로의 저장 관계가 그래프(Graph) 기반의 경로(Path)를 이용한 표현으로 가능했으며, 동시에, 특정 요소 (Element) 또는 속성(Attribute)들의 정보들을 쉽게 검색할 수 있는 가능성을 보였다.

  • PDF

XML 문서를 위한 구조 및 내용기반 문서검색 시스템 설계 및 구현 (Design and implementation of a structure-and content-based document retrieval system for XML documents)

  • 이정재;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.93-95
    • /
    • 1999
  • 최근 XML 문서에 대한 활용이 늘어나면서 이들 문서에 대한 저장 및 검색에 대한 요구가 증가하고 있다. XML문서는 SGML(Standard Generalized Markup Language) 문서가 가지고 있는 다양한 기능들과 구조적인 표현 능력, 그리고 사용의 용이성 등의 장점을 지닌 언어로 1996년 웹의 문서 표준으로 제안되었다. 따라서 XML 문서의 특성을 반영한 문서 검색시스템에 대한 요구가 시급한 상태이며, 기존의 시스템의 경우 구조 및 내용-기반 멀티미디어 문서검색을 효과적으로 지원하지 못하고 있다. 본 논문에서는 XML 문서의 구조정보 및 내용정보를 효과적으로 검색할 수 있는 XML 문서 저장 시스템을 설계 및 구현한다. 구현하는 시스템은 구조-기반 검색을 위해 o2store위에 역파일 인덱스를 구축하고 내용-기반 검색을 위해 X-tree를 사용한다. 또한 검색 인터페이스를 JAVA로 구현하여 효율적인 검색이 이루어지도록 한다.

  • PDF

융합 인덱싱 방법에 의한 조인 쿼리 성능 최적화 (Join Query Performance Optimization Based on Convergence Indexing Method)

  • 짜오티엔이;이용주
    • 한국전자통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.109-116
    • /
    • 2021
  • RDF(Resource Description Framework) 데이터 구조는 그래프로 모델링하기 때문에, 관계형 데이터베이스와 XML 기술의 기존 솔루션은 RDF 모델에 바로 적용하기 어렵다. 우리는 링크 데이터를 더욱 효과적으로 저장하고, 인덱스하고, 검색하기 위해 융합 인덱싱 방법을 제안한다. 이 방법은 HDD(Hard Disk Drive) 와 SSD(Solid State Drive) 디바이스에 기반한 하이브리드 스토리지 시스템을 사용하고, 불필요한 데이터를 필터하고 중간 결과를 정제하기 위해 분리된 필터 및 정제 인덱스 구조를 사용한다. 우리는 3개의 표준 조인 검색알고리즘에 대한 성능 비교를 수행했는데, 실험 결과 제안된 방법이 Quad와 Darq와 같은 다른 기존 방법들에 비해 뛰어난 성능을 보인다.

Edge-Labeled 그래프 기반의 XML 인스턴스 저장 모델 (A XML Instance Repository Model based on the Edge-Labeled Graph)

  • 김정희;곽호영
    • 인터넷정보학회논문지
    • /
    • 제4권6호
    • /
    • pp.33-42
    • /
    • 2003
  • 본 논문에서는 Edge-Labeled Graph에 기반하여 XML 인스턴스들을 관계형 데이터베이스내에 저장하는 모델을 제안하고 구현한다. 저장 모델은 저장되는 XMI 인스턴스들을 Edge-Labeled Graph에 기반하여 데이터 그래프로 표현하며, 표현한 데이터 그래프상의 정보를 저장하기 위해 데이터베이스 스키마로 제시된 데이터 경로, 요소, 속성, 테이블 인덱스 테이블의 구조에 따라 정의된 값들을 추출하고 Mapper 모듈을 이용하여 저장하며 질의를 지원하기 위해, XPATH를 따르는 질의 언어인 XQL을 SQL로 변환하는 모듈, 또한 저장된 XML 인스턴스를 복원하는 DBtoXML 모듈을 갖도록 하였다. 구현 결과, XML 인스턴스들과 제안한 저장 모델 구조로의 저장 관계가 그래프 기반의 경로를 이용한 표현으로 가능했으며, 동시에, 특정 요소 또는 속성들의 정보들을 쉽게 검색할 수 있는 가능성을 보였다.

  • PDF

Edge-Labeled Graph를 적용한 XML 저장 모델 (XML Repository Model based on the Edge-Labeled Graph)

  • 김정희;곽호영
    • 한국정보통신학회논문지
    • /
    • 제7권5호
    • /
    • pp.993-1001
    • /
    • 2003
  • 본 논문에서는 Edge-Labeled Graph에 기반하여 XML 인스턴스들을 관계형 데이터베이스로 저장하는 모델을 제안하고 구현한다. 저장되는 XML 인스턴스들은 Edge-Labeled Graph에 기반 한 Data Graph로 표현하고 이를 이용하여 데이터 경로, 엘리먼트, 속성, 테이블 인덱스 테이블에 정의한 값들을 추출한 후 Mapper를 이용하여 데이터베이스 스키마를 정의하고 추출된 값들을 저장한다. 그리고, 저장 모델은 질의를 지원하기 위해, XPATH를 따르는 질의 언어로 사용되는 XQL을 SQL로 변환하는 변환기 및 저장된 XML 인스턴스를 복원하는 DBtoXML 처리기를 갖도록 한다. 구현 결과, XML 인스턴스들과 제안된 모델 구조간의 저장 관계가 그래프 기반의 경로를 이용한 표현으로 가능했으며, 동시에, 특정 엘리먼트 또는 속성들의 정보들을 쉽게 검색할 수 있는 가능성을 보였다.

다국어를 지원하는 XML 문서 검색 시스템: HyREX (HyREX: Universal XML Retrieval Engine for XML)

  • 한예지;채종대;김수희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1713-1716
    • /
    • 2002
  • HyREX는 연구용 프로토타입 XML 하이퍼미디어 문서 검색시스템으로 다국어를 지원하고 있다. HyREX는 검색을 위한 효율적인 접근 경로들을 처리하는 물리적 계층 HyPath와 질의어를 처리하는 논리적 계층 XIRQL 그리고 사용자 인터페이스인 HyGate 계층으로 이루어져 있다. 이 연구에서는 영어와 독일어 등의 검색을 지원하는 기존의 HyREX 시스템을 한글 XML 문서 검색시스템으로 확장하기 위해 먼저 한글 데이터타입을 위한 클래스를 구현하였다. 앞으로 한글 XML 문서 검색에서 정확율과 재현율을 향상하기 위해 각 문서의 인덱스에 대해 $tf{\cdot}idf$ 공식을 이용하여 가중치를 부여하고 이를 개발하고자 한다.

  • PDF

접미어 트리 구조를 이용한 효율적인 XML 경로 인덱싱 (A Suffix Tree Approach for Efficient XML Path Indexing)

  • 이덕형;원정임;노관준;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.88-90
    • /
    • 2002
  • 최근 인터넷 상에서 XML 문서의 사용이 급속도로 보편화, 일반화됨 따라 정보 검색을 위한 다양한 XML 질의 언어가 제안되고 있다. XML 질의의 공통 특징으로서 ‘*’ 문자 등을 사용한 정규화 경로식(regular path expression)에 의한 손쉬운 구조정보 검색 기능을 들 수 있다. 본 논문에서는 접미어 트리(suffix tree)를 이용한 새로운 경로 인덱싱 기법을 제안한다. 제안하는 기법에서는 XML 문서상의 각 경로를 축약된 유일한 문자열로 인코딩하며, 인코딩 된 각 문자열의 모든 접미어 정보를 인덱스에 저장한다. 본 기법은 일반 정규화 경로식을 포함하는 구조질의를 매우 효율적으로 처리하며, 또한 경로 정보가 부정확하게 기술된 경우에도 관사 질의 처리를 효과적으로 처리할 수 있다.

  • PDF