• 제목/요약/키워드: XML Data Processing

검색결과 396건 처리시간 0.02초

B+-tree를 이용한 XML 색인기법 (Indexing of XML with B+-tree)

  • 권국봉;홍동권
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.94-100
    • /
    • 2006
  • 인터넷을 바탕으로 하는 컴퓨팅 패러다임의 변환은 인터넷에서 디지털 정보 교환의 표준으로 확고한 자리를 굳힌 XML의 사용을 가속화시키고 있다. 이로 인해 XML 데이터의 양이 기하급수적으로 증가하고 보다 효율적으로 XML 데이터를 저장하고 질의하기 위한 연구가 활발히 진행되고 있다. 본 논문에서는 대용량의 데이터 중심 XML를 효과적으로 관리하기 위한 방안으로 그래프 중심의 색인 방법을 연구, 제안한다. 논문에서 제안한 XML 색인은 XML 데이터와 XML 구조 정보를 크게 3개의 구성 성분으로 표현한 후, 메인 메모리 자료구조로 표현된 각 그래프들을 노드 아이디를 키로 사용하여 B+트리에 각 노드를 사상하고 B+트리를 디스크에 저장하여 이들 색인 모델에 대해 지속성을 부여하였다. 본 논문에서 제안한 색인 방법을 통해 XML 데이터의 크기에 따라 질의 처리시간이 선형적으로 증가하는 결과를 얻을 수 있었다.

PrimeFilter: 소수 인덱싱 기법에 기반한 효율적 XML 데이타 필터링 (PrimeFilter: An Efficient XML Data Filtering based on Prime Number Indexing)

  • 김재훈;김상욱;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권5호
    • /
    • pp.421-431
    • /
    • 2008
  • 최근 이질적인 시스템 사이에서의 정보교환의 표준으로 널리 사용되는 XML을 사용하는 Publish/Subscribe 시스템의 스트리밍 XML 데이타 필터링 기법이 활발히 연구되었다. 스트리밍 XML 데이타 필터링 기법은 사용자가 등록한 질의에 대해서 신속한 질의-데이타 매칭을 목적으로 하기 때문에 효율적인 질의 처리 메커니즘이 요구된다. 현재까지 대부분의 연구는 질의 경로 표현식의 부분적인 공유를 꾀하거나 프레디킷을 효율적으로 처리함으로써 질의 처리의 시간적, 공간적 효율을 목적으로 하였다. 하지만 만약 질의간의 포함 관계를 알 수 있다면 질의 처리시에 가장 하위의 질의가 매칭되면 그 질의를 포함하고 있는 상위의 질의들은 별도의 처리 과정 없이 매칭됨을 알 수 있게 된다. 이러한 질의 포함 관계를 이용한 질의 처리 방식은 XML 스트리밍 데이타를 처리하는 또 하나의 효율적 방식이 될 수 있다. 본 논문에서는 소수 인덱싱 기법과 목표 질의 노드 중심의 포함 관계 설정에 기반하여 효율적인 스트리밍 XML 데이타 필터링을 수행하는 새로운 방법을 소개한다. 그리고 몇 가지 실험을 통하여 기존 방법과의 비교 분석 및 효율성을 보인다. 비록 각각의 실험은 서로 다른 실험 요소에 대하여 수행되었지만, 모두 제안 방법이 기존의 방법보다 두 배 이상 더 나은 성능을 가짐을 보여 주었다.

스트림 데이터를 위한 데이터 구동형 질의처리 기법 (A Data-Driven Query Processing Method for Stream Data)

  • 민미경
    • 디지털콘텐츠학회 논문지
    • /
    • 제8권4호
    • /
    • pp.541-546
    • /
    • 2007
  • 많은 양의 연속적인 스트림 데이터를 대상으로 하는 연속적인 질의처리의 경우는 전통적 방식의 요구구동형 질의처리 방식이 적합하지 않다. 본 논문에서는 자료구동형 방식을 도입하여 질의를 처리함으로써 스트림 데이터에 알맞은 질의처리 기법을 제안하고 질의계획의 구조와 질의실행 방식을 설명하였다. 제안된 질의처리 기법은 다중질의 처리가 가능하며, 질의 간에 공유가 가능하게 한다. 또한 부분질의의 실행결과가 저장됨으로써 실행시간을 단축할 수 있다. 본 질의처리 모델에 XML 데이터와 XQuery 질의를 적용하였다.

  • PDF

경로 포함 관계를 이용한 효율적인 XML 질의 처리기법 (An Efficient XML Query Processing Method using Path Containment Relationships)

  • 민경섭;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.183-194
    • /
    • 2004
  • XML 이 명실상부한 데이타 교환 표준 언어로서 자리 잡아 감에 따라, 효율적인 XML 질의 처리 지원에 대한 많은 연구가 진행되어 왔다. XML 질의 처리에서 가장 중요한 고려 사항은 ‘어떻게 XML 경로식을 효율적으로 처리할 것인가’ 하는 것이다. 기존의 몇몇 연구들은 질의를 구성하는 각 라벨들에 대응되는 모든 데이타에 대해 일련의 조인 연산을 수행하는 방식으로 결과를 생성하였다. 다른 몇몇 연구들은 질의에 포함된 경로를 찾기 위해 RDBMS의 문자열 비교 연산자를 사용하고 찾은 경로들에 대응되는 레코드를 추출하여 결과를 생성하였다. 본 연구에서 우리는 경로 포함 관계를 기반으로 한 새로운 질의 계획 생성 방식과 이를 지원하기 위한 두 개의 새로운 조인 연산자들을 제안하였다. 제안한 조인 연산자들은 질의에 속한 경로들과 관련된 데이타만을 입력 데이타로 사용하며, 매우 적은 비교 연산만을 수행한다. 그리고 파이프라인 기법을 적용하여 결과를 생성한다. 우리는 제안한 기법이 다른 이전 기법들에 비해 높은 성능을 보임을 분석과 실험을 통해 증명하였다.

분산 환경에서 전역 XQuery 질의의 조인 선택치 추정 방법 (Estimating Join Selectivity of Global XQuery Queries in Distributed Environments)

  • 박종현;강지훈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권6호
    • /
    • pp.564-571
    • /
    • 2007
  • 분산환경에 XML 데이타들을 통합하기 위한 한가지 방법은 XML 뷰를 사용하는 것이다. 사용자는 XML을 위한 표준 질의어인 XQuery를 사용하여 분산된 XML 뷰들을 대상으로 전역 XQuery질의를 생성할 수 있다. 이렇게 생성된 전역 XQuery 질의는 분산된 이종 데이타들을 통합하고 검색하기 위하여 자연스럽게 지역 시스템들 사이의 조인 연산들을 포함한다. 그러나 조인은 비용이 많이 드는 연산자이므로 조인 연산을 효율적으로 처리하는 것은 전역 질의의 처리 성능과 직결된다. 그러므로 조인 연산을 처리하기 위한 다양한 연구들이 존재하며, 그 가운데 하나는 조인의 선택치를 추정하여 최소의 비용을 갖는 조인 순서를 선택하는 것이다. SQL 질의의 경우, 이미 전역 질의의 조인 선택치를 추정하고 이를 기반으로 그 처리 순서를 결정하기 위한 연구가 존재한다. 그러나, 테이블 구조의 데이타를 검색하기 위한 SQL 질의의 조인 선택치 추정 방법을 구조적인 XML 데이타를 검색하기 위한 XQuery질의를 위해서 그대로 사용하기에는 데이타의 구조적인 차이로 인해 문제가 있다. 그러므로 본 논문에서는 질의의 대상이 되는 XML 뷰들의 정보를 이용하여 XQuery 질의의 특성을 고려한 조인 선택치 추정 방법을 제안한다. 본 논문의 기여는 다음과 같다. 첫째, SQL 질의의 조인 선택치 추정 방법과 XQuery 질의의 방법 사이에 차이점을 분석한다. 둘째, XML 뷰를 참조하여 XQuery 질의의 처리를 위한 조인 선택치 추정 방법을 제안한다. 마지막으로, 성능 평가를 수행하여 제안하는 조인 선택치 추정 방법의 효율성을 입증한다.

XML 데이터베이스 시스템 성능 평가를 위한 통합 XML 데이터 생성기의 설계 (Design of an Integrated XML Data Generator for the Performance Evaluation of XML DBMSs)

  • 신선미;정회진;이상호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.7-10
    • /
    • 2004
  • XML 데이터베이스 시스템이 개발되면 다른 XML 데이터베이스 시스템과의 성능 비교, 또는 자체 기능에 대한 성능 평가를 수행한다. 성능 평가를 수행하기 위해서는 해당 성능 평가에 적합한 XML 데이터를 생성하는 XML 데이터 생성기가 필요하다. 본 논문에서는 지금까지 개발되었던 다양한 XML 데이터 생성기들의 특징 및 장단점을 살펴보고, 이를 기반으로 하나의 사용자 인터페이스를 이용하여 XML 데이터를 생성하는 통합 XML 데이터 생성기의 설계 내용을 기술한다. 통합 XML 데이터 생성기는 레코드 단위의 텍스트 데이터 파일의 내용을 기반으로 XML 데이터를 생성한다. 통합 XML 데이터 생성기는 관계형 데이터베이스 시스템의 데이터를 이용하여 XML 데이터로 생성하는 등 사용자가 제공하는 데이터 활용이 가능하며, 타 XML 데이터 생성기에 비해 다양한 XML 데이터를 생성함으로써 광범위한 XML 데이터베이스 시스템 성능 평가에 이용될 수 있다.

  • PDF

XML 구조 문맥을 사용한 효율적인 경로 표현식 조인 알고리즘 (An Efficient Path Expression Join Algorithm Using XML Structure Context)

  • 김학수;신영재;황진호;이승미;손진현
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.605-614
    • /
    • 2007
  • XML 데이터 검객을 위한 표준 질의 언어로서 XQuery와 XPath가 W3C에 의해 표준으로 제정되었다. XQuery와 XPath를 보편적으로 사용함에 따라, 최근 연구는 방대한 XML 데이터베이스에서 XPath 경고 표현식에 대한 효율적인 질의 처리를 위한 데이터 구조 및 알고리즘 개발에 초점을 두고 있다. 최근에, XPath 경로 표현식을 처리할 때 XML 엘리먼트 사이의 구조적 관계(조상-자손, 부모-자식)를 결정하는 구조적 조인의 개념은 중요한 XPath 프로세싱 기법중의 하나가 되었다. 그러나 XPath 질의 처리에서 자주 발생하는 구조적 조인들은 높은 비용을 요구한다. 본 논문에서, 우리는 XPath 질의들을 효율적으로 처리하기 위해 제안한 구조적 인덱스(SI) 기반의 새로운 구조적 조인 알고리즘(SISJ)을 제안한다. 실험 결과에서는 이전의 알고리즘보다 근소하게 더 효율적인 성능을 보여 준다. 그러나 재귀성이 높은 문서에 대해서는 제안기법의 가지치기 특성으로 인해 약 30% 이상의 성능향상을 보였다.

XQuery에서의 XML 데이터 특성을 고려한 group by 지원을 위한 질의 표현 기법에 대한 연구 (Research on supporting the group by clause reflecting XML data characteristics in XQuery)

  • 이민수;조혜영;오정선;김윤미;송수경
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.501-512
    • /
    • 2006
  • 현재 널리 채택되고 있는 XML은 플랫폼에 의존하지 않는 데이터 표현 형식으로 B2B 응용 프로그램이나 워크플로우 상황에서처럼 느슨하게 연결된(loosely coupled) 이기종 시스템 간에 정보를 교환하는 데 매우 유용하게 사용되고 있다. XML의 이러한 장점 때문에 점차 증가하는 XML에 대한 관리 및 검색에 대한 요구 사항에 대처할 수 있도록 강력한 질의 언어인 XQuery가 만들어졌다. 문서의 검색을 위한 질의 언어인 XQuery는 다양한 데이터 소스로부터 가져온 XML 데이터를 고유한 구조를 가진 질의 결과로 구성할 수 있도록 설계되었으며 현재 XML 질의 언어의 표준이다. XQuery는 반복문 등을 포함하는 강력한 검색 기능을 지원하나 데이터를 그룹화 하는 경우에는 질의 표현이 상대적으로 어렵고, 복잡한 형태를 취한다. 따라서 본 논문에서는 XQuery에 그룹화 처리를 위한 명시적인 groupby절을 도입한 질의 표현 기법을 모색함으로써 XML 데이터의 재구성과 집계 함수 처리를 위한 그룹화를 보다 효율적으로 처리할 수 있도록 하였다. 이를 위해서 XQuery에 groupby절을 도입하기 위한 EBNF(Extended Backus-Naur Form)를 제안하고, 네이티브 XML 데이터베이스인 eXist 기반의 XQuery 그룹화 질의 처리 시스템을 구현하였다.

웹 기반의 전자상거래를 위한 도서검색 시스템 설계 (A Design of Book Retrieval System for Electronic Commerce in based Web)

  • 하추자;정종근;박종훈;김철원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.659-662
    • /
    • 2005
  • XML is standard of web document, and is used in language for document data exchange. XML document is used as example that change existing document to XML or makes new document by XML increases and XML search system to search XML document efficiently accordingly is requiring. This paper describes design and implementation of query processing system for translating XML elements and data between XML documents and relational database and consist of XML to DB processor, DB to XML processor and XML document management processor. Through this, described for design and embodiment of efficient XML document search system of JAVA base using XQL that is proposed in language of quality of XML document.

  • PDF

동적 XML 데이타 스트링의 안전한 질의 처리를 위한 효율적인 접근제어 레이블링 (Efficient Access Control Labeling for Secure Query Processing on Dynamic XML Data Streams)

  • 안동찬;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권3호
    • /
    • pp.180-188
    • /
    • 2009
  • 유비쿼터스 데이타 스트림 환경에서 동적 XML 데이타 스트림에 대한 효율적이고 안전한 접근제어 기법은 최근에 활발한 연구분야가 되어왔다. 본 논문에서 동적 XML 데이타 스트림 환경에서 효율적이고 안전한 접근제어를 위한 향상된 롤-기반 소수 레이블링 기법을 제안한다. 또한 지속적으로 갱신되는 XML 문서의 효율적인 레이블링 기법과 효율적이고 안전한 접근제어를 위한 기존연구의 문제점을 지적한다. 제안하는 향상된 레이블링 기법은 문서가 갱신될 때 다시 레이블링 하지 않고도 노드 사이의 조상-후손 관계와 형제 관계를 유지할 수 있으며, 레이블의 충돌 없이 XML 트리에 임의의 지속적인 노드 삽입 또는 갱신을 지원한다. 또한, 롤-기반 소수 레이블링 기법을 통해 효율적인 접근제어를 구현하였다. 끝으로 본 논문의 제안 방법이 효율적이고 안전함을 실험을 통해 보여줄 것이다.