• Title/Summary/Keyword: XML 인덱스

검색결과 117건 처리시간 0.027초

관계형 데이터베이스를 이용한 XQuery 전문 검색 (XQuery Full-Text Search in RDBMS)

  • 천윤우;홍동권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1339-1342
    • /
    • 2003
  • XML이 인터넷상에서 디지털 정보를 표현하고 교환하기 위한 표준이 되어감에 따라 최근까지 XML을 저장하고 검색하기 위한 역인덱스 기법에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 XML 전문 검색을 위한 새로운 역인덱스 구조를 제안한다. 기존에 연구된 역인덱스 기법을 통한 키워드 검색 기능을 더욱 보완하고 최근에 W3C에서 새로운 기능으로 추가된 전문 검색 기능을 구현한다.

  • PDF

경로 구성 유사도를 이용한 비트맵 인덱싱 기반 XML 문서 인식 기법 (An Identifying Method of XML Document based on Bitmap Indexing using Path Construction Similarity)

  • 이재민;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1515-1518
    • /
    • 2003
  • XML의 대표적인 특징은 기존의 다른 컨텐츠와는 달리 문서의 구조를 기술할 수 있다는 것이다. 구조적 정보는 활용 방법에 파라 XML문서의 다양한 처리에 있어 성능을 향상시키는 핵심적인 요소가 될 수 있다. 그러나 XML 태그의 자기 서술적인 특성에서 비롯되는 구조적 표현의 차이는 오히려 문서의 식별을 어렵게 하는 원인이 된다. 본 논문에서는 기존의 비트맵 인덱스(Bitmap Index)를 이용한 XML 문서 검색 시스템이 다양한 구조적 유사성을 판별할 수 없는 단점을 보완 가능하도록 경로 중심의 유사 문서 인식 기법을 제안한다. 이 기법은 '경로 구성 유사도'와 '유사 경로 테이블'을 통해 기존의 비트맵 인덱스가 갖는 유사 경로를 인식하지 못하는 단점을 해결하고 검색의 유연성을 부여함으로써 보다 양질의 검색 결과를 도출할 수 있다. 또 이것은 기존 시스템의 Bit-wise 연산에 완전히 이식됨으로써 비트맵 인덱스의 장점인 빠른 성능을 그대로 유지할 수 있게 된다.

  • PDF

XML 뷰 인덱싱 (XML Vicw Indexing)

  • 김영성;강현철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.252-272
    • /
    • 2003
  • 뷰는 이질적인 데이타의 통합 및 여과(filtering) 기능을 통해서 데이타베이스의 필요한 부분을 제공한다. 많은 정보가 쏟아지고 있는 웹 환경의 데이타 교환 표준인 XML에 대해서도 뷰의 개념은 유용하다. 본 논문은 XML 뷰 인덱싱이라고 명명한 XML 뷰를 구현하는 기법을 제안한다. XML 뷰는 XML 뷰에 대한 정보와 더불어 뷰를 구성하는 하부 XML 엘리먼트에 대한 식별자를 저장하는 구조인 XML 뷰 인덱스로 표현된다. XML 뷰 인덱스가 XML 엘리먼트 자체가 아닌 식별자만을 저장하므로, 사용자가 XML 뷰를 요청하면 하부 XML 문서를 기반으로 XML 뷰를 실체화해야 한다. 또한, 하부 XML 문서에 대한 변경에 대하여 XML 뷰 인덱스의 일관성을 유지하기 위한 효율적인 점진적 갱신 기법이 필요하다. 본 논문에서는 XML 뷰 인덱싱을 위한 자료구조와 알고리즘을 제안하고 구현하였다. 성능 평가 결과 XML 뷰 인덱싱을 사용하는 것이 매번 뷰를 재생성하는 경우보다 질의 재수행 시간이 적게 걸렸다. XML 뷰 인덱싱 기법이 실체화 시간으로 인해 XML 실체뷰 기법보다 질의 재수행 시간은 많이 걸리지만, 저장 공간 면에서는 약 30배 정도 효율적인 것으로 나타났다.

분할된 역 인덱스 테이블에서 부모노드의 정보를 이용한 질의 처리 (Query Processing using Information of Parent Nodes in Partitioned Inverted Index Tables)

  • 김명수;황병연
    • 한국멀티미디어학회논문지
    • /
    • 제11권7호
    • /
    • pp.905-913
    • /
    • 2008
  • 최근 XML(Extensible Markup Language) 사용의 증가와 함께 다량의 이질적 구조를 가진 XML문서들이 이용되고 있으며, 이러한 XML문서들의 효율적인 관리를 위해 데이터 저장 구조에 대한 연구의 필요성이 증가하고 있다. 이에 따라 본 논문에서는 이들 XML 문서들의 효율적인 관리를 위하여 분할된 역 인덱스 테이블에서 부모노드의 정보를 이용하여 질의를 처리하는 방법을 제안한다. 이질적 구조를 가진 대규모의 문서들에 대한 질의 처리 횟수와 처리 데이터 량은 검색 성능에 큰 영향을 주기 때문에 데이터 구조를 설계할 때에 이 두 가지 요소들을 신중히 고려해야 한다. 제안된 방법은 부모 노드의 정보를 이용하여 선형 경로 질의를 위한 질의 처리 횟수를 반감시키고, 역 인덱스 테이블을 XML 트리의 깊이에 따라 적절히 분할하여 탐색 대상이 되는 데이터의 양을 줄이기 때문에 XML 문서에 대한 검색 성능을 향상시킨다. 제안하는 방법의 효율성을 입증하기 위해 인터넷에서 수집한 XML 문서들에 대한 XPath 질의 처리 성능이 기존의 역 색인 기법들에 비해 우수함을 보인다.

  • PDF

시그니처를 이용한 XML 질의 최적화 (XML Query Optimization based on Signature)

  • 박상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권1호
    • /
    • pp.104-114
    • /
    • 2001
  • XML은 웹에서 데이터를 주고받는 표준으로 새로이 등장하고 있다. 이러한 데이터를 잘 처리하기 위하여 데이터베이스의 도움은 필연적이다. XML을 처리하는 데이터베이스에서 데이터는 트리 형태로 저장되며 질의어는 정규 경로식(regular path expression)의 특징을 가지고 있다. 이때 질의 처리는 트리의 각 노드 탐색을 통하여 수행된다. 본 논문에서는 시그니처를 이용한 저장 방법 및 질의 처리를 통하여 질의 수행 시 각 노드의 탐색 횟수를 줄여 질의 수행을 빠르게 할 수 있게 한다. 뿐만 아니라 반 구조적 데이터에 대한 인덱스도 데이터베이스 내에서 반구조적 데이터로 표현된다. 그러므로 본 논문에서 제안한 방법을 인덱스 노드에도 적용할 수 있다. 이와 같이 본 논문에서 제안한 방법은 데이터 객체와 인덱스 객체의 탐색을 줄임으로서 XML 질의를 빠르게 처리할 수 있게 한다.

  • PDF

XML 문서에서 순수 구조 질의에 대한 인덱싱 및 질의 처리 (Indexing and Query Processing for Pure Structure Query on XML Documents)

  • 김성완;김연희;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.220-222
    • /
    • 2002
  • XML 문서의 효율적인 저장 및 검색을 위한 많은 연구들이 수행되고 있다. 그러나 기존의 연구들에서는 주로 내용 검색의 정확도를 높이기 위해 구조적 정보를 이용하는 방법을 제시하고 있으나, 순수하게 구조만을 대상으로 하는 인덱싱 및 질의 처리 방법 특히 , 동적인 환경을 고려한 인덱싱 및 질의 처리 방법에 대해서는 많이 언급하고 있지 않다. 본 논문에서는 XML 문서에 대한 순수 구조 질의 처리가 가능하고, 엘리먼트의 삭제 및 삽입 등 동적인 변경을 처리할 수 있는 인덱스 구조를 설계한다. 또한 설계된 인덱스 구조를 기반으로 순수 질의 처리 유형을 분류하고 각각에 대한 질의 처리 방안을 제시한다.

  • PDF

질의-인식 복호화를 사용한 암호화된 XML데이타에 대한 안전한 질의 처리 (Secure Query Processing against Encrypted XML Data Using Query-Aware Decryption)

  • 이재길;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.243-253
    • /
    • 2005
  • 인터넷에서 XML 데이타를 그대로 배포할 경우 모든 사용자가 배포된 XML 데이타를 아무 제약 없이 액세스할 수 있어, XML 데이타 제공자의 프라이버시가 보장되지 않는다. 따라서, 배포된 XML 데이타에 대해서 액세스를 통제할 수 있도록 암호화 기법을 사용하는 방법들이 최근에 제안되었다. 그러나, 이들 방법에서는 배포된 XML 데이타에 대한 질의 처리 성능이 충분히 논의되지 않았다 질의 처리기는 암호화된 XML 데이타를 복호화하기 전까지 XML 데이타의 실제 내용을 알 수 없으며, 이로 인해 질의 결과를 포함하지 않은 부분까지도 복호화해야 하는 오버헤드가 발생한다. 본 논문에서는 암호화된 XML 데이타에 대한 효율적인 질의 처리를 위해 질의-인식 복호화(Query-aware decryption)라는 개념을 제안한다. 질의-인식 복호화란 암호화된 XML 데이타 중에서 질의 결과를 포함하는 부분만 복호화하는 방법이다. 이를 위해 XML 인덱스를 암호화하여 데이타와 함께 배포한다. 암호화된 XML 인덱스만을 복호화함으로써 암호화된 XML 데이타에서 질의 결과가 포함되어 있는 위치를 알아내어, 다른 암호화된 XML 데이타의 불필요한 복호화를 방지할 수 있다. 암호화된 XML 인덱스는 암호화된 XML 데이타에 비해 그 크기가 매우 작으므로 이를 복호화하는 비용은 암호화된 XML 데이타를 불필요하게 복호화하는데 낭비된 비용에 비해 매우 작다. 실험 결과는 질의-인식 복호화를 사용하는 질의 처리 방법이 기존의 방법에 비해 질의 처리 성능을 최대 6배까지 향상시킴을 보인다. 마지막으로, 암호화된 XML 인덱스로 인해 추가적인 보안 누출이 발생하지 않음을 정형적으로 증명한다.

XML문서를 위한 인덱스기반의 다중 접근 제어 (Index-base Multi Access Control for XML Document)

  • 최남규;황정희;류근호;박진수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1599-1602
    • /
    • 2003
  • 최근, 정보 보호의 중요성이 부각됨에 따라 현재 웹 데이터 교환의 표준인 XML 데이터에 대한 보안과 접근 제어 기법이 주요 연구로 부상하고 있으며 연구의 초점은 안전함을 보장하면서, 동시에 부가적인 비용 증가를 줄이는데 있다. 그렇지만 이러한 연구의 방식에서는 인덱스를 고려하지 않기 때문에 불필요한 탐색은 물론 데이터 증가에 따른 탐색 비용이 증가한다. 따라서 이 연구에서는 XPath의 원리를 기반으로 인덱스와 접근제어를 동시에 고려하는 인덱스 기반의 접근 제어 맵을 제안하고, 이 기법을 관계형 데이터베이스에 적용하여 구현하였다.

  • PDF

관계형 DBMS 기반의 XML 문서 경로 통합 시스템 (Path Combining System of XML Documents based on Relational DBMS)

  • 이범석;황병연
    • 한국멀티미디어학회논문지
    • /
    • 제11권4호
    • /
    • pp.415-422
    • /
    • 2008
  • XML의 사용이 증가함에 따라 XML로 표현된 문서를 효율적으로 저장하고 검색하기 위한 XML 문서 관리 시스템에 대한 많은 연구들이 활발하게 진행되고 있다. 최근에는 주로 관계형 DBMS의 장점을 이용한 XML 문서의 저장과 검색에 대한 연구가 이루어지고 있다. XML Parser를 이용하여 문서 내용을 관계형 테이블에 매핑(Mapping)하면 안정적이고 효율적인 XML 문서 관리 시스템을 구축할 수 있다. 본 논문에서 제안하는 X-Binder 시스템은 관계형 DBMS 기반의 역 인덱스 기법을 사용한다. 역 인덱스 기법은 빠른 검색속도를 보장하지만, 많은 저장 공간을 낭비하는 단점을 가진다. 이 문제점을 해결하기 위해 XML 문서 저장시 형제 관계를 가지는 경로들을 통합하여 저장한다. 제안하는 X-Binder 시스템은 XRel과의 성능 평가에서 저장 공간을 줄이고, 검색 시간을 단축하는 성과를 보였다.

  • PDF

XML 문서의 효율적인 경로 통합 기법 (An Efficient Path Combining Strategy of XML Document)

  • 이범석;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.19-22
    • /
    • 2005
  • XML은 비즈니스 메시징, 웹사이트 정보 통합, 그리고 카탈로그 통합 등의 분야에서 다양한 데이터를 표현하기 위한 포맷으로 급격하게 성장했다. 그러나 XML 데이터의 형태가 고정되어 있지 않기 때문에 전통적인 질의 방법이 항상 정확한 결과를 보여주지는 않는다. 또한 객체 지향 DBMS가 이 영역에 적합한지의 여부는 아직 명확하지 않다. 따라서 XML 데이터를 효율적으로 검색하기 위해 기존의 관계형 DBMS와 연계하여 구조 유사성을 기반으로 하는 검색 기법이 연구되고 있다. 그 중 문서, 경로, 단어로 구성된 3차원 비트맵 인덱스를 이용한 검색 시스템은 다른 XML 문서 검색 시스템보다 훨씬 빠른 수행 속도를 보여주지만, 3차원의 메모리 구조를 사용하여 많은 저장공간을 필요로 하는 단점이 있다. 본 논문에서는 XML 문서를 저장할 때 경로들 사이의 유사성을 이용하여 XML 데이터의 경로를 통합하는 기법에 대해 소개한다. 이렇게 통합된 경로를 이용하여 생성하는 3차원 비트맵 인덱스는 그 크기가 상당히 줄어들게 되고, 기존의 연구에서 보여주었던 문제점들을 해결하게 되었다.

  • PDF