DOI QR코드

DOI QR Code

A Prime Number Labeling Based on Tree Decomposition for Dynamic XML Data Management

동적 XML 데이터 관리를 위한 트리 분해 기반의 소수 레이블링 기법

  • Byun, Chang-Woo (Dept. of Computer Systems and Engineering, Inha Technical College)
  • 변창우 (인하공업전문대학 컴퓨터시스템과)
  • Received : 2011.02.07
  • Accepted : 2011.02.21
  • Published : 2011.04.30

Abstract

As demand for efficiency in handling dynamic XML data grows, new dynamic XML labeling schemes have been researched. The key idea of the dynamic XML labeling scheme is to find ancestor-descendent-sibling relationships and to minimize memory space to store total label, response time and range of relabeling incurred by update operations. The prime number labeling scheme is a representative scheme which supports dynamic XML documents. It determines the ancestor-descendant relationships between two elements by a simple divisibility test of labels. When a new element is inserted into the XML data using this scheme, it does not change the label values of existing nodes. However, since each prime number must be used exclusively, labels can become significantly large. Therefore, in this paper, we introduce a novel technique to effectively reduce the problem of label overflow. The suggested idea is based on tree decomposition. When label overflow occurs, the full tree is divided into several sub-trees, and nodes in each sub-tree are separately labeled. Through experiments, we show the effectiveness of our scheme.

갱신 연산의 허용으로 동적 XML 데이터의 처리 효율성의 요구가 증대하면서 새로운 동적 XML 레이블링 기법들이 연구되어 왔다. 동적 XML 레이블링 기법의 핵심적인 해결 사항으로는 조상-자손-형제 관계 결정, 레이블 저장공간의 절약, 빠른 응답시간, 갱신에 의한 레이블 재작성의 최소화이다. 대표적인 동적 레이블링 기법으로 소수 기반 레이블링 기법이 있다. 소수 기반 레이블링 기법은 소수의 특성을 이용하여 조상-자손 관계를 쉽게 결정한다. 또한 새로운 엘리먼트를 삽입할 때도 기존 노드의 레이블을 재작성하는 비용이 발생되지 않는 장점을 갖고 있다. 하지만 소수를 많이 사용하면 레이블의 값이 상당히 커지게 되는 레이블 오버플로우 문제가 발생된다. 본 논문에서는 레이블 오버플로우 문제를 효과적으로 줄이는 새로운 방법을 소개한다. 제안하는 방법의 핵심 개념은 트리 분해이다. 레이블 오버플로우가 발생하면 트리를 하부 트리들로 분해하고 레이블은 각 하부 트리에 한해서 부여하는 것이다. 실험을 통해 트리 분해 기반의 소수 기반 레이블링 기법의 효과를 보인다.

Keywords

References

  1. T. Bray, J. Paoli, C. Sperberg-McQueen, E. Maler, and F. Yergeau, "Extensible Markup Language (XML) 1.0," W3C Recommendation, vol. 6, 2000.
  2. Sangyoon Oh, "X2RD: Storing and Querying XML Data Using XPath To Relational Database," Journal of the Korea Society of Computer and Information v.14, no.3, pp.57-64, 2009.
  3. Q. Li and B. Moon, "Indexing and Querying XML Data for Regular Path Expressions," The VLDB Journal, pp. 361-370, 2001.
  4. E. Cohen, H. Kaplan, and T. Milo, "Labeling Dynamic XML Trees", In Proc. of PODS, 2002, 271-281.
  5. M. Duong and Y. Zhang, "LSDX: a new labeling scheme for dynamically updating XML data," Proc. of the 16th Australasian database conference, vol. 39, pp.185-193, 2005.
  6. A. Khaing and N. Thein, "A Persistent Labeling Scheme for Dynamic Ordered XML Trees," in Proc. of the International Conference on Web Intelligence, pp. 498-501, 2006.
  7. X. Wu, M. Lee, and W. Hsu, "A prime number labeling scheme for dynamic ordered XML trees," in Proc. of the 20th International Conference on Data Engineering (ICDE), pp.66-78, 2004.
  8. G. Wu, K. Zhang, C. Liu, J. Li, "Adapting Prime Number Labeling Scheme for Directed Acyclic Graphs," DASFAA 2006, pp. 787-796, April 2006.
  9. KangWoo Lee and JoonDong Lee, "A Prime Numbering Scheme with Sibling-Order Value for Efficient Labeling in Dynamic XML Documents," Journal of the Korea Society of Computer and Information v.12, no.5, pp.65-72, 2007.
  10. R. Thonangi, "A Concise Labeling Scheme for XML Data," in Proc. of ACM SIGMOD, COMAD, 20, 2006.
  11. A. Schmidt, F. Waas, M. Kersten, M. J. Carey, I. Manolescu, and R. Busse, "XMark: a benchmark for XML data management," in Proceedings of the 28th international conference on Very Large Data Bases Hong Kong, China, 2002.