Efficient Structural Join Technique using the Level Information of Indexed XML Documents

색인된 XML 문서에서 레벨 정보를 이용한 효과적인 구조 조인 기법

  • 이윤호 (서울대학교 컴퓨터공학부) ;
  • 최일환 (서울대학교 컴퓨터공학부) ;
  • 김종익 (한국전자통신연구원) ;
  • 김형주 (서울대학교 컴퓨터공학부)
  • Published : 2005.12.01

Abstract

As XML is widely used with the development of internet, many researches on the XML storage and query processing have been done Several index techniques have been proposed to efficiently process XML path queries. Recently, structural join has received murk attention as a method to protest the path query. Structural join technique process a path query by identifying the containment relationship of elements. Especially, it has an advantage that we can get the result set by simply comparing related elements only instead of scanning whole document. However during the comparison process, unnecessary elements that are not included in the result set can be scanned. So we propose a new technique, the level structural join. In this technique, we use both the relationship and the level distribution of elements in the path query. Using this technique, we tao improve the performance of query processing only by comparing elements with specific level in the target inverted level.

오늘날 인터넷의 발달과 함께 XML이 많이 사용됨에 따라, XML 저장소와 질의 처리에 관한 연구가 활발하게 이뤄지고 있다. XML에서는 경로 질의를 사용하는데, 이러한 경로 질의를 효과적으로 처리하기 위하여 여러 가지 색인 기법들이 연구되었다. 최근에는 구조 조인 기법이 각광을 받고 있다. 구조 조인 기법은 엘리먼트들의 포함 관계를 살펴 질의를 처리한다. 특히 문서 전체에 대한 탐색을 하지 않고 해당하는 엘리먼트들의 역색인 리스트만을 비교하여 질의 처리를 수행하는 장점을 갖는다. 하지만 구조 조인 기법은 실제 질의 결과에 포함되지 않는 불필요한 엘리먼트들도 탐색해야 하는 비효율성을 가진다. 따라서 본 논문에서는 구조 조인 기법의 성능을 개선하는 레벨 구조 조인 기법을 제안한다. 제안하는 기법은 경로 질의 내 엘리먼트 사이의 관계 정보와 XML 문서 내의 엘리먼트들의 레벨 분포 정보를 이용한다. 이를 통해 구조 조인을 수행할 때, 비교되는 역색인 리스트 내의 모든 엘리먼트들이 아닌, 특정 레벨에 해당하는 엘리먼트들만을 이용하여 비교를 수행함으로써 질의 처리의 속도를 향상시킬 수 있다.

Keywords

References

  1. B. Bray, J. T. Bray, J. Paoli, C. M. Sperberg-McQueen and E. Maler, 'Extensible Markup Language(XML) 1.0,' W3C Recommendation, http://www.w3.org/TR/REC-xml, 2004
  2. S. Abiteboul, et. aI., 'The Lorel query language for semistructured data,' International Journal on Digital Libraries, Vol. 1, No.1, pp.68-88, 1997
  3. Alin Deutsch, Mary F. Fernandez, Daniela Florescu, Alon Y. Levy, Dan Suciu, XML-QL, QL, 1997
  4. XQuery 1.0: An XML Query Language W3C Working Draft, http://www.w3.org/TR/xquery/, 2004
  5. XML Path Language(XPath) 2.0 W3C Working Draft, http://www.w3.org/TR/2004/ WD-xpath20-20040723/, 2004
  6. Goldman, R. and Widom, J. Dataguides: enabling query formulation and optimization in semistructured databases. In Proceedings of the Conference on Very Large Data Bases, 1997
  7. Milo, T. and Suciu, D., Index structures for path expressions, In Proceedings of the International Conference on Database Theory, 1999
  8. Kaushik, R., Shenoy, P., Bohannon, P., and Gudes, E., Exploiting local similarity for indexing paths in graph-structured data. In IEEE International Conference on Data Engineering, 2002
  9. Chun Zhang, J. Naughton, D. DeWitt, Q. Luo, G. Lohman, On Supporting Containment Queries in Relational database Management Systems, SIGMOD, 2001 https://doi.org/10.1145/376284.375722
  10. Li,Q. and Moon, B., Indexing and querying XML data for regular path expressions., In Proceeding of the Conference on Very Large Data Bases, 2001
  11. Shurug Al-Khalifa, H.V. Jagadish, Nick Koudas, Jignesh M.Patel, Divesh M.Patel, Divesh Srivastava, Yuqing Wu, Structural Joins: A Primitive for Efficient XML Query Pattern Matching, In IEEE International Conference on Data Engineering, 2002
  12. Jiang,H.,Lu, H.,Wang, W., and Ooi, B.C., XR-Tree : Indexing XML Data for Efficient Structural Joins, In IEEE International Conference on Data Engineering, 2003 https://doi.org/10.1109/ICDE.2003.1260797
  13. Laurent Mignet, Denilson Barbosa, The XML Web: a First Study, World Wide Web Conference, 2003
  14. N. Zhang, V. Kacholia, A Succinct Physical Storage Scheme for Efficient Evaluation of Path Queries in XML, ICDE, 2004 https://doi.org/10.1109/ICDE.2004.1319984
  15. IBM, http://www.alphaworks.ibm.com/tech/xmlgenerator, 2003