An Efficient Dynamic Indexing Model for Various Structure Retrievals of XML Documents

XML 문서의 다양한 구조 검색을 위한 효율적인 동적 색인 모델

  • 신승호 (대우정보시스템(주)) ;
  • 손충범 (인하공업전문대학 정보통신) ;
  • 강형일 (주성대학 멀티미디어정보통신공) ;
  • 유재수 (충북대학교 전기전자컴퓨터공학부)
  • Published : 2004.02.01

Abstract

XML documents consist of elements that are basic units of information. When the structure of XML documents is changed dynamically, we need to update structure information efficiently without changing the information of the index structure for fast retrieval. In this paper, we propose a dynamic indexing model scheme that updates the index structure in real time as the structure of XML documents is changed by insertion and deletion of elements. Our dynamic indexing model consists of a structure information representation method and a dynamic index structure. The structure information representation method supports various types of structure retrievals. Our dynamic index structure processes various structural queries efficiently. We show through various experiments that our method outperforms existing ones in processing various types of queries such as content based queries, structural queries and hybrid queries.

정보 표현의 기본 단위인 엘리먼트로 구성되는 XML 문서 내에서 동적으로 구조 변경이 이루어진다. 이때 XML 문서의 구조변경은 빠른 검색을 위해 기존의 색인 구조 정보의 변경 없이 효율적으로 처리되어야 한다. 이를 위해 본 논문에서는 XML 문서의 구조 변경 시 기존의 색인 구조에 효율적으로 수용될 수 있는 동적 색인 모델을 제안한다. 제안하는 동적 색인 모델은 다양한 구조 검색을 지원하기 위한 구조 정보 표현 방법과 효율적인 구조 검색을 지원하기 위한 동적 색인 구조로 구성된다. 제안하는 색인 기법이 기존의 동적 색인을 지원하는 기법보다 내용 색인, 구조 색인, 애트리뷰트 색인 측면에서 우수함을 성능 평가를 통해 보인다.

Keywords

References

  1. 한성근, 송정한, 장재우, 김현기, 강현규 '동적 환경에 적합한 SGML인덱스 관리자의 설계 및 구현', 한국정보처리학회, 제6권 10호, pp. 12-24, 1999
  2. R. Sacks-Davis, T. Arnold-Moore, and J. Zobel, 'Database systems for structured documents,' Proc. The International Symposium on Advanced Database Technologies and Their Integration(ADTI '94), Nara, Japan, pp. 277-283, 1994
  3. Sung-Geun Han, Jeong-Han Son, Jae-Woo Chang and Zong-Chel Zhoo, 'Design and Implementation of a Structured Infromation Retrieval System for SGML documents,' Database Systems for Advanced Applications, pp. 81-88, 1999 https://doi.org/10.1109/DASFAA.1999.765739
  4. 박종관, 강형일, 손충범, 유재수 'XML문서에 대한 효율적인 구조 기반 검색을 위한 색인 모델', 한국정보과학회, 2000 추계 학술발표논문집, pp. 18-20, 2000
  5. Quanzhong Li, Bongki Moon, 'Indexing and Querying XML Data for Regular Path Expression,' VLDB, pp. 361-370, 2001
  6. 민영수, 강승헌, 강형일, 유재수, 이하욱, 최한석, 'XML 문서를 위한 구조정보 추출기의 설계 및 구현', 한국정보과학회 '99 가을 학술발표논문집(I), 한국정보과학회, pp. 81-83, 1999
  7. 연제원, 조정수, 이강찬, 이규철, 'XML문서 구조검색을 위한 저장 시스템 설계', 한국정보과학회 학술 발표논문집(B), 제26권 1호, pp. 3-5, 1999
  8. Alin Deutsch, Mary Fernandez, and Dan Suciu, 'Storing Semistructured Data with STORED,' SIGMOD, 1999
  9. Brian Lowe, Justin Zobel, Ron Sacks-Davis 'A Formal Model for Databases of Structured Text,' Proceedings of the Fourth International Conference on Database Systems for Advanced Applications(DASFAA '95), pp. 449-456, 1995
  10. Proceedings of the 6th International Conference on Database Systems for Advanced Applications Index Design for Structured Documents Based on Abstraction Chow,J.H.;Cheng,J.;Chang,D.;Xu,J.
  11. Chow, J.H., Cheng, J., Chang, D., Xu, J., 'Index Design for Structured Documents Based on Abstraction,' Proceedings of the 6th International Conference on Database Systems for Advanced Applications, pp. 89-96, 1999 https://doi.org/10.1109/DASFAA.1999.765740
  12. Ricardo Baeza-Yates and Gonzalo Navarro, 'Integrating Contents and Structure in Text Retrieval,' FONDECYT, 1995
  13. Shin, D.W., Jang, H.C., Jin, H.L., 'BUS: An Effective Indexing and Retrieval Scheme in Structured Documents,' Proc. Digital Libraries 98, 1998 https://doi.org/10.1145/276675.276702
  14. S.H. Myaeng, D.H. Jang, M.S. Kin, and Z.C. Zhoo, 'A Flexible Model for Retrieval of SGML Documents,' SIGIR'98 ACN, p. 138-145, 1998 https://doi.org/10.1145/290941.290980
  15. Tuong Dao, Ron Sacks-Davis, James A. Thom, 'An Indexing Scheme for Structured Documents and its Implementation,' Proceedings of the Fifth International Conference on Database Systems for Advanced Applications(DASFAA '97), pp. 125-134, 1997
  16. Brain Cooper, Neal Sample, Michael J. Franklin, Cish R. Hjakason and Mosbe Shadmon, 'A Fast Index for Semistructured Data,' VLDB, 2001
  17. Chun Zhang, Jeffrey F. Naughton, David J. Dewitt, Qiong Luo and Guy M. Lohman, 'On Supporting Containment Queries in Relational Database Management Systems,' SIGMOD, 2001 https://doi.org/10.1145/375663.375722