Performance Evaluation of System Catalog Management Schemes for Distributed XML Repository Systems at the Query Compilation Time

분산 XML 저장 시스템에서 질의 컴파일 시 시스템 카탈로그 관리 기법의 성능 평가

  • 장건업 (서울시립대학교 컴퓨터과학부) ;
  • 홍의경 (서울시립대학교 컴퓨터과학부)
  • Published : 2009.02.28

Abstract

XML is recommended by W3C(World Wide Web) and widely accepted as a standard markup language for expression and sharing data. Recently, increasing the use and the amount of XML documents, there is required that easy methods for accessing XML documents at anytime and anywhere, therefore, the distributed XML repository systems is developed. For this, distributed XML repository systems is necessary to research catalog management schemes. In this paper, we design distributed XML database model considering CPU costs, I/O costs, concurrency control, two-phase commits a protocol, queuing delay and so on. And we implement a simulator in order to execute performance evaluation centralized catalog method, fully replicated catalog method, and partitioned catalog method using reasonably setting up environments.

XML은 W3C(World Wide Web Consortium)에서 제안한, 인터넷 환경에서의 데이터 표현과 교환을 위한 표준 마크업 언어이다. 최근에는 XML 문서의 사용과 XML 문서의 양이 급속하게 증가하여 언제 어디서나 쉽게 필요한 XML 문서에 액세스할 수 있어야 한다. 이에 따라 분산 환경에서의 XML 문서의 처리가 요구되면서 분산 XML 저장 시스템(Distributed XML Repository System)이 개발되고 있다. 이를 위해 분산 XML 저장 시스템에서의 시스템 카탈로그 관리 기법에 대한 연구가 필요하다. 본 논문에서는 분산 XML 저장시스템에서 CPU 비용, I/O 비용, 동시성 제어, 이단계 완료 프로토콜, 큐잉 지연 등을 모두 고려하고, 합리적으로 매개변수를 설정하고 시뮬레이션을 수행함으로써 중앙 집중식 카탈로그, 완전 중복식 카탈로그, 분할식 카탈로그 관리 기법의 성능을 평가하였다.

Keywords

References

  1. W3C, Etensible Markup Language(XML) 1.0 (Fourth Edition), http://www.w3.org/TR/xml,Aug. 2006.
  2. J. Bremer and M.Gertz, "On Distributing XML Repositories," Proc. of the 6th Int'l Workshop on Web and Databases, San Diego, pp. 73-78, June 2003.
  3. S. Abiteboul, et al. "A Framework for Distributed XML Data Management," Proc. of the 10th Int'l Conf. on Extending Database Technology, Munich, Germany, pp. 1049-1058, Mar. 2006.
  4. R. Elmasri and S. B. Navathe, Fundamentals of Database Systems, 5th Edition, Addison-Wesleyh, Boston, MA, 2006.
  5. R. McLab and F. W. Howell, "Using Java for Discrete Event Simulation," Proc. 12th UK Computer and Telecommunication Performance Engineering Workshop, Edinburgh, Scotland, pp. 219-228, Sept. 1996.
  6. S. Forgel, et al. Oracle Database Administrator's Guide, 11g Release (11.1), Oracle Corporation, Oct. 2007.
  7. 이재민, 장건업, 홍의경, "객체 관계 데이터베이스 기반에서 XML 문서를 검색하는 분산 XQquery 질의 처리기의 설계 및 구현", 데이터베이스소사이어티 데이터베이스연구학회지, 제24권, 제1호, pp. 1-16, Apr. 2008.
  8. D. Suciu, "Distributed Query Evaluation on Semistructured Data," ACM Transactions on Database Systems, Vol.27, No.2, pp. 1-62, Mar. 2002. https://doi.org/10.1145/507234.507235
  9. I. Manolescu, et al., "Answering XML Queries over Heterogeneous Data Sources," Proc. of the 27th VLDB Conf., pp. 241-250, Sept. 2001.
  10. G. M. Lohman, et al., "Query Processing in R*: A Distributed Database Manager," IBM Research Report RJ3720, San Jose, California, Jan. 1983.
  11. D. Kossmann, "The State of the Art in Distributed Query Processing," ACM Computing Surveys, Vol. 32, No.4, pp, 422-429, Dec. 2000. https://doi.org/10.1145/371578.371598
  12. P. G. Selinger, et al., "Access Path Selection in a Relational Database Management System," Proc. of ACM SIGMOD Int'l Conf. on Management of Data, Boston, Massachusetts, pp. 23-34, 1979.
  13. M. T. Ozsu and P. Valduriez, Principles of Distributed Database Systems, 2nd Edition, Prentice Hall, New Jersey, 1999.
  14. W3C, XQuery 1.0: An XML Query Language, http://www.w3.org/TR/xquery, Jan. 2007.
  15. I. Tatarinov, et al., "Updating XML," Proc. of ACM SIGMOD Int'l Conf., on Management of Data, Philadelphia, Pennsylvania, pp. 413-424, May 2001.
  16. E. K. Hong, and J. W. Cho, "Performance Evaluation of Catalog Management Schemes m Distributed Database Systems," Information Systems Vol. 16, No.2. Apr. 1991.