DOI QR코드

DOI QR Code

Materialized View Selection Scheme for enhancing RDF Query Performance

RDF 질의 처리 성능 향상을 위한 실체 뷰 선택 기법

  • 박재열 (충북대학교 정보통신공학부) ;
  • 윤상원 (충북대학교 정보통신공학부) ;
  • 최기태 (충북대학교 정보통신공학부) ;
  • 임종태 (충북대학교 정보통신공학부) ;
  • 이병엽 (배재대학교 전자상거래학과) ;
  • 신재룡 (광주보건대학교 보건행정과) ;
  • 복경수 (충북대학교 정보통신공학부) ;
  • 유재수 (충북대학교 정보통신공학부)
  • Received : 2015.06.25
  • Accepted : 2015.07.24
  • Published : 2015.12.28

Abstract

With the development of the semantic web, a large amount of data being produced nowadays is in RDF format. RDF is represented by a triple. An RDF database consisting of triples requires the high cost of join query processing. Materialized view is known as a scheme to reduce the query processing cost by accessing materialized views without accessing the database. It is physically stored the results or the intermediate results of the query processing in a storage area. In this paper, we propose a materialized view selection scheme by using decision tree to solve such a problem. The decision tree considers the size and maintenance costs of the materialized view as well as the profit of query response times. It is shown through performance evaluation that the proposed scheme increases the number of materialized views in the limited storage space and decreases the update rates of the materialized views.

시맨틱 웹의 발전과 함께 RDF 데이터에 대한 사용이 증가되고 있다. RDF 데이터는 트리플로 구성되어 있으며 질의 처리 시 높은 조인 비용이 요구된다. 실체 뷰는 질의 처리 비용을 감소시키는 기법으로 알려져 있다. 실체 뷰는 질의 처리의 결과 또는 중간 결과를 저장 공간 내부에 물리적으로 저장하여 질의 처리 시 전체 데이터베이스의 접근이 아닌 실체 뷰의 접근으로 질의를 처리한다. 본 논문에서는 이를 해결하기 위해 의사 결정 트리를 사용하여 실체 뷰를 선택한다. 제안하는 기법은 의사 결정 트리를 통해 질의 처리시간뿐만 아니라 실체 뷰의 크기 및 유지비용을 고려한다. 성능평가를 통해 제안하는 기법이 기존 기법에 비해 제한된 저장 공간에서의 실체 뷰는 증가하였고 동일 개수의 실체 뷰의 유지비용은 감소함을 보인다.

Keywords

References

  1. S. Decker, S. Melnik, F. van Harmelen, D. Fensel, M. Klein, J. Broekstra, M. Erdmann, and I. Horrocks, "The Semantic Web: The Roles of XML and RDF," IEEE Internet Computing, Vol.4, No.5, pp.63-73, 2000. https://doi.org/10.1109/4236.877487
  2. D. Abadi, A. Marcus, S. Madden, and K. Hollenbach. "Scalable semantic web data management using vertical partitioning," Proceedings of international conference on Very large data bases, pp.411-422, 2007.
  3. T. Neumann and W. Gerhard, "RDF-3X: a RISC-style Engine for RDF," Proceedings of the VLDB Endowment, Vol.1, No.1, pp.647-659, 2008.
  4. V. Dritsou, P. Constantopoulos, A. Deligiannakis, and Y. Kotidis, "Optimizing query shortcuts in RDF databases," Proceedings of Extended Semantic Web Conference on The Semantic Web: Research and Applications, pp.77-92, 2011.
  5. 강승석, 신준호. "트리플 데이터베이스 단축 경로 이득 함수와 구성 인자 실험 분석," 한국전자거래학회지 제19권, 제1호, pp.131-143, 2014. https://doi.org/10.7838/jsebs.2014.19.1.131
  6. 복범, 이병욱, "관계형 데이터베이스 기반의 RDF 데이터 저장구조 개선에 관한 연구," 한국인터넷정보학회 춘계학술발표대회, pp.149-150, 2013.
  7. D. J. Abadi, A. Marcus, S. R. Madden, and K. Hollenbach, "SW-Store : a vertically partitioned DBMS for Semantic Web data management," The VLDB Journal, Vol.18, No.2, pp.385-406, 2001. https://doi.org/10.1007/s00778-008-0125-y
  8. P. Constantopoulos, V. Dritsou, and E. Foustoucos, "Developing query patterns," Proceedings of European conference on Research and advanced technology for digital libraries, pp.119-124, 2009.
  9. 김천중, 김기연, 윤종현, 임종태, 복경수, 유재수, "대규모 RDF 데이터의 분산 저장을 위한 동적 분할 기법," 한국정보과학회논문지, 제41권, 제12호, pp.1126-1135, 2014.
  10. 김기연, 윤종현, 김천충, 임종태, 복경수, 유재수, "대규모 RDF 데이터의 특성을 고려한 효율적인 색인 기법," 한국콘텐츠학회논문지, 제15권, 제1호, pp.9-23, 2015. https://doi.org/10.5392/JKCA.2015.15.01.009
  11. 장윤경, 유병섭, 어상훈, 김경배, 배해영 "데이터 웨어하우스에서 의사결정 트리를 이용한 실체화 뷰 선택 기법," 한국정보처리학회 춘계학술대회, pp.63-66, 2006.
  12. 이병엽, 박용훈, 유재수 "의사결정트리를 통한 자동차산업의 구매패턴 분류," 한국콘텐츠학회논문지, 제15권, 제1호, pp.9-23, 2015. https://doi.org/10.5392/JKCA.2015.15.01.009
  13. F. Goasdoue, K. Karanasos, J. Leblay, and I. Manolescu, "View selection in semantic web databases," Proceedings of the VLDB Endowment, Vol.5, No.2, pp.97-108, 2011.