DOI QR코드

DOI QR Code

Processing of ρ-intersect Operation on RDF Data Using Suffix Array

RDF 데이터에서 접미사 배열을 이용한 ρ-intersect 연산의 처리

  • 김성완 (삼육대학교 컴퓨터공학부) ;
  • 김연희 (부천대학교 e-비즈니스과)
  • Received : 2011.04.12
  • Accepted : 2011.05.16
  • Published : 2011.07.31

Abstract

The actual utilization of Semantic Web technology which aims to provide more intelligent and automated service for information retrieval over the Web becomes gradually reality. RDF is widely used as the one of standard formats to present and manage the voluminous data on the Web. Efficient query processing on RDF data, therefore, is one of the ongoing research topics. Retrieving resources having a specific association from a given resource is the typical query processing type and several researches for this have done. However the most of previous researches have not fully considered discovering the complex relationship among resources such as returning the association between resources as the query processing result. This paper introduces the indexing and query processing for ${\rho}$-intersect operation which is one of the semantic association retrieval types. It includes an indexing scheme using suffix array and optimal processing approaches for handling ${\rho}$-intersect operation. The experimental evaluations shows that the average execution times for the proposed approach is 3~7 times faster than the previous approach.

보다 신속하고 정확한 정보 검색에 대한 지능적이고 자동화 된 서비스 제공을 지향하는 시맨틱웹 기술의 실제적 활용이 점점 구체화 되고 있다. 이에 시맨틱 웹상에서 존재하는 방대한 양의 데이터를 관리하기 위한 표준 포맷 중 하나로 널리 사용되는 RDF로 표현된 데이터에 대한 효율적인 질의 처리는 계속적인 중요한 연구 주제가 되고 있다. RDF 데이터에 대한 전형적인 질의 처리유형은 임의의 리소스로부터 특정한 관계성을 갖는 리소스들을 검색하는 것으로 이에 대한 많은 연구들이 진행되어 왔다. 그러나, 기존의 연구들에서는 리소스간의 복잡한 관계성들의 발견(discovery) 즉, 질의 처리의 결과로 리소스간의 연관성을 반환하는 유형의 질의 처리에 대해서는 충분히 고려하지 않고 있다. 본 논문에서는 시맨틱 연관성 검색 유형의 하나인 ${\rho}$-intersect 연산의 처리를 위한 인덱싱 및 질의 처리 방안을 소개한다. 이를 위해 접미사 배열을 이용한 인덱싱과 ${\rho}$-intersect 연산의 특징을 고려한 최적화 처리 방안을 제안한다. 실험적 성능 평가는 기존 기법에 비해 제안 기법의 평균 실행 시간이 3~7배의 빠른 질의 처리 성능을 보인다.

Keywords

References

  1. W3C, RDF Primer, http://www.w3.org/TR/rdf-primer
  2. T. Tran. and G. Ladwig, "Structure Index for RDF Data," Proc. of the Workshop on Semantic Data Management(SemData@VLDB), Sept. 2010.
  3. K. Anyanwu, A. Sheth, "ρ-Queries: Enabling Querying for Semantic Associations on the Semantic Web," Proc. of Int'l Conf. on WWW, pp.690-699. 2003,
  4. B. Aleman-Meza et al. "Ranking Complex Relationships on the Semantic Web," IEEE Internet Computing, Vol. 9, No. 3, pp. 37-44, 2005. https://doi.org/10.1109/MIC.2005.63
  5. A. Matono, et al., "An Indexing Scheme for RDF and RDF Schema based on Suffix Arrays," First Int'l Workshop on SWDB, pp.151-168, Sept. 2003.
  6. S. Kim, "Improved Processing of Path Query on RDF Data Using Suffix Array," Journal of Convergence Information Technology, Vol. 4, No. 3, pp.45-52. 2009. https://doi.org/10.4156/jcit.vol4.issue3.6
  7. A. Sheth et al, "Semantic Association Identification and Knowledge Discovery for National Security Applications," Journal of Database Management, Vol 16, pp.33-53, 2005. https://doi.org/10.4018/jdm.2005010103
  8. K. Kochut and M. Janik, "SPARQLeR: Extended Sparql for Semantic Association Discovery," LNCS, Vol. 4519, Proc. of the 4th European Conf. on The Semantic Web, pp. 145-159, 2007.
  9. Willlam B. Frakes and Richard Baeza-Yates, "Information Retrieval : data sructures & alogorthms," Sigma Press, 1995.
  10. The Friend of a Friend (FOAF) project, http://www.foaf-project.com
  11. Soonmi Lee, "Design of Relational Storage Schema and Query Processing for Semantic Web Documents," Journal of the Korea Society of Computer and Information, Vol.14, No.1, pp.35-45, January 2009.
  12. Youn-Hee Kim, and Ji-Hyun Kim, "The Scheme for Path-based Query Processing on the Semantic Data," Journal of the Korea Society of Computer and Information, Vol.14, No.10, pp.31-41, October 2009.