SemFilter: A Simple and Efficient Semantic XML Message Filtering

SemFilter: 단순하며 효율적인 시맨틱 XML 메시지 필터링

  • 김재훈 (서강대학교 컴퓨터공학과) ;
  • 박석 (서강대학교 컴퓨터공학과)
  • Published : 2008.10.15

Abstract

Recent studies on XML filtering assume that all data sources follow a single global schema defined in a filtering system. However, beyond this simple assumption, a filtering system can provide a service that allows data publishers to have their own schema; hence, the data sources will become heterogeneous. The number of data sources is expected to be large in a filtering system and the data sources are frequently published, updated, and disappeared, that is, dynamic. In this paper, we introduce implementing a simple and efficient XPath query translation method for such a dynamic environment. The method is especially targeted for a query which is composed based only on users' knowledge and experience without a graphical guidance of the global schema. When a user queries a large number of heterogeneous data, there is a high possibility that the query is not consistent with the same local schema assumed by the user. Our query translation method also supports a function for this problem. Some experimental results for query translation performance have shown that our method has reasonable performance, and is more practical than the existing method.

XML 메시지 필터링에 관한 최근의 연구들은 모든 출판되는 데이타 소스들이 필터링 시스템에 정의된 유일한 전역 스키마를 따르는 것을 가정한다. 하지만 이러한 가정을 넘어서, 데이타 제공자들이 그들 자신의 스키마를 자유롭게 사용할 수 있는 서비스를 고려할 수 있다. 즉, 데이타 소스들이 이질적인 환경이다. 하지만 XML 필터링 시스템에서 데이타 소스는 다수이며, 또한 출판되는 데이타들은 수시로 생성되고, 갱신되며, 사라진다. 즉, 매우 다이내믹한 환경이다. 본 논문에서는 그러한 다이내믹한 환경을 고려하여 고안된 단순하며 효율적인 의미적 XPath 질의 번역 구현을 소개한다. 특별히 제안되는 질의 번역 기법은 어떤 비주얼한 데이타 가이드가 제공되지 않는 환경에서 사용자가 자신의 지식과 경험에만 의존하여 작성한 질의를 번역하는 것에 초점을 맞춘다. 이러한 환경에서, 사용자는 다수의 이질적인 데이타를 질의하기 때문에, 사용자의 기억상의 스키마에 의존하여 작성된 질의는 실제 스키마와 불일치할 수 있다. 본 연구에서는 제안하는 의미적 XPath 질의 기법이 이러한 문제를 고려하도록 설계한다. 몇 가지 실험 결과는 제안된 질의 번역 기법이 수용할 만한 질의 번역시간을 제공하며, 기존의 방법과 비교하여 실제적임을 보여 준다.

Keywords

References

  1. M. Altinel and M. J. Franklin, 'Efficient filtering of XML documents for selective dissemination of information,' Proc. 26th VLDB, Cairo, Egypt, pp. 53-64, Sept. 2000
  2. Y. Diao, M. Altinel, M. J. Franklin, H. Zhang, and P. Fischer, 'Path sharing and predicate evaluation for high-performance XML filtering,' ACM Transactions on Database Systems, Vol.28, No.4, pp. 467-516, 2003 https://doi.org/10.1145/958942.958947
  3. K. S. Candan, W. Hsiung, S. Chen, J. Tatemura, D. Agrawal, 'AFilter: Adaptable XML filtering with prefix-caching and suffix-clustering,' Proc. 32th VLDB, Seoul, Korea, pp. 559-570, 2006
  4. J. Kim and S. Park, 'PosFilter: An efficient filtering technique of XML documents based on postfix sharing,' Proc. 24th BNCOD, Glasgow, Scotland, pp. 70-81, 2007
  5. C. X. Chen, G. A. Mihaila, S. Padmanabhan, and I. M. Rouvellou, 'Query translation scheme for heterogeneous XML data sources,' Proc. 7th WIDM, pp. 31-38, Nov. 2005
  6. Y. Kanza and S. Sagiv, 'Flexible queries over semistructured data,' In Proc. 20th Symposium on Principles of Database Systems, pp. 40-51, May 2001
  7. S. Amer-Yahia, N. Koudas, A. Marian, D. Srivastava, and D. Toman, 'Structure and Content Scoring for XML,' In Proc. of 31th Inter. Conf on Very Large Data Bases (VLDB'05), pp. 361-372, 2005
  8. Q. Li and B. Moon, 'Indexing and querying XML data for regular path expressions,' In Proc. of 27th Inter. Conf. on Very Large Data Bases (VLDB'02), pp. 361-370, 2001
  9. R. Agrawal, A. Borgida, and H. V. Jagadish, 'Efficient management of transitive relationships in large data and knowledge bases,' In Proc. of the SIGMOD Inter. Conf. on Management of Data, pp. 253-262, 1989
  10. XPath Version 1.0, http://www.w3.org/TR/xpath
  11. RDF Primer, W3C Recommendation, http://www.w3.org/TR/rdf-primer/
  12. OWL Web Ontology Language Overview, W3C Recommendation, http://www.w3.org/TR/owl-features/
  13. E. Mena, A. Illarramendi, V. Kashyap, A. Sheth, 'OBSERVER: An approach for query processing in global information systems based on interoperation across pre-existing ontologies,' International journal on Distributed And Parallel Databases (DAPD), 8(2), pp. 223-271, 2000 https://doi.org/10.1023/A:1008741824956
  14. A. Doan, J. Madhavan, P. Domingos, A. Halvey, 'Learning to map between ontologies on the semantic web,' In Proc. of the 11th International Conference on World Wide Web, pp. 662-673, 2002