Semantic Search System using Ontology-based Inference

온톨로지기반 추론을 이용한 시맨틱 검색 시스템

  • Published : 2005.03.01

Abstract

The semantic web is the web paradigm that represents not general link of documents but semantics and relation of document. In addition it enables software agents to understand semantics of documents. We propose a semantic search based on inference with ontologies, which has the following characteristics. First, our search engine enables retrieval using explicit ontologies to reason though a search keyword is different from that of documents. Second, although the concept of two ontologies does not match exactly, can be found out similar results from a rule based translator and ontological reasoning. Third, our approach enables search engine to increase accuracy and precision by using explicit ontologies to reason about meanings of documents rather than guessing meanings of documents just by keyword. Fourth, domain ontology enables users to use more detailed queries based on ontology-based automated query generator that has search area and accuracy similar to NLP. Fifth, it enables agents to do automated search not only documents with keyword but also user-preferable information and knowledge from ontologies. It can perform search more accurately than current retrieval systems which use query to databases or keyword matching. We demonstrate our system, which use ontologies and inference based on explicit ontologies, can perform better than keyword matching approach .

시맨틱 웹은 단순한 문서들의 링크가 아닌 문서들의 의미와 관계를 표현하는 웹으로 소프트웨어 에이전트가 이해할 수 있도록 구성되어 있다 본 논문에서 제안하는 검색방식은 온톨로지기반의 추론을 통한 시맨틱 검색방법으로 다음과 같은 특징을 갖는다. 첫째, 검색키워드와 문서의 키워드가 다르더라도 의미적으로 같으면 온톨로지의 추론을 통해 검색이 가능하게 한다. 둘째, 규칙기반의 변환기가 서로 다른 온톨로지의 컨셉을 정확한 매치(exact match)가 아니어도 유사한 컨셉으로 추론할 수 있게 한다. 셋째, 온톨로지가 검색 키워드의 의미를 뚜렷하게 정의할 수 있으므로 단순한 키워드 매칭과 빈도만으로 검색하는 것 보다 정확한 검색이 가능하도록 한다. 넷째, 최적화된 질의문 자동 생성이 도메인 온톨로지를 통해 가능하므로 자연어와 유사한 검색영역과 정확성을 갖게 한다. 다섯째, 에이전트가 단순히 키워드가 포함된 문서만을 찾는 것이 아니라 온톨로지에 표현되어 있는 정보를 토대로 사용자가 원하는 정보와 지식을 자동적으로 찾게 한다. 이러한 방식은 데이타베이스의 질의문을 사용하거나 일반적인 키워드기반의 정보검색 기법을 사용하여 자료를 검색하는 기존의 검색 시스템보다 정화한 검색을 가능하게 한다. 본 논문에서는 온톨로지를 기반으로 추론을 적용한 시맨틱 검색시스템에 대하여 문서검색에 초점을 맞추어 연구 결과를 제안한다.

References

  1. Tim Berners-Lee, James Hendler and Ora Lassila, 'The Semantic Web,' Scientific American, 2001
  2. R. Guha, Rob McCool, Eric Miller 'Semantic Search,' WWW2003 conference paper submission
  3. Richard Fikes, Pat Hayes, Ian Horrocks, 'DQL - A Query Language for the Semantic Web,' WWW 2003, May 20-24, 2003, Budapest, Hungary
  4. Deborah L. McGuinness and Richard Fikes, James Hendler, Lynn Andrea Stein, 'DAML +OIL:An Ontology Language for the Semantic Web,' IEEE 2002 https://doi.org/10.1109/MIS.2002.1039835
  5. Thomas R. Gruber, 'Toward Principles for the Design of Ontologies Used for Knowledge Sharing,' Standford Knowledge Systems Laboratory, 23 August 1993
  6. Michael K. Smith, Chris Welty, Deborah L. McGuinness, 'OWL Web Ontology Language Guide,' W3C Recommendation 10 February 2004
  7. Dan Connolly, Frank van Harmelen, Ian Horrocks, Deborah L. McGuinness, Peter F. Patel-Schneider, Lynn Andrea Stein, 'DAML+OIL Reference Description,' W3C Note 18 December 2001
  8. Fikes, Richard, Jessica Jenkins, and Gleb Frank. 'JTP: A System Architecture and Component Library for Hybrid Reasoning,' Proceedings of the Seventh World Multiconference on Systemics, Cybernetics, and Informatics. Orlando, Florida, USA. July 27-30, 2003
  9. 'Knowledge Interchange Format,' draft proposed American National Standard (dpANS), http://logic.stanford.edu/kif/dpans.html
  10. Fikes, Richard, Jessica Jenkins, and Qing Zhou. 'Including Domain-Specific Reasoners with Reusable Ontologies,' Proceedings of the 2003 International Conference on Information and Knowledge Engineering. Las Vegas, Nevada, USA. June 23-26, 2003
  11. Frank Manola, Eric Miller, 'RDF Primer,' W3C Working Draft 23 January 2003
  12. Andy Seaborne, 'Jena Tutorial: A Programmer's Introduction to RDQL,' April 2002
  13. Richard Fikes, Deborah McGuinness, 'An Axiomatic Semantics for RDF, RDF-S, and DAML+OIL,' W3C, December 2001