Matching Method between Heterogeneous Data for Semantic Search

시맨틱 검색을 위한 이기종 데이터간의 매칭방법

  • Published : 2006.10.28

Abstract

For semantic retrieval in semantic web environment, it is an important factor to manage and manipulate distributed resources. Ontology is essential for efficient search in distributed resources, but it is almost impossible to construct an unified ontology for all distributed resources in the web. In this paper, we assumed that most information in the web environment exist in the form of RDBMS, and propose a matching method between domain ontology and the existing RDBMS tables for semantic retrieval. Most previous studies about matching between RDBMS tables and domain ontology have extracted a local ontology from RDBMS tables at first, and conducted the matching between the local ontology and domain ontology. However in the processing of extracting a local ontology, some problems such as losing domain information can be occurred since its correlation with domain ontology has not been considered at all. In this paper, we propose a methods to prevent the loss of domain information through the similarity measure between instances of RDBMS tables and instances of ontology. And using the relational information between RDBMS tables and the relational information between classes in domain ontology, more efficient instance-based matching becomes possible.

시맨틱 환경에서의 시맨틱 검색을 위해서는 분산된 자원의 관리와 처리가 중요한 요소이다. 분산된 자원의 효율적인 검색을 위해서는 온톨로지의 사용이 필수적이지만, 모든 자원에 대한 통합적인 온톨로지를 구축하는 것은 현실적으로 매우 어려운 일이다. 본 논문에서는 웹 환경에서의 대부분의 자원은 관계형 데이터베이스 형태로 저장되어져 있다고 가정하고, 시맨틱 검색을 위하여 분산된 관계형 데이터베이스 테이블과 도메인 온톨로지간의 매칭을 위한 방법을 제안한다. 기존의 관계형 데이터베이스와 도메인 온톨로지간의 매칭에 관한 연구들은 관계형 데이터베이스에서 로컬 온톨로지를 추출하여 도메인 온톨로지와의 매칭을 수행하였다. 그러나, 로컬 온톨로지를 추출하는 과정에서 도메인 온톨로지와의 상관관계를 이용하지 않음으로 인하여 도메인 정보가 손실되는 문제점을 가지고 있다. 이에 대한 해결책으로 관계형 데이터베이스의 인스턴스들과 도메인 온톨로지의 인스턴스간의 유사도 측정을 통한 정보 손실을 방지하였으며, 관계형 데이터베이스내의 테이블들간의 관계와 온톨로지에서의 클래스들간의 관계 정보를 이용하여 보다 효율적인 매칭이 가능하도록 하였다.

Keywords