Integration of XML Schemas Based on Domain Ontology

도메인 온톨로지에 기반한 XML 스키마의 통합

  • 강혜란 (연세대학교 컴퓨터과학과) ;
  • 이경호 (연세대학교 컴퓨터과학과)
  • Published : 2008.07.31


Semantically similar XML documents in the same application domain might often conform to different schemas. To uniformly view and query such XML documents, we need an efficient method of integrating XML schemas. This paper proposes a sophisticated method for integrating XML schemas in the same application domain. To compute mapping relationships between schemas, the proposed method utilizes various relationships, such as synonyms and hypernyms, between lexical items based on dictionaries and domain ontologies. Particularly, the relationships between lexical items are elaborated by taking their structural information into account. In addition, this paper proposes a more accurate method for integrating compositors. Experimental results with schemas in various application domains show that the utilization of domain ontologies and the structural relationships between lexical items enhance the precision and recall of integrated schemas.

동일한 도메인에 속하고 의미가 유사한 XML 문서들이라도 서로 다른 XML 스키마를 따르는 경우가 많다. 그러므로 XML 문서로부터 정보를 추출하고 통합하기 위해서는 의미가 유사한 XML 스키마들을 통합하는 방법이 필요하다. 본 논문은 동일한 도메인에서 사용되는 XML 스키마들을 의미를 정확하게 보존하면서 통합하는 방법을 제안한다. 제안된 방법은 사전과 함께 도메인 온톨로지를 이용하여 어휘 간 유의어 및 상하위어 관계를 검사하고 이를 스키마 통합 과정에 활용한다. 특히 본 논문은 엘리먼트 및 애트리뷰트가 갖고 있는 구조적 정보를 활용하여 유의어 및 상하위어 관계를 보다 정확하게 검사한다. 그리고 정교한 수준의 연산자 통합과 연산자 최적화 규칙을 제안한다. 제안된 방법의 성능을 평가하기 위해서 다양한 도메인의 XML 스키마를 대상으로 실험한 결과, 도메인 온톨로지와 제안된 방법의 어휘 간 구조적 관계를 이용할 경우 통합 스키마의 정확률과 재현율이 향상됨을 확인하였다.
