• 제목/요약/키워드: XML 매칭

검색결과 58건 처리시간 0.023초

룰과 구조적 속성에 기반한 XML 엘리먼트 매칭 알고리즘 (XML Element Matching Algorithm based on Structural Properties and Rules)

  • 박형;정찬기
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.71-77
    • /
    • 2013
  • XML 스키마 매칭은 두 스키마의 엘리먼트들 간의 의미적인 유사성을 찾는 작업이다. XML 스키마 매칭은 스키마 통합, 데이터 통합, 데이터 웨어하우징, 데이터 변환, P2P 데이터 관리, 시멘틱 웹 등과 같은 응용체계에서 중요한 역할을 한다. 본 논문은 룰과 구조적 속성에 기반한 XML 엘리먼트 매칭 알고리즘을 제안한다. 제안한 알고리즘에서는 먼저 XML 문서의 구조적 속성을 이용하여 엘리먼트들이 unique와 non-unique로 분류되며, 이후 룰에 따라 엘리먼트의 매칭여부를 결정한다. 제안 알고리즘의 효과성을 보이기 위해 인터넷에 공개된 XML 스키마를 이용하여 성능을 평가하였다. 또한 제안 알고리즘은 문서의 구조적 속성을 이용함으로써 사용자 주관성을 배제하고 객관성을 보장하며 특정 유형이 아닌 다양한 형태의 XML에 적용이 가능하다.

타입 정보를 이용한 문서 매칭 기법 설계 (The Design of Document Matching Method using Type Information)

  • 고승규;임순범;최윤철
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.535-538
    • /
    • 2002
  • XML 문서가 널리 사용됨에 따라 XML 문서 간의 통합이나 변환의 필요성이 증가하고 있다. 이러한 변환이나 통합을 위해서는 미디에이터나 웨어하우스와 같은 방법이 이용될 수 있다. 그런데 어떤 방법을 이용하더라도 질의어와 지역 DTD 간의 매칭이나 지역 DTD 간의 매칭은 필수적이다. 따라서 매칭은 변환이나 통합을 위한 기본적인 기술이라고 볼 수 있다. 이와 같은 매칭 관련 연구는 관계형 데이터베이스 분야에서 많이 진행되었으며, 근래에 SGML/XML 분야에서도 연구가 진행되고 있다. 이중 SGML/XML 문서와 관련된 매칭은 주로 엘리먼트 이름과 구조 정보만을 이용하고 있으며, 특히 구조 정보를 이용할 경우에 잘못된 매칭을 유발시킬 수 있다. 이는 구조 정보가 의미 정보를 적절히 표현하지 못하고 있기 때문이다. 따라서 본 논문에서는 XML문서에서 추출 가능한 타입패턴을 정의하고, 이를 이용한 매칭 기법을 제안한다. 이 기법은 구조 정보를 이용하는 기존의 매칭 기법보다 좀 더 명확하고, 정확한 매칭이 가능하다. 또한 이는 타입 정보를 사용할 수 없는 DTD 기반의 XML 문서에서의 매칭 정확도를 높여줄 수 있을 뿐만 아니라 타입에 기본적인 의미 정보도 반영되므로 의미 기반 웹에 사용될 수 있다.

  • PDF

엘리먼트 빈도수 정보를 이용한 XML 문서 매칭 (An XML Document Mathcing using Element Frequency Information)

  • 고승규;강명수;임순범;최윤철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.61-63
    • /
    • 2003
  • XML이 널리 사용됨에 따라 많은 정보가 XML 형태로 표현되고 있다. 또한 인터넷의 대중화로 다양한 정보를 통합하여 처리하거나 교환, 변환하는 경우가 빈번하게 발생한다. 따라서 XML로 표현된 정보도 교환되거나 통합되는 경우가 많이 발생하게 된다. 이와 같은 XML 문서 간의 통합이나 변환에서는 XML의 특징인 문서의 논리적인 구조가 적절하게 반영되어야 한다. 그리고 이를 위해서는 XML 문서의 기본적인 구성 요소인 엘리먼트 간의 매칭이 필수적이다. 기존의 XML 문서 매칭 기법에서는 엘리먼트 이름과 계층 정보 등 명시적으로 표현된 최소한의 정보만을 이용하여 매칭을 수행한다. 이러한 최소한의 제한된 정보를 최대로 이용하여 많은 매칭을 수행하기 위하여 기존의 방법에서는 동의어 사전이나 구조 정보를 과도하게 이용하는 경향이 많다. 따라서 많은 대응을 생성할 수 있지만 동시에 잘못된 대응의 수도 증가한다. 이에 본 논문에서는 명확한 대응을 생성 시키기 위하여 XML의 명시적인 정보 이외에 엘리먼트의 빈도수 정보로부터 엘리먼트 간의 연결성 정보를 정의하고, 이를 이용한 매칭 방법을 제안한다. 제안 방법은 엘리먼트 이름이나 계층 구조 등의 명시적인 정보뿐 아니라 엘리먼트의 연결성을 이용하기 때문에 매칭의 정확도가 향상될 수 있다. 최근에 발표되는 XML 기반의 표준들은 크기가 방대하고 점점 더 복잡해지고 있다. 이같은 환경에서는 잘못된 대응으로 인해 발생하는 비용이 무척 크다. 제안 기법은 매칭의 정확도가 높으므로 이러한 환경에서 좋은 성능을 발휘할 것으로 기대된다.

  • PDF

XML 문서의 변환을 위한 온톨로지 갱신 기반 XML 스키마 매칭 (XML Schema Matching based on Ontology Update for the Transformation of XML Documents)

  • 이경호;이준승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.727-740
    • /
    • 2006
  • 서로 다른 XML 스키마로 작성된 XML 문서간의 변환을 위해서는 두 스키마 사이의 의미적 연관관계를 계산하는 스키마 매칭 과정이 필수적이다. 본 논문에서는 XML 문서의 변환을 위한 효율적인 스키마 매칭 알고리즘을 제안한다. 제안된 알고리즘은 두 단계로 구성된다. 먼저 제안된 온톨로지와 어휘 유사도에 기반하여 단말노드 사이의 후보매칭을 계산한다. 또한 문맥 정보를 반영하는 제안된 경로 유사도 비교를 통해 후보매칭간계 중에서 최종 매칭 결과를 선택한다. 특히 제안된 방법은 기존 연구와 달리 사용자 피드백에 의해 점증적으로 갱신되는 온톨로지에 기반한다. 제안된 온톨로지는 IsA나 PartOf와 같은 다양한 관계를 표현할 수 있기 때문에 일대일 매칭은 물론이고 다대일 및 일대다 관계의 복합매칭을 계산할 수 있다. 제안된 알고리즘의 성능 평가를 위해 다양한 도메인의 XML 스키마를 대상으로 실험한 결과, 평균 97%의 정확률과 83%의 재현율을 나타내어 기존 연구보다 우수하였다. 특히 제안된 온톨로지의 갱신을 통하여 약 9%의 성능 향상을 확인할 수 있었다.

XML문서의 자동변환을 위한 스키마 매칭 알고리즘 (A Schema Matching Algorithm for an Automated Transformation of XML Documents)

  • 이준승;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제7권9호
    • /
    • pp.1195-1207
    • /
    • 2004
  • 스키마 매칭은 XML문서의 자동 변환을 위한 전처리 과정으로서 필수적이다. 스키마 매칭에 관한 기존 연구는 의미적으로 대응 가능한 모든 매칭관계를 고려하기 때문에 다대다의 대응관계를 추출한다. 이에 명확한 매칭관계를 필요로하는 XML문서의 자동변환에는 적합하지 않다. 본 논문에서는 스키마 사이의 일대일 대응관계를 추출할 수 있는 효율적인 스키마 매칭 알고리즘을 제안한다. 제안된 알고리즘은 두 단계로 구성된다. 먼저 단발노드 사이의 언어적 유사도와 데이터타입 유사도를 이용하여 후보매칭을 계산한다. 계산된 후보매칭의 경로유사도 비교를 통해 일대일 매칭을 추출하게 된다. 특히 제안된 방법은 보다 정교한 수준의 스키마 매칭을 위하여 축약어 사전, 동의어 사전, 그리고 도메인 온탈로지에 기반한다. 제안된 알고리즘의 성능을 평가하기 위해서 전자상거래 분야에서 사용 중인 스키마를 대상으로 실험한 결과, 평균적으로 97%의 정확률을 보여 기존 연구보다 우수하였다.

  • PDF

의사결정나무를 활용한 교량 구조계산서의 XML 스키마 매칭 가중치의 효율적 선택방안 연구 (An Efficient Selection of XML Schema Matching Parameters using Decision Tree for Structural Document of Bridge)

  • 박상일;안현정;김봉근;이상호
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2010년도 정기 학술발표대회
    • /
    • pp.69.1-69.1
    • /
    • 2010
  • 본 연구는 교량 시설물의 재난방지를 위한 정보시스템의 구축에 있어 선행되어야 하는 교량 구조계산서 항목 저장정보의 질적 향상을 위해 XML 스키마 매칭 기법을 효율적으로 활용할 방법에 대해 제시하였다. 이를 위하여 XML 스키마 매칭에 사용되는 가중치 변화에 따른 매칭 정확도를 나타내는 데이터를 구축하고, 이를 활용하여 데이터 마이닝 기법 중 하나인 의사결정나무 모델을 구현하여 교량의 형식, 문서가 포함하고 있는 항목의 수, 문서를 작성한 회사에 따라 달라질 수 있는 최적의 가중치를 지동으로 선정할 수 있는 프로세스를 제안하였다. 의사결정나무 모델을 통해 결정한 매칭 가중치는 이전에 비하여 약 10% 정확도 상승효과가 있음을 알 수 있었다.

  • PDF

XML 문서의 자동변환을 위한 효율적인 스키마 매칭 알고리즘 (An Efficient Schema Matching Algorithm for An Automated Transformation of XML Documents)

  • 이준승;이경호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.13-15
    • /
    • 2003
  • 본 논문에서는 XML 문서의 자동변환을 위해 2단계의 상향식 매칭 방법을 제안한다. 제안된 방법은 단말 노드 사이의 유사도 비교를 통해 임계값을 넘는 후보 매칭집합을 결정하고, 단말노드가 포함되어 있는 경로의 유사도 비교를 통해 적절한 일대일 매칭을 추출한다. 특히, 노드 사이의 유사도 비교를 위해 축약어 사전, 일반 동의어 사전, 도메인 온톨로지를 적용한다. 실제 전자상거래용 XML 스키마를 대상으로 실험한 결과 제안된 방법은 평균적으로 97%의 정확률을 보였다.

  • PDF

Inlining 알고리즘을 이용한 XML DTD 매칭 방법에 관한 연구 (A Study for XML DTD Matching Method using Inlining Algorithm)

  • 허보진;김형석;김창석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1505-1508
    • /
    • 2003
  • XML DTD 매칭은 데이터 통합이나 데이터 웨어하우스, 웹 마이닝, 전자상거래, 의미적 질의 처리등과 같은 데이터베이스 관련 응용분야에서 수행해야 할 근본적인 연구 분야이다. 웹이 발전됨에 따라 웹 상의 데이터 교환의 표준인 XML로 많은 데이터를 표현하게 되었고, 이 XML DTD에 대한 매칭이 주된 연구 분야로 대두되었다. XML 스키마는 플랫 구조인 기존의 관계형 데이터베이스 스키마와는 달리 계층적인 트리 구조로 이루어져 DTD를 직접 비교하기가 어렵다. 본 논문에서는 계층적 구조인 XML DTD의 계층적 구조 정보와 무결성 제약조건을 추출하여 일차원적인 직렬 구조로 변환한 후, 유사한 DTD를 매칭하는 방법을 제안한다.

  • PDF

XML 스키마간의 복합매칭 추출을 위한 대화형 기법 (Interactive Approach to Discover Complex Matchings between XML Schemas)

  • 이준승;이경호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.55-57
    • /
    • 2004
  • 본 논문은 온톨로지를 활용한 스키마 매칭 알고리즘을 제안한다. 기존의 대부분의 스키마 매칭 방법은 단순매칭을 대상으로 하는 반면, 제안된 방법은 계층적 구조의 온톨로지에 기반하여 복합매칭을 계산할 수 있다. 특히 제안된 온톨로지는 이전의 매칭결과에 대한 사용자의 피드백을 이용하여 자동으로 갱신됨에 따라 적절한 도메인 정보를 유지할 수 있다. 성능평가를 위한 실험결과, 온톨로지의 적용이 매칭 성능을 향상시킴을 확인할 수 있었다.

  • PDF

RDBMS를 이용하여 XML 문서 관리를 위한 경로 저장과 숫자 매칭 기법 (A Path Storing and Number Matching Method for Management of XML Documents using RDBMS)

  • 봉하익;황병연
    • 한국멀티미디어학회논문지
    • /
    • 제10권7호
    • /
    • pp.807-816
    • /
    • 2007
  • 1996년 W3C에서 XML을 제안한 이래, 다량의 XML(eXtensible Markup Language) 문서들이 인터넷에 확산되고 있다. 이런 이유로, XML과 관련된 연구의 필요성이 증가하고 있는 실정이다. 특히, XML 문서들을 저장, 검색, 그리고 관리하기 위한 XML 관리 시스템에 대한 연구가 활발히 진행되고 있다. 이런 연구들 중에서 XRel은 XML 문서 관리를 위한 대표적인 연구로써 인정되고 있으며, 비교 대상의 연구로서 사용되고 있다. 본 논문에서는 관계형 데이터베이스 시스템을 기반으로 한 XML문서에 대한 관리 기법을 제시한다. 이는 XRel처럼 모든 가능 경로를 저장하는 것이 아니라, 노드의 텍스트 값이나 속성 값이 존재하는 경로만을 저장하는 방식이다. 또, 노드 표현에 따라 고유 노드명 식별자(Node Expression Identifier)를 부여함으로써 부여된 노드 식별자를 매칭하는 숫자 매칭(Number Matching)기법을 제안한다. 마지막으로 제안 방식의 효율성을 입증하기 위해, 기존 방법과 XPath 질의에 대한 처리 성능을 비교함으로써 제안한 방법의 효율성을 제시한다.

  • PDF