• 제목/요약/키워드: XML Matching

검색결과 67건 처리시간 0.025초

해양GIS XML 응용스키마 결합방법 연구 (A study on integration of XML application schema for MGIS)

  • 오세웅;박계각;박종민;서상현
    • 한국지능시스템학회논문지
    • /
    • 제19권2호
    • /
    • pp.236-241
    • /
    • 2009
  • 분산되어 있거나 이기종의 데이터베이스 통합을 위해 많은 연구가 수행되었으며, 특히 데이터베이스 통합을 위해 데이터베이스의 스키마 매칭이 이슈가 되고 있다. 본 연구에서는 해양GIS 데이터베이스 통합을 위해 해양GIS 데이터베이스 구조를 XML 응용스키마로 변환하고 유사도 측정법과 relaxation labeling 기법을 이용하여 매칭 방법을 연구하였다. XML 응용스키마의 항목 간 유사도 측정은 각 항목이 가지고 있는 범주와 속성으로 계산하며, 각 항목이 계층간 의미적 연계관계를 적용하기 위하여 relaxation labeling 기법을 이용하여 초기 유사도 측정값에 반복적으로 적용하여 유사도 측정값의 변이를 측정하였다. 본 연구에서는 해양GIS 메타데이터 응용 스키마의 예시를 들어 알고리즘을 통한 매칭을 시도하였고, 실험 결과 알고리즘에 따른 초기 계산 값의 변화를 확인하였다.

XML 기술과 스트링 매칭 기법을 이용한 구조 기반 정보 검색 알고리즘 (Structure Based Information Retrieval Algorithm Using XML Technology and String Matching Algorithm)

  • 한기덕;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.171-176
    • /
    • 2007
  • Parsing 작업의 결과인 Parse Tree 정보는 문장에 관한 구조적 정보를 가지고 있는 Tree 정보로 이 정보를 이용하여 정보 검색에 활용하는 알고리즘을 제안한다. 제안하는 알고리즘은 XML 기술과 스트링 매칭 기법을 이용하였으며, 사용한 스트링 매칭 기법은 Approximate String Matching 기법이다. Query 정보와 문서 정보를 Parsing하여 얻은 Parse Tree를 XML 형태의 정보로 변환한 후, 두 정보를 가지고 Approximate String Matching 기법을 적용하여 Query 정보와 문서 정보 간의 유사도를 계산한다. 제안하는 알고리즘의 장점은 구조 기반의 정보 검색 기능이 가능하고 비슷한 정보에 대한 검색 기능이 가능하며 비슷한 구조에 대한 검색 기능이 가능하다는 것이다.

  • PDF

XML 스키마 매칭 기법을 이용한 구조설계 문서구조 표준화 방법론 (A methodology for the standardization of structural design document structure using XML schema matching technique)

  • 김봉근;정연석;김동현;이상호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2006년도 정기 학술대회 논문집
    • /
    • pp.200-207
    • /
    • 2006
  • A new formal standardization methodology of the structural design document information is proposed in this paper. The standardization process is divided into three steps: pre-process of the collected sample document (CSD), construction of the document structure, and definition of the occurrence of each element in the document. During the pre-process, the detail document contents in the CSD are indexed with templates defined in this study, and the indexed CSD is translated into XML Schema (XSD) formal Afterwards the degree of confidences of all elements between the temporary standard document (TSD) and the translated CSD are calculated by using the XML schema matching algorithm; the TSD is then updated. This second step is repeated until all of the CSD are compared. In the final step, the common elements and unbounded elements are extracted by determining the occurrence of the temporary document elements, and the standardized document schema is exported in the XSD format. The case study dealing with the structural calculation documents show that the ,proposed methodology can be effectively used to build a XML -based information model of structural design documents.

  • PDF

RDBMS에 기반한 XML 문서의 경로 저장과 숫자 매칭 기법 (A Path Storing and Number Matching Technique of XML Documents Based on RDBMS)

  • 봉하익;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.377-380
    • /
    • 2006
  • 최근 XML(eXtensible Markup language) 사용의 증가로 인해 다량의 대용량 XML 문서가 이용되고 있음에 따라, 효율적인 문서 관리를 위한 XML문서의 데이터 모델과 저장 스키마를 어떻게 구현할 것인가에 대한 연구가 활발히 진행되고 있다. 이에 본 논문에서는 관계형 데이터베이스를 기반으로 한 XML문서에 대한 효율적인 저장, 검색 및 관리 기법으로 노드의 텍스트 값이나 속성 값이 존재하는 경로만을 저장하고, 노드 표현에 따라 고유 노드명 식별자(Node Expression Identifier)를 부여함으로써 부여된 노드 식별자를 매칭하는 숫자 매칭(Number Matching)기법을 제안한다. 그리고 이를 입증하기 위해 WPath 질의들에 대한 처리 성능을 기존 방법과 비교함으로써 제안한 방법의 효율성을 제시한다.

  • PDF

XML 스키마 매칭 기법의 교량 구조계산서 적용 방안 (An Efficient Application of XML Schema Matching Technique to Structural Calculation Document of Bridge)

  • 박상일;김봉근;이상호
    • 대한토목학회논문집
    • /
    • 제32권1D호
    • /
    • pp.51-59
    • /
    • 2012
  • 본 논문에서는 실무에서 작성된 교량 상부 구조계산서를 대상으로 문서구조를 분석하고 그 차이점을 찾아낼 수 있는 XML 스키마 매칭 기법을 효율적으로 적용하기 위한 방안을 제시한다. 이를 위해 XML 응용 스키마 매칭 기법의 유사성 측정에 사용되는 요소이름, 부모요소, 형제요소 및 자식요소의 가중치에 대한 매개변수 연구를 30개의 서로 다른 학습용 데이터를 대상으로 수행하여 구조계산서 문서구조 비교에 적합한 가중치를 제시하였다. 또한, 대량의 구성요소를 지니는 구조계산서의 문서구조를 비교할 때 많은 계산시간이 소요되는 단점을 극복하고자 유사성 정량화에 사용할 수 있는 간략 식을 제안하였다. 본 연구에서 제시한 간략 식을 이용한 방법은 그렇지 않은 기존의 연구결과와 비교했을 때 계산시간을 획기적으로 단축시킬 수 있으면서도 거의 유사한 정확도를 나타냄을 알 수 있었으며, 매개변수 연구에서 제시된 최적 가중치를 활용하면 기존 연구성과보다 약 10% 이상 정확도를 향상시킬 수 있음을 확인하였다. 실무에서 사용하는 강교량 상부 구조계산서 20개를 대상으로 실시한 수치실험 결과 본 연구에서 제시된 방법을 이용하는 것은 기존 연구에 비해 문서 구조 파악의 우수한 정확도를 유지하면서 계산시간 측면에서는 구성요소의 수에 따라 4배에서 460배까지 줄일 수 있음을 알 수 있었다.

A Minimum Sequence Matching Scheme for Efficient XPath Processing

  • Seo, Dong-Min;Yeo, Myung-Ho;Kim, Myoung-Ho;Yoo, Jae-Soo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제3권5호
    • /
    • pp.492-506
    • /
    • 2009
  • Index structures that are based on sequence matching for XPath processing such as ViST, PRIX and LCS-TRIM have recently been proposed to reduce the search time of XML documents. However, ViST can cause a lot of unnecessary computation and I/O when processing structural joint queries because its numbering scheme is not optimized. PRIX and LCS-TRIM require much processing time for matching XML data trees and queries. In this paper, we propose a novel index structure that solves the problems of ViST and improves the performance of PRIX and LCS-TRIM. Our index structure provides the minimum sequence matching scheme to efficiently process structural queries. Finally, to verify the superiority of the proposed index structure with the minimum sequence matching scheme, we compare our index structure with ViST, PRIX and LCS-TRIM in terms of query processing of a single path or of a branching path including wild-cards ('*' and '//' ).

대응효율성을 통한 변화 탐지 알고리즘의 성능 개선 (Improving Performance of Change Detection Algorithms through the Efficiency of Matching)

  • 이석균;김동아
    • 정보처리학회논문지D
    • /
    • 제14D권2호
    • /
    • pp.145-156
    • /
    • 2007
  • 최근 웹 문서의 변조의 탐지, 버전 관리 등을 위한 XML/HTML 문서들에 대한 효과적인 실시간 변화탐지 알고리즘의 필요성이 증대하고 있다. 특히 대용량의 XML/HTML 문서들에 대한 실시간 변화탐지 응용들은 최소비용의 편집스크립트를 계산하는 알고리즘 보다는 실시간 처리가 가능한 빠른 휴리스틱 알고리즘들을 필요로 한다. 기존의 휴리스틱 알고리즘들은 실행속도는 빠르나 생성되는 편집스크립트의 질이 만족스럽지 못하다. 본 논문에서는 기존의 알고리즘 XyDiff와 X-tree Diff를 소개하고 이들 알고리즘들의 문제점들을 분석하고 문제점들을 개선한 알고리즘 X-tree Diff+를 제안한다. X-tree Diff+는 실행시간 측면에서 기존 알고리즘들과 유사하나 대응효율성에 기반한 대응과정의 개선을 통해 두 문서 간의 노트들의 대응률을 향상시킨 알고리즘이다.

가지형 패턴의 시퀀스화를 이용한 XML 문서 필터링 (FiST: XML Document Filtering by Sequencing Twig Patterns)

  • 권준호;;문봉기;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권4호
    • /
    • pp.423-436
    • /
    • 2006
  • 최근 XML 문서 필터링에 기반한 출판 -구독 (publish-subscribe) 시스템이 많은 관심을 받고 있다. 전형적인 출판 구독 시스템에서, 구독자들은 XPath 언어로 명세된 프로파일로 자신들의 관심을 표현하고, 새로운 내용들은 사용자 프로파일에 대하여 매칭 여부를 판단하여 관심을 가지고 있는 사용자들에게만 배달된다. 구독자의 수와 그들의 프로파일이 증가할수록, 시스템의 확장성이 출판 구독 시스템의 중요한 성공 요소가 된다. 이 논문에서는 XPath 로 명세된 가지형 패턴과 입력 XML 문서들을 Prufer의 방법을 사용하여 시퀀스로 변환하는 FiST라 불라는 새로운 필터링 시스템을 제안한다. FiST 시스템은 가지형 패턴을 구성하는 선형 경로들에 대하여 각각 매칭을 수행하고 후처리 과정에서 그 결과들을 병합하는 방법을 이용하는 대신에 가지형 패턴 전체를 사용하여 입력 문서에 대하여 매칭을 수행한다. 또한 효율적인 필터링을 위하여 시퀀스들을 해시 기반의 동적 인덱스로 구성한다. 실험 결과를 통해 전체 매칭 접근 방법이 다양한 환경에서 낮은 필터링 비용과 좋은 확장성을 가짐을 알 수 있다.

XML 문서의 자동변환을 위한 효율적인 스키마 매칭 알고리즘 (An Efficient Schema Matching Algorithm for An Automated Transformation of XML Documents)

  • 이준승;이경호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.13-15
    • /
    • 2003
  • 본 논문에서는 XML 문서의 자동변환을 위해 2단계의 상향식 매칭 방법을 제안한다. 제안된 방법은 단말 노드 사이의 유사도 비교를 통해 임계값을 넘는 후보 매칭집합을 결정하고, 단말노드가 포함되어 있는 경로의 유사도 비교를 통해 적절한 일대일 매칭을 추출한다. 특히, 노드 사이의 유사도 비교를 위해 축약어 사전, 일반 동의어 사전, 도메인 온톨로지를 적용한다. 실제 전자상거래용 XML 스키마를 대상으로 실험한 결과 제안된 방법은 평균적으로 97%의 정확률을 보였다.

  • PDF