• 제목/요약/키워드: Semistructured Data

검색결과 35건 처리시간 0.024초

A Semantic Approach to the Design of Valid and Reversible Semistructured Views

  • Chen, Yabing;Ling, Tok Wang;Lee, Mong Li;Nakanishi, Masatake;Dobbie, Gillian
    • Journal of Computing Science and Engineering
    • /
    • 제1권1호
    • /
    • pp.95-123
    • /
    • 2007
  • Existing systems that support semistructured views do not maintain semantics during the process of designing the views. Thus, these systems do not guarantee the validity and reversibility of the views. In this paper, we propose an approach to address the issue of valid and reversible semistructured views, We design a set of view operators for designing semistructured views. These operators are select, drop, join and swap. For each operator, we develop a complete set of rules to maintain the semantics of the views. In particular, we maintain the evolution and integrity of relationships once an operator is applied. We also examine the reversible view problem under our operators and develop rules to guarantee that the designed views are reversible. Finally, we examine the changes in the participation constraints of relationship types during the view design process, and develop rules to ensure the correctness of the participation constraints.

메타데이타 인터페이스를 이용한 분산된 반구조적 문서 검색을 위한 질의처리 알고리즘 설계 및 구현 (Design and frnplernentation of a Query Processing Algorithm for Dtstributed Semistructlred Documents Retrieval with Metadata hterface)

  • 최귀자;남영광
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권6호
    • /
    • pp.554-569
    • /
    • 2005
  • 반구조적 분산 문서에서는 구조 정보가 제공되지 않고, 자료 구조에 대한 엄격한 형식이 없기 때문에 질의 처리 시스템을 정형화하고 구현하기 어렴다. 이질적이고 이구조적인 반구조적 문서의 요소를 정확하게 검색하기 위해서는 한 요소가 1:1, 1:N, W:1과 같이 서로 다른 매핑 형태를 취하면서 동시에 여러 요소에 매핑되는 다중 매핑을 처리할 수 있어야 하며, 지역문서의 태그를 파싱하여 구조적인 정보를 얻고 경로 트리를 생성해야 한다. 본 논문에서는 분산된 시스템에 존재하는 이질적인 반구조적 자료나 문서에 대한 동시 다중 매핑을 완벽히 지원하고, 문서 자체를 파싱하여 구조적 정보를 얻을 수 있도록 통합 질의와 검색을 수행하기 위한 추상적인 질의 처리 알고리즘을 설계하고 메타데이타 인터페이스를 이용하여 구현하였다. 이 알고리즘은 전역질의를 기반으로 지역질의를 생성하기 위해서 메타데이타 정보를 이용하여 노드들 사이의 매핑, 매핑 종류에 따른 데이타의 변환, 경로교체 및 노드 사이의 이질성을 해결하기 위한 알고리즘으로 제시하였다. 전역스키마와 지역스키마에 대한 매핑과 함수에 의한 데이타의 변환 및 경로교체는 사용자에 의해 구축된 메타데이타 인터페이스인 DDXMI(for Distributed Documents XML Metadata Interface)를 기반으로 하여 구현되었으며, 같은 이름을 갖지만 다른 의미를 갖는 자료나 노드에 대한 검색은 노드를 구분할수 있는 노드가 가지고 있는 자식정보를 이용하여 노드 구분 조건절을 생성하여 구현하였다. XML 질의언어로 Quilt를 사용하였으며, OEM 모델로 제시한 세 개의 서로 다른 반구조적 레스토랑 안내 문서에서구현한 결과를 보였다. 프로토타입 시스템은 윈도우즈 환경에서 Java와 JavaCC 컴파일러를 이용하여 개발하였다.

COVA: 내용 기반 강의 검색을 지원하는 원격 학습 시스템 (COVA: A Distance Learning System supporting Content-based Lecture Retrieval)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.99-107
    • /
    • 2004
  • 인터넷, 데이타베이스, 멀티미디어 기술의 복합적인 영향으로 교육과 학습의 형태가 크게 변하고 있다. 그러나 강의 내용을 효과적으로 관리하고 검색할 수 있는 시스템과 도구의 부족으로 원격 학습은 크게 효과적이지 못하다. 이 논문은 대용량 강의 데이타베이스에서 사용자가 내용에 기반 하여 관심 있는 강의 부분만 발췌하여 접근할 수 있도록 하는 프로토타입 시스템 COVA를 소개한다. COVA는 원격 학습에서 내용 기반 강의 검색을 위한 다음과 같은 새로운 기법을 포함한다: (1) 강의 내용을 표현하기 위한 XML 기반의 준 구조적(semistructured) 데이타 모델, (2) XML 강의 데이타베이스의 구조적 요약, 즉, 스키마 추출 기법: (3) 원하는 강의 부분의 빠른 탐색을 위한 색인 기법.

객체-관계형 데이터베이스를 이용한 XML 문서 저장 기법 (Storage Techniques Using an Object-Relational Database for XML Documents)

  • 이월영;용환승
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.305-316
    • /
    • 2004
  • XML은 그 스키마가 비정규적이고 불완전한 특성을 가지고 있는 반구조적(semistructured) 데이터로써 인터넷 상의 데이터를 교환하기 위한 사실상의 표준이 되고 있다. 따라서 이러한 데이터를 효율적으로 다루기 위해서는 어떠한 저장장치에 어떠한 방식으로 저장하느냐가 중요한 요인이 된다. 본 연구에서는 기존의 객체-관계형 데이터베이스의 장점을 활용하면서도 DTD에 상관없이 XML 질의 언어에서 요구하는 다양한 질의 종류를 지원할 수 있는 저장 기법을 개발하였다. 이 기법은 XML 데이터 모델의 비정규적인 특성 때문에 발생할 수 있는 오버헤드를 최소화시키고 현존하는 데이터와 자연스럽게 연계할 수 있다.

DTD를 이용한 XML 데이타에 대한 질의 최적화 기법 (The Query Optimization Techniques for XML Data using DTDs)

  • 정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.723-731
    • /
    • 2001
  • XML이 웹상에서 정보 교환의 표준으로 채택되면서 XML을 데이타베이스의 데이타로 보고 정보를 추출하는 분야가 주목받고 있다. XML은 그래프 기반의 비정형 데이타(semistructured data) 모델 과 매우 비슷하기 때문에 XML 데이타를 그래프 기반의 비정형 데이타 모델로 매핑한 후, 이에 대하여 질의를 처리할 수 있다. 본 논문에서는 XML 데이타에 대하여 스키마 정보를 가지는 DTB(Document Type Definition)를 이용한 질의 최적화 기법을 제안한다. 제안하는 기법은 인덱싱 효과를 내면서도 기존 방법에 비하여 부가의 메모리를 적게 필요로하고, 입력 데이타의 구조를 그대로 유지하기 때문에 다양한 형태의 질의를 효율적으로 처리할 수 있다. 간단한 예제 데이타베이스에 대하여 제안하는 기법의 실험 결 과를 보였다.

  • PDF

준구조적 데이타베이스에서의 정규경로표현 최적화를 위한 질의전지 기법 (A Query Pruning Technique for Optimizing Regular Path Expressions in Semistructured Databases)

  • 박창원;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권3호
    • /
    • pp.217-229
    • /
    • 2002
  • 정규경로표현은 전통적 스키마를 가정하지 않는 준구조적 데이타에 대해 질의를 고안하기 위한 기본적 질의 요소이다. 그리고 질의전지는 정규경로표현의 처리에 있어 불필요한 탐색을 제거하기 위한 중요한 최적화 기법이다. 그러나 기존 질의전지는 다중 정규경로표현들은 완전히 최적화하지 못하는 경우가 많으며, 기존 질의전지의 결과를 후처리하는 기존의 방법은 지수적으로 증가하는 많은 부분결과들의 조합들을 확인해야 한다. 본 논문에서는 전처리 단계와 전지 단계로 구성된 두 단계 질의전지라 부르는 새로운 기법을 소개한다. 우리의 두 단계 질의전지는 다중 정규경로표현의 최적화에 효과적이며, 지수적으로 증가하는 많은 부분결과들의 조합들을 화인하지 않는다는 점에서 기존의 방법보다 더 확장성이 있다.

DTD가 없는 XML 데이터의 효율적인 저장 기법 (An Efficient Technique for Storing XML Data Without DTD)

  • 박경현;이경휴;류근호
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.495-506
    • /
    • 2001
  • XML이 인터넷상의 데이터 교환의 표준으로 대두되면서 데이터 모델이나 플랫폼에 관계없이 데이터의 전송이 가능하게 되었다. 특히 데이터 중심의 XML문서의 경우 전송시의 부하를 줄이기 위해 DTD 없이 전송되는 경우가 일반적이다. 그러한 이유로 전송받은 XML 데이터를 효율적으로 저장하고 질의를 최적화하며 또한 관계형 데이터베이스에 저장된 기존의 데이터를 XML 형태로 출력하기 위해서는 DTD가 없는 XML 문서로부터 관계형 스키마의 추출이 필수적으로 요구된다. 따라서 이 논문에서는 반구조적 데이터의 스키마 추출기법인 최대/최소 경계 스키마 추출 기법을 이용하여 DTD가 없는 XML문서로부터 관계형 스키마를 생성하고 이를 바탕으로 XML 데이터를 저장하는 방법으로 제시한다. 특히, 반구조적 데이터 최소 경계 스키마를 추출하는데 있어서 기존의 데이터로그보다 효율적인 방법인 시뮬레이션을 제안함으로써 관계형 스키마를 생성하는데 있어서 보다 향상된 방법을 보여준다.

  • PDF

XML 문서 관리 및 질의를 위한 웹 기반의 도구 설계 및 구현 (Implementation of a Web-based xml query report ing tool)

  • 박유림;이민수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.193-195
    • /
    • 2004
  • 데이터베이스에 저장된 수많은 자료들을 사용자의 질의에 맞추어 웹상에서 표현해주는 것이 바로 리포팅 툴의 역할이다. 그에 관한 연구들로 BBQ(Blended Browsing and Querying), EASY BASE, QURSED(Querying and Reporting Semistructured Data)와 같은 여러 리포팅 툴들이 상용화되어 있다. 하지만 사용자가 보다 쉽고 직관적으로 XML 문서를 작성하고 관리할 수 있는 툴들은 미흡한 것이 사실이다. 이 논문에서는 XML과 XSL문서를 각각 그룹핑하고 직관적인 구조로 표현 해주며 사용자의 관점에 맞추어 XQuery를 지원하는 시스템을 설계 구현하였다.

  • PDF

웹 컨텐트 저장소 (Design of Web Content Model)

  • ;구흥서
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1915-1918
    • /
    • 2002
  • Managing semistructured data needs fine granularity such as markup elements. XML has major effect in managing web content, it enables content reusability, enriches information with metadata, ensures valid document links, etc. We introduce our content model as an integrated work which handles content objects as controllable units. The paper concerns on modeling news site and how the content is classified due to the site structure, aggregated content and reusability. The model stores instance XML document into relation database using fragmentation strategy.

  • PDF

빈발 패턴 탐사 기법을 이용한 반구조적 데이터로부터의 공통구조 추출 (Extracting Common Structure of Semistructured data Using mining frequent patterns)

  • 이영언;문봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.302-304
    • /
    • 2000
  • 인터넷의 발달로 웹에는 엄청난 데이터가 존재하나, 불규칙적인 구조를 이루고 있는 반구조적 데이터가 대부분이다. 이러한 반구조적 데이터는 데이터들간의 어떤 정확하게 정해진 구조를 갖고 있진 않지만 불완전하고 불규칙한 구조 정보를 포함하고 있는 것으로, 데이터들 간의 관계를 규명할 수 있는 공통 구조 정보를 추출하여 효과적으로 구조화시킴으로써 정보로서의 가치를 높일 필요성이 대두되게 되었다. 또, 데이터 처리 과정에서 기존의 잘 정의된 구조를 가진 데이터베이스의 장점을 수용하기 위해서는 반구조적 데이터 집합의 불완전한 구조 정보로부터 공통 구조를 추출하는 것이 요구된다. 본 연구에서는 후보 항목 집합의 생성이 없는 빈발 패턴 탐사 기법을 사용하여 반구조적 데이터 집합으로부터 공통구조를 추출하고자 한다.

  • PDF