• 제목/요약/키워드: XML 구조

검색결과 1,242건 처리시간 0.023초

2D-THI: XML 데이테베이스를 위한 이차원 타입상속 계층색인 (2D-THI: Two-Dimensional Type Hierarchy Index for XML Databases)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제9권3호
    • /
    • pp.265-278
    • /
    • 2006
  • 본 논문에서는 XML 데이터베이스의 타입상속 계층에 대한 색인기법으로 이차원 색인구조를 이용하는 이차원 타입상속 색인기법인 2D-THI를 제안한다. XML 스키마는 타입상속을 지원하는 XML 문서를 위한 스키마 모델 중에 하나이다. 기존의 XML 데이터베이스를 위한 색인기법은 XML 스키마상의 타입상속 계층에 대한 XML 질의를 지원하지 못한다. 따라서 본 논문에서는 XML 질의의 타입상속 계층을 지원하기 위한 색인기법으로 다차원 파일구조를 이용하는 이차원 색인구조를 구성한다. 이차원 색인구조에서 한 축은 색인된 엘리먼트의 킷값 도메인으로 구성하고 다른 한 축은 타입상속 계층의 타입 식별자 도메인으로 구성한다. 이와 같은 이차원 색인구조를 이용함으로써 사용자 질의 패턴에 따라 두 도메인 사이에서 객인 엔트리들의 클러스터링 정도를 조정함으로써 질의처리의 성능을 향상시킬 수 있다. 본 논문에서 제안한 2D-THI의 성능 평가를 위하여, 비용 모델을 개발하고 이를 통하여 2D-THI를 기존의 객체지향 데이터베이스에서 사용하고 있는 CH-index와 CG-tree와 같은 클래스 계층 색인기법들과 색인의 성능을 비교평가 한다. 성능평가의 결과로서, CH-index와 CG-tree에서는 특정 형태의 XML 질의의 경우에만 좋은 성능을 보인 반면, 본 논문에서 제안한 2D-THI에서는 주어진 질의 형태에 따라 최적의 질의처리 성능을 제공할 수 있음을 보인다.

  • PDF

데이터마이닝 기법 적용을 위한 공용 XML 구조 추출 알고리즘 (Common XML Structure Extracting Algorithm for Applying Data Mining Techniques)

  • 장민석;방현진
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.1072-1076
    • /
    • 2005
  • 현재 구조화된 데이터 표현의 표준으로 XML 언어가 일반화되고 있는 경향으로 인해 데이터 마이닝 대상으로서의 XML의 중요성이 점증하고 있는 실정이다. 특히 XML 문서에 연관규칙(association rule)을 적용함으로써 원하는 정보를 추출하는 연구가 진행되어 왔다. 하지만 마이너가 유사한 XML 문서들로부터 효율적으로 정보를 얻어내는 방법에 대한 문제에 대해서는 별 진전이 없었다. 본 연구에서는 다양한 XML Schema를 적용하는 유사한 XML 문서들로부터 공용 XML 구조를 추출하는 방법을 제안하고자 한다. 이러한 공용 XML Schema는 다양한 XML 구조를 단일화함으로써 우리가 원하는 정보를 정확하고 효율적으로 얻어낼 수 있도록 도와주는 데이터 마이닝의 사전 작업으로서 중요하다고 판단된다. 본 논문에서는 다양한 XML Schema를 적용하는 유사한 XML 문서들로부터 공용 XML 구조를 추출하는 방법을 제시한다.

  • PDF

관계 데이터베이스를 이용한 XML 문서 저장시스템 설계 (Design of a Storage System for XML Documents using Relational Databases)

  • 신병주;진민;이종학
    • 한국멀티미디어학회논문지
    • /
    • 제7권1호
    • /
    • pp.1-11
    • /
    • 2004
  • 본 논문에서는 관계 데이터베이스를 이용한 XML 문서 저장시스템을 제안한다. XML 구조와 관계 데이터 베이스 스키마의 구조적 불일치로 인하여 XML 문서의 저장을 위해서는 별도의 처리과정이 필요하다. 본 연구에서는 DTD가 있는 XML 문서의 관계 데이터베이스 저장을 다루고 있다. 기존의 Shared Inlining 방법과 Hybrid Inlining 방법을 보완한 릴레이션의 단편과 과도한 조인 연산을 줄여주는 Association Inlining 방법을 제안하고 실제 실험을 통하여 성능이 개선되었음을 보인다. DTD를 단순화시켜 이로부터 저장구조 정보를 추출하고 관계 데이터베이스의 저장구조로 사상시키기 위하여 기존의 맵 클래스를 확장하였다. XML 문서의 분석을 통하여 다중값 엘리먼트, 여러 개의 상위 엘리먼트를 갖는 엘리먼트, 순환 구조를 갖는 엘리먼트 등 다양한 형태의 구조에 대해 맵 클래스를 정의하였으며 추출 저장구조 정보와 맵 클래스를 이용하여 XML 형태의 맵 파일을 생성한다.

  • PDF

ODMG 객체 모델 기반의 XML 문서 저장 관리 시스템에 관한 연구 (A Study on XML Document Repository Management System using ODMG Object Model)

  • 박준범;박경우;오수열
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.16-23
    • /
    • 2003
  • XML 문서의 저장 및 관리를 위해, 기존의 관계형 DBMS를 이용해왔다. 그러나 관계형 DBMS를 이용할 경우 XML 문서 구조를 관계형 데이터베이스로 매핑할 때, 정보 손실이 발생할 수 있으며, XML의 특성을 완벽히 반영하는 새로운 저장 관리 시스템을 새로이 구현하는 것은 많은 비용이 소요된다. 본 논문에서는 이러한 문제점을 극복하고, XML문서의 구조적 특성을 충분히 반영하기 위해, 기존의 객체지향형 DBMS인 O2 DBMS를 기본 저장 구조로 이용하면서, XML문서가 가지고 시는 다양한 특징을 수용할 수 있도록 하는 XML문서 저장 관리 시스템을 설계하고 구현하였다. 구현한 XML문서 관리 시스템 기능들로서는 전자 문서에 대한 라이브러리 서비스 기능(체크인/체크아웃, 버전제어, 사용자 액세스 관리 등), 동적 색인 및 구조 정보 검색 기능. 스타일시트를 이용한 출판 기능을 하는 XML문서 저장 관리 시스템이다.

  • PDF

객체모델을 이용한 XML DTD의 ORDB 스키마로의 변환 (Transformation from XML DTD to ORDB Schema using Object Model)

  • 이상태;주경수
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.303-310
    • /
    • 2001
  • XML은 웹에서 데이터 교환을 위한 마크업 언어로 반-구조화된 정보나 구조화된 정보를 교환하고 저장할 수 있으며, 표준언어로 채택되어 가고 있고, 강력한 표현력을 가지고 있기 때문에 다양한 애플리케이션을 가능하게 한다. 문서와 객체가 구조화 될 수 있는 방법을 제공하는 XML은 계층적 구조로 이루어진다. ORDB에서는 스키마 객체들이 계층적 구조로 구성되어 하나의 큰 객체를 이룬다. XML과 ORDB 사이에 단순한 XML 문서는 직접 변환이 가능하나 복잡한 XML 문서를 다룰 때는 객체 기반 변환 방법으로 처리되어야 한다. 따라서 본 논문에서는 XML DTD를 객체로 변환하고 변환된 객체를 ORDB 스키마로 변환하는 방법에 대하여 연구하였다.

  • PDF

XML 문서 검색을 위한 한국어 질의 처리 시스템 (Korean Query Processing System for XML Document Retrieval)

  • 박춘용;이현영;윤보현;강현규;이용석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.161-163
    • /
    • 2000
  • 인터넷 문서의 표준 사양인 XML 문서가 늘어나면서 XML 문서를 효과적으로 관리고 검색하기 위한 시스템이 개발되고 있다. 그러나 정형화된 질의언어를 사용한 XML 문서의 검색 방법은 질의언어의 구조를 이해하고 사용법을 숙지해야 하는 어려움이 있어 일반 사용자에게는 적합하지 않다. 따라서 사용자가 쉽게 사용할 수 있으면서도 정확한 결과를 가지는 시스템이 요구된다. 본 논문에서는 XML 문서를 검색하기 위해 자연어로 질의를 입력하면 이를 XML 구조 검색을 위한 XQL 언어로 자동 변환해 주는 시스템을 제안한다. 제안한 시스템은 자연어를 이용하기 때문에 사용하기가 쉽고 XML 문서 구조가 변경되어도 쉽게 확장할 수 있는 장점을 가진다.

  • PDF

통합 DTD를 이용한 폼(Form) 기반 XML 편집 및 변환 시스템 개발 (Development of a Form-based XML Editing and Converting System Using Integrated DTD)

  • 손원성;이현찬;김재경;최윤철;유범종
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.3-7
    • /
    • 2000
  • 전자문서를 정의하기 위해서는 구조문서 정의가 가능한 SGML(Standard Generalized Markup Language) 및 XML(eXtensible Markup Language), 그리고 웹문서를 위한 HTML을 이용할 수 있다. 그러나 SGML은 매우 복잡한 구문을 포함하기 때문에 일반 사용자들이 쉽게 사용하기가 어렵고 HTML은 비 구조적인 문서정보 및 스타일 정보를 포함하기 때문에, 근래에 개발된 대부분의 전자문서 시스템에서는 XML을 응용하고 있다. 전자문서 시스템은 복잡한 구조의 다양한 문서들을 포함하고 있으며 이러한 문서들은 DTD를 정의하고 있기 때문에 DTD의 구조 정의 및 관리가 매우 비효율적이다. 따라서 본 연구에서는 다양한 구조를 모두 표현할 수 있는 통합 DTD를 정의하고 이를 효율적으로 관리 및 처리하기 위한 폼 기반 구조문서 처리 방법을 제안한다. 통합 DTD와 폼을 통하여 사용자는 폼 단위의 문서 인스턴스만을 입력 및 편집함으로써 복잡한 DTD 구조에 독립적으로 문서를 처리할 수 있으며, 처리된 문서는 DTD에 위배되지 않는 정확한 XML 인스턴스가 된다. 또한 기존의 HTML문서를 XML로 변환하기 위하여 본 논문에서는 누구나 손쉽게 사용할 수 있는 중간단계(semi-auto)의 XML 변환시스템을 제공한다. 그 결과 본 연구에서 개발한 시스템에서는 다양하고 복잡한 문서에 대하여 효율적인 문서구조가 가능하고, XML문서를 폼을 이용하여 누구나 쉽고, 정확하게 작성할 수 있다. 그리고 웹에서 사용된 HTML 문서를, 본 연구에서 정의한 통합 DTD구조에 일치하는 XML 문서로 간단히 변환할 수 있다.

  • PDF

개념적 모델로의 XML 스키마의 역변환 기법 (Reverse Engineering of XML Schema to Conceptual Model)

  • 정인환;김영웅
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.211-216
    • /
    • 2017
  • XML은 데이터의 표현 및 교환의 사실상 표준으로 자리 잡고 있으며, XML 자체가 데이터를 저장, 관리하기 위한 구조로 되어있지만, 다양하고 복잡한 표현으로 인해 문서 구조를 한 눈에 파악하기에는 어려운 점이 있어 개념적 모델의 도구로 사용하기 적절하지 못한 점이 있다. 본 논문은 XML 스키마 문서 구조를 보다 쉽게 이해할 수 있도록 개념적 모델로 변환하는 기법을 제안한다. 이를 위해 개념적 모델 도구로 사용한 CMXML을 기술하고, XML 스키마 구조를 CMXML 다이어그램으로 변환하기 위한 변환 규칙과 자료구조를 제시한다. 변환절차는 XML 스키마 문서를 입력받아 본 연구에서 제안하는 변환기법을 적용하여 CMXML 다이어그램을 생성한다.

조상-자손 관계 탐색을 지원하기 위한 XML 타입상속 색인구조의 계층적 구성기법 (XML Type Inheritance Index Hierarchies for Supporting Ancestor-descendant Exploration)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제15권9호
    • /
    • pp.1133-1148
    • /
    • 2012
  • 본 논문에서는 XML 데이터베이스에서 XML 질의처리를 효율적으로 지원하기 위한 다차원 타입상속 색인구조(MD-TIX)들의 계층적 구성기법을 제시한다. MD-TIX는 중첩요소와 여러 타입상속 계층으로 이루어진 중첩술어의 조상-자손 관계 탐색을 효율적으로 지원하기 위하여 다차원 색인구조를 이용하는 색인기법이다. 그러나 이러한 MD-TIX는 질의에 주어진 Xpath의 길이가 긴 경우에 색인 엔트리의 구성문제 때문에 색인구조의 구축과 유지관리에 어려움이 있다. 이를 극복하기 위해서, 본 논문에서는 먼저 주어진 Xpath에서 인접한 두 타입 사이의 직접 관계 탐색을 지원하는 기본 색인구조들을 구축하고, 이들을 바탕으로 Xpath상의 임의의 두 타입 사이의 간접 관계 탐색을 지원하는 유도 색인구조들을 구축한다. 이러한 과정을 전체 길이의 Xpath를 지원하는 하나의 목표 색인구조를 구축하기까지 계층적으로 구성하는 방법을 제시한다. 또한 Xpath 상에 주어진 몇 개의 부경로 탐색만을 지원하기 위한 부분적인 색인계층을 효율적으로 구축하기 위한 알고리즘을 제안한다.

다중 문서에서 구조 정보를 이용한 XML 조인 질의 처리 (XML Join Query Processing using Structured Information from Multiple Documents)

  • 정성호;김병곤;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.100-102
    • /
    • 2002
  • XML 문서에 대한 다양한 질의를 위해서 W3C에서는 XQL, XML-QL, XML-GL, XQUERY와 같은 질의어를 제안하였다. 이들 질의어는 다양한 질의 유형의 분류와 표현은 가능하나, 조인 질의의 경우 단순 조인 질의만을 지원할 뿐, XML 문서의 구조나 텍스트 정보의 유사성을 이용한 보다 다양한 조인 질의에 대한 연구가 미비하였다. 본 논문에서는 다중 문서에 대한 조인 질의를 체계적이고 효과적으로 표현하기 위해, 문서에 대한 조인 질의를 여러 타입으로 분류하였다. 또한 효율적인 질의처리를 위하여 다양한 일반 조인 질의 및 정보검색 기능을 지원하는 유사성 조인 연산자(similarity join operator), 순수 구조 기반 조인을 지원하는 구조 조인 연산자(structured join operator)를 지원하도록 XML 질의어인 QUILT를 확장하였다. 특히, 구조 정보만을 이용한 질의시 구조의 깊이(depth)정보를 이용하여 사용자의 요구에 맞게 질의 검색 범위를 설정하고, XML 문서에 대한 질의 문을 좀더 간결하게 표현할 수 있도록 설계하였다.

  • PDF