• 제목/요약/키워드: XML Data Processing

검색결과 396건 처리시간 0.025초

XML 데이타 처리를 위한 XML-QL to SQL 번역기 (An XML-QL to SQL Translator for Processing XML Data)

  • 장경자;이기호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권1호
    • /
    • pp.1-8
    • /
    • 2002
  • XML이 다양한 유형의 웹 데이타를 구성하고 교환하기 위한 국제적인 표준으로 제안되었다. 다양한 애플리케이션에서 필요로 하는 데이타가 XML 문서에 저장되어 있을 때, 그 데이타를 검색하는 것은 중요한 일이다. 본 논문에서는 XML 문서를 관계형 데이타베이스 시스템에 저장하는 방법과 저장된 XML 데이타를 XML-QL로 질의하여 검색하는 방법을 제안한다. 즉, XML의 저장 방법을 제안하고 저장된 XML 데이타를 검색하기 위해 XML-QL로 들어온 질의를 관계형 데이터베이스 시스템의 전용 질의 언어인 SQL로 변환시켜 주는 번역기를 설계 및 구현한다. 본 논문의 의의는 번역기에 대한 설계와 구현을 자세히 기술하므로 번역기의 가능성을 보여주고 XML 질의의 포괄적인 분류와 그에 대한 SQL 관계형 질의로의 매핑을 보여주고 있다는 점이다.

분할된 역 인덱스 테이블에서 부모노드의 정보를 이용한 질의 처리 (Query Processing using Information of Parent Nodes in Partitioned Inverted Index Tables)

  • 김명수;황병연
    • 한국멀티미디어학회논문지
    • /
    • 제11권7호
    • /
    • pp.905-913
    • /
    • 2008
  • 최근 XML(Extensible Markup Language) 사용의 증가와 함께 다량의 이질적 구조를 가진 XML문서들이 이용되고 있으며, 이러한 XML문서들의 효율적인 관리를 위해 데이터 저장 구조에 대한 연구의 필요성이 증가하고 있다. 이에 따라 본 논문에서는 이들 XML 문서들의 효율적인 관리를 위하여 분할된 역 인덱스 테이블에서 부모노드의 정보를 이용하여 질의를 처리하는 방법을 제안한다. 이질적 구조를 가진 대규모의 문서들에 대한 질의 처리 횟수와 처리 데이터 량은 검색 성능에 큰 영향을 주기 때문에 데이터 구조를 설계할 때에 이 두 가지 요소들을 신중히 고려해야 한다. 제안된 방법은 부모 노드의 정보를 이용하여 선형 경로 질의를 위한 질의 처리 횟수를 반감시키고, 역 인덱스 테이블을 XML 트리의 깊이에 따라 적절히 분할하여 탐색 대상이 되는 데이터의 양을 줄이기 때문에 XML 문서에 대한 검색 성능을 향상시킨다. 제안하는 방법의 효율성을 입증하기 위해 인터넷에서 수집한 XML 문서들에 대한 XPath 질의 처리 성능이 기존의 역 색인 기법들에 비해 우수함을 보인다.

  • PDF

스키마 구조 데이타 매핑을 이용한 XML 구조변환 시스템 (An XML Structure Translation System using Schema Structure Data Mapping)

  • 송종철;김창수;정회경
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권5호
    • /
    • pp.406-418
    • /
    • 2004
  • 최근의 데이타 처리 환경은 빠르게 변화하고 있다. 특정 단체나, 기업 내에서 상호운용에 대한 고려 없이 서로 다른 목적에 의해서 개별적으로 도입되었던 여러 어플리케이션이나 시스템 등은 유연하고 빠른 처리를 위하여, 프로세스 차원에서 통합되고 연동되어야 할 필요성이 대두되고 있다. 추가 비용을 최소화하면서 통합에 대한 요구를 충족시킬 수 있는 좋은 방법 중 하나는 모든 플랫폼에서 사용 가능한 장치 비종속적인 데이타 형식이고 W3C(World Wide Web Consortium)의 문서 변환 표준인 XSLT (eXtensible Stylesheet Language Transformation)를 이용하여 필요에 따라 다른 형식의 데이타로 변환이 용이한 XML(extensible Markup Language)을 중심으로 통합하는 것이다. 이에 본 논문은 XML 문서의 구조적 정보를 정의하는 XML 스키마(Schema)를 통해 데이타를 제공하는 원본(Source)측과 데이타를 처리하고자 하는 목적(Destination)측의 구조를 나타내고, 이러한 구조정보와 데이타 매핑(Mapping)을 통해 원하는 형태의 구조관계를 정의하며, 정의된 정보를 기반으로 두 구조간의 변환 규칙을 정의한 XSLT 문서를 생성하는 XML 구조 변환 시스템을 설계하고 구현한다. 이렇게 생성된 XSLT 문서를 통해 데이타 처리를 필요로 하는 목적 측의 구조에 맞게 데이타가 재구성 되도록 변환한다. 이렇게, 특정 시스템이나 플랫폼과 관계없이 다양한 구조의 문서를 적용할 수 있게 되고 원하는 형태로의 의미 부여가 가능한 XSLT 문서를 생성하고, 이를 통한 문서간의 변환 처리를 제공하여 데이타의 상호 운용성(Interoperability) 및 확장성을 높이고 XML 문서처리 환경 구축에 기여하는데 목적을 두고 있다.

Extracting OWL Ontology from XML instances via XML Schema

  • Pham, Thi Thu Thuy;Lee, Young-Koo;Lee, SungYoung
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.801-802
    • /
    • 2009
  • Currently, XML and its schema language have become the standard for data representation and information exchange format on the current web. Unfortunately, problems happen when integrating different data sources since XML mainly supports the document structure but lack consideration on sharing knowledge of data. Meanwhile, Semantic Web technologies, such as Web Ontology Language (OWL), can include the structure as well as the semantics of the data. Therefore, finding a way to integrate XML data as OWL ontology receives a high interest nowadays. In this paper we present a mapping notation to convert XML Schema to OWL domain knowledge and an effective method to transform XML instances into OWL individuals. While keeping the XML original structure, our work also adds more semantics for the XML document. Moreover, whole of the transformation processes are done automatically without any user interference. Further, our transforming approach provides the solution for duplicate element names in XML document which has not mentioned in the previous work. Our results in existing OWL syntaxes can be loaded immediately by OWL editors and Semantic Web applications.

XML 데이타를 위한 객체지향 데이터베이스 스키마 및 질의 처리 (Object-Oriented Database Schemata and Queiy Processing for XML Data)

  • 정태선;박상원;한상영;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권2호
    • /
    • pp.89-98
    • /
    • 2002
  • XML이 웹상에서 정보 교환의 표준으로 채택되면서 XML을 데이타베이스의 데이타로 보고 정보를 추출하는 분야가 주목받고 있다. 특히 최근에는 기존의 DBMS 시스템에 XML 데이타를 저장하여 기존의 DB 엔진으로 XML 질의를 처리하는 분야가 많이 연구되고 있다. 이때 주로 관계형 DBMS를 사용하는 연구가 많이 시도되고 있다. 본 연구에서는 객체 지향 데이타베이스 시스템이 XML 데이타를 저장하고 질의를 처리하는 또 하나의 해법이 될 수 있음을 보인다. 제안하는 방법은 XML의 DTD로부터 OODB의 클래스를 생성하고 이 클래스에 대하여 XML 질의를 수행한다. 특히, XML 데이타의 비정형적인 성질이 OO 모델의 계승(inheritance)을 이용하여 표현되어 질의 처리시에 유용하게 사용될 수 있음을 보인다.

PKI 기반의 효율적인 분산처리 Point of sales 시스템에 관한 연구 (A Study on Efficient Distributed Data Processing POS System of PKI Based)

  • 강민균;김석수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 추계 종합학술대회 논문집
    • /
    • pp.200-204
    • /
    • 2005
  • 유통망에서 핵심이 되는 공급망 관리와 고객관리의 전산화 기반인 되는 POS 시스템을 유비쿼터스 개념의 도입으로 인한 데이터 통합을 위하여 XML을 이용하여 데이터베이스를 구축하고 XML의 단점인 보안을 위하여 공개키 기반구조의 인증서 기법과 보안의 표준인 XML-Encryption을 이용하여 분산처리 POS 시스템을 설계하였다. 이러한 POS 시스템은 높은 이식성, 데이터 전송의 효율성, 데이터 처리 속도의 향상, 데이터의 보안성 등의 장점을 가진다.

  • PDF

XML문서를 위한 족보 기반 인덱싱 기법 (Genealogy-based Indexing Technique for XML Documents)

  • 이월영;용환승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.72-81
    • /
    • 2004
  • 오늘날 인터넷 상의 많은 데이타들은 XML의 여러 장점들로 인하여 XML을 이용하여 표현되고 있다. 이렇게 XML 데이타가 늘어가는 것에 비례하여 XML 문서상에서 유용한 정보를 검색하기 위하여 다양한 질의를 빠르고 효율적으로 지원할 수 있는 질의 처리 기법이 요구되고 있다. 그러나 현재까지는 XML 데이타를 위한 질의 최적화 연구는 정규 경로 표현을 다루는 방법론에 국한되어 있다. 본 논문은 새로운 족보 기반 인덱싱 기법을 개발하여 정규 경로 표현뿐 아니라, 단순 경로 표현과 다른 엘리먼트를 참조하고 있는 경로 표현과 같은 다양한 질의 처리를 해결하였다. 또한 이 인덱싱 기법을 객체-관계형 모델에 적용하여 여러 종류의 문서와 다양한 질의 종류에 대해 성능을 평가하였고, 다른 저장 기법과 비교하여 성능의 우수성을 입증하였다.

자원 효율적인 XML 조각 스트림 질의 처리를 위한 XML 분할 (XML Fragmentation for Resource-Efficient Query Processing over XML Fragment Stream)

  • 김진;강현철
    • 정보처리학회논문지D
    • /
    • 제16D권1호
    • /
    • pp.27-42
    • /
    • 2009
  • 유비쿼터스 컴퓨팅의 실현을 위해서는 이동 디바이스 등 클라이언트의 제약된 자원을 효율적으로 사용하는 기법이 요구된다. 메모리 용량이 크지 않은 이동 디바이스의 경우, 대용량 XML 데이터에 대한 질의 처리를 수행하기 위해서는 XML 스트림 질의 처리 기술의 활용이 필수적이다. 최근에 서버에서 XML 문서를 XML 조각(XML fragment)으로 분할하여 스트리밍하고 클라이언트에서 이 조각 스트림을 받아 질의를 처리하는 기법들이 제안되었다. XML 조각 스트림 질의 처리에 있어 XML 문서가 분할되는 방법에 따라 자원 사용(질의 처리 시간 및 메모리 사용량) 면에서 큰 차이가 날 수 있기 때문에 효율적인 XML 문서 분할 방법이 요구된다. 본 논문에서는 클라이언트의 질의 처리 시 자원 사용 효율을 높이기 위한 XML 문서 분할 기법을 제시한다. 이를 위하여 먼저 XML 조각 스트림 질의 처리의 비용 모델을 제시하고, 자원 효율적인 XML 문서 분할 알고리즘을 제시한다. 구현 및 성능 평가 결과 본 논문에서 제시한 기법이 기존 기법들에 비해 질의 처리 시간 및 메모리 사용량 양면 모두에서 우수한 것으로 나타났다. 본 논문의 기여는 XML 조각 스트림 질의 처리 기술의 실용화 가능성을 기존 기술에 비해 한 층더 높였다는 데 있다.

Nested Interval 을 이용한 XML 문서의 저장 및 질의 기법 (Nested Interval Encoding with Continued Fractions for XML Storage & Retrieval)

  • 송용호;나갑주;이상원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.27-30
    • /
    • 2005
  • XML(Extensible Markup Language)이 데이터 표현(data representation)과 문서 교환(data exchange)의 표준으로 지정됨에 따라 데이터베이스(database, DB)에 XML 문서를 저장하고 질의하기 위한 연구가 활발히 진행되고 있다. 특히, 현재 주류를 이루고 있는 관계형 DB 에 저장하기 위한 XML 인덱싱(indexing) 기법에 대한 연구도 다양하게 진행되고 있다. 본 논문에서는 XML 문서를 관계형 DB 에 효율적으로 저장하고 질의하기 위한 방법으로서 기존의 트리(tree) 구조의 데이터를 관계형 DB 에 Nested Interval 인덱싱 기법을 적용하여 XML 문서를 저장하는 방법에 대해 연구한다. 기존의 저장 기법들의 경우 XML 문서를 효율적으로 질의하기 위한 인덱싱을 수행하기 때문에 입력 후 추가되는 노드(node), 혹은 노드 집합의 입력 시에는 전체 혹은 일부분의 XML 문서를 재-인덱싱 해야 하는 비효율이 있다. 그러나, Nested Interval 의 경우에는 재-인덱싱이 불필요하다. 본 논문에서는 기존의 트리 구조 데이터의 인덱싱 기법들에 대한 비교와 함께 Nested Interval 을 이용한 XML 문서의 인덱싱 기법에 대해 기술한다.

  • PDF

이질의 생물 정보원 통합을 위한 랩퍼 시스템에서의 XML 질의 처리 시스템 (An XML Query System in a Wrapper System for Integrating Heterogeneous Biological Databases)

  • 박은경;강동완;정채영;김현주;배종민
    • 정보처리학회논문지D
    • /
    • 제12D권4호
    • /
    • pp.553-568
    • /
    • 2005
  • 분산된 생물 정보원을 물리적으로 혹은 가상적으로 통합하기 위해서는 정보원들의 이질성을 해결해야 하며, 사용자의 다양한 요구를 수용할 수 있도록 범용성과 적응력이 뛰어나야 한다 본 논문에서는 데이터는 물론 응용 프로그램의 통합을 위한 미들웨어를 설계함에 있어서 랩퍼 시스템에서의 융통성 있는 범용 XML 질의 처리 엔진을 제시한다. 제시된 질의 처리 엔진은 사용자 정의 XML 뷰를 지원함으로서 융통성 있는 통합 질의 구성을 가능하게 한다. 질의 처리 과정은 뷰 합성, 지역 정보원에 대한 질의 변환, 그리고 결과 문서 생성과정을 동반하는데, 이를 위해 XML 뷰와 XML 질의어를 뷰 트리로 표현하는 XML 뷰 트리 기반의 질의 처리 모델을 제시한다. 그리고 제시된 질의 처리 모델의 범용성을 확인하기 위해 관계형 데이터베이스와 웹 정보원, 그리고 응용 프로그램에 대하여 정보원의 질의 결과 형이 관계형 튜플과 XML 문서인 경우에 대한 질의 처리 방법을 제시한다.