• 제목/요약/키워드: XML 구조

검색결과 1,242건 처리시간 0.036초

함수 변환과 FFT에 기반한 조정자가 없는 XML 문서 클러스터링 기법 (An Unsupervised Clustering Technique of XML Documents based on Function Transform and FFT)

  • 이호석
    • 정보처리학회논문지D
    • /
    • 제14D권2호
    • /
    • pp.169-180
    • /
    • 2007
  • 본 논문은 함수 변환(Function Transform)과 FFT(Fast Fourier Transform)를 사용하는 새로운 XML 문서 클리스터링 기법에 대하여 논한다. 본 문서 클러스터링 기법은 조정자 없이 점진적으로 수행된다. XML 문서는 엘리먼트의 계층적인 구조에 기반하여 이산 함수로 변환된다. 이산 함수는 FFT를 사용하여 벡터로 변환된다. 문서를 나타내는 벡터는 가중치 유클리디안 거리 메트릭을 사용하여 비교된다. 비교 결과가 미리 정의된 값보다 작을 때에는 비교되는 두 개의 문서는 구조적으로 비슷한 것으로 간주되어 동일한 그룹으로 분류된다. XML 문서 클리스터링은 XML 문서의 저장과 검색에 유용하게 사용될 수 있다. 800개의 합서 문서와 520개의 실제 문서를 사용하여 실험하였다. 실험 결과는 함수변환과 FFT는 XML 문서를 엘리먼트의 구조를 기반으로 하여 점진적으로 조정자 없이 효과적으로 분류하는 것을 보여주었다.

연관값을 이용한 XML 공통 VIEW의 설계 및 구현 (Design and Implementation of Common View for XML Documents using the Associative Value)

  • 박진만;김태우;홍동완;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.202-204
    • /
    • 2002
  • 인터넷 상에 산재하는 분산이질 형태의 자료들에 대한 효율적인 검색을 지원하기 위해서는 이 들 문서들의 구조를 새로운 정보 구조로 통합하여 사용자에게 제시하여야 한다. 본 논문에서는 DTD 또는 XML Schema를 기반으로 하는 XML 문서의 공통 뷰 설계를 위한 공통 데이터 모델과 처리 방식을 제안한다. 계층, 상속, 복합 등의 다양한 구조 처리를 위한 XML 문서의 경로 정보, 관련성이 있는 요소들의 연결에 이용되는 연관값, 소스 매핑 정보 등으로 구성된 복합 필드 구조를 갖는 트리형의 새로운 공통 데이터 모델을 정의한다. 또한 XQuery 기반의 공통 뷰 정의 질의 기능과 공통 데이터 구조상의 질의 처리 방식을 보인다.

  • PDF

XML 문서에 대한 효율적인 검색기법 (An Efficient Querying Method for XML Documents)

  • 윤정혜;이미희;우용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.11-14
    • /
    • 2004
  • 최근에 전자상거래, e-learning, e-book 등과 같은 다양한 분야에서 디지털 문서의 효율적인 관리를 위하여 XML문서를 이용하고 있다. 이에 따라 대량의 XML 문서들을 효율적으로 저장하고 관리하는 시스템의 필요성이 증가하고 있다. 이러한 시스템의 대부분은 XML 문서가 트리 구조로 이루어져 있기 때문에 DOM을 이용하고 있다. 그러나 DOM은 문서 전체의 문서 구조 정보를 메모리 트리 구조로 생성하는 과정에서 많은 시스템 자원을 필요로 한다. 본 논문에서는 이벤트-기반인 SAX를 이용하여 문서의 구조 정보를 내부 트리 구조로 만드는 대신 구문 분석 이벤트를 직접 응용프로그램에 전달하는 방법을 사용함으로써 DOM에서의 시스템 자원을 많이 사용하는 문제를 해결하였다.

  • PDF

XML 정규 경로식을 위한 유연한 질의 처리 시스템 (A Flexible Query Processing System for XML Regular Path Expressions)

  • 김대일;김기창;김유성
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권6호
    • /
    • pp.641-650
    • /
    • 2003
  • 반 구조적(semi-structured)이며 표현의 유연성이 높은 XML(extensible Markup Language)은 인터넷에서의 정보 교환의 표준으로 자리잡았다. 많은 문서들이 XML로 작성되고 있으며 이러한 문서들에 대한 효율적인 저장과 검색에 대한 요구가 증가하고 있다. XML 문서들을 저장하는 백엔드(back-end)로서 대량의 정보처리가 가능하고 회복, 동시성 제어 등의 성숙된 기술들을 가지고 있는 관계형 데이타베이스를 이용하는 많은 연구들이 있다. 기존의 관계형 데이타베이스를 이용한 질의 처리 방법들에서는 다양한 질의에 대해 동일한 구조 정보와 기본 연산을 적용하여 질의 처리를 하기 때문에 특정한 질의 형태만을 효율적으로 처리할 수 있다. 본 논문에서는 질의를 분석하여 질의에 적합한 구조 정보와 기본 연산을 적용하는 유연한 질의 처리 시스템을 제안한다. 제안된 질의 처리 시스템은 정규 경로식 XML 질의를 분석하여 부모-자식 관계 파악에는 동등(equi)-조인을 사용하고 부모-자식 관계가 아닌 조상-자손 관계에는 $\theta$-조인을 사용하여 다양한 정규 경로식 질의를 효율적으로 처리한다. 제안된 XML 질의 처리 시스템과 기존의 관계형 데이타베이스를 이용하는 질의 처리 시스템을 비교 실험한 결과 다양한 정규 경로식 질의 처리의 성능 향상을 보였다.

XML 데이타베이스에서 경로-지향 질의처리를 위한 병렬 매치 방법 (A Parallel Match Method for Path-oriented Query Processing in iW- Databases)

  • 박희숙;조우현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.558-566
    • /
    • 2005
  • XML은 인터넷상에서 데이타를 표현하고 교환하기 위한 새로운 표준이다. 본 논문에서는, XML문서에 대한 경로-지향 질의어의 평가를 위한 새로운 접근법에 대하여 기술한다. 본 논문의 접근법에서는, 경로-지향 질의어의 평가속도를 개선하기 위해 경로서명을 이용하는 병렬 매치 인덱싱 구조의 제안과 함께 데이타베이스 안에 저장된 엘리먼트들의 경로서명들과 입력된 질의어의 경로서명 사이에 매치작업을 수행하기 위한 병렬 매치 알고리즘을 설계한다. 먼저, 병렬 매치 구조를 형성하기 위해서는 XML 문서상의 모든 경로서명들에 대한 이진 트라이를 구성한 다음 이들을 병렬 매치 인덱싱 구조로 변환한다. 경로-지향 질의어의 검색 연산을 수행하기 위해 병렬 매치 인덱싱 구조와 병렬 매치 알고리즘을 사용한다. 본 논문에서 제안한 방법에서 알고리즘의 시간 복잡도는 XML 문서내의 경로서명의 수에 대하여 로그값에 비례한다.

XML 문서의 분할저장을 위한 XML2RDB 미들웨어의 설계 및 구현 (Design and Implementation of a XML2RDB Middleware for Partition Storing of XML Documents)

  • 박성진
    • 한국전자거래학회지
    • /
    • 제8권3호
    • /
    • pp.1-16
    • /
    • 2003
  • XML은 전자 상거래 및 인터넷 기반의 정보시스템에서 데이터 표현과 교환을 위한 표준으로 간주되고 있다. XML이 웹에서 운용되는 모든 데이터가 통합, 저장, 처리될 수 있는 기반을 제공하기 위해서는 데이터베이스 안에 XML문서를 저장한 뒤 다시 구조화된 형태로 데이터를 추출하고 XML문서 형태로 생성할 수 있어 야 한다. 비록 많은 DBMS 업체들이 XML을 지원하기 위해 기존 제품들을 확장하고 있지만 이와는 별도로 XML기반의 B2B전자상거래 시스템을 구축하기 위해서 DBMS종류와 플랫폼에 독립적인 XML미들웨어 개발이 필요하다. 본 논문에서는 개발한 XML2RDB 미들웨어 시스템의 구조와 처리과정에 대한 설계 및 구현 내역을 기술하였다. 구현된 XML2RDB 미들웨어는 DBMS종류에 무관하게 XML DTD로부터 XML문서 저장에 필요한 스키마 구조를 생성하고 데이터베이스 테이블에 저장한 뒤 XMLQL(XML Query Language)를 통해 자유롭게 XML 문서를 재 생성할 수 있다.

  • PDF

인터넷 쇼핑몰에서 암호화된 XML/EDI를 위한 DTD 전자서명에 관한 연구 (A Study on the DTD Digital Signature for Cryptographic XML/EDI in an Internet Shopping Mall)

  • 홍성표;김형균;이준
    • 한국정보통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.519-525
    • /
    • 2003
  • XML의 등장으로 기존의 EDI를 전자상거래 환경에 맞게 발전시킨 기술이 XML/EDI이다. DTD는 XML 문서에 표현될 자료의 의미를 정의한 메타 데이터라고 할 수 있다. 따라서 DTD 정보가 손상될 경우 이 정보를 기반으로 한 XML 문서의 보안은 심각한 문제점을 가지게 된다. 본 연구에서는 인터넷 쇼핑몰에서 암호화된 XML/EDI를 위하여 XML 문서에만 전자서명을 첨부하는 것이 아니라, DTD에 전자서명을 첨부하는 방법을 제안하였다. 전자서명 시 메시지 다이제스트 과정에서 바꿔 순서에 대해서는 검사하지 못하기 때문에 전혀 다른 다이제스트 값을 생성하는 문제가 발생되는데, 이것은 표준화된 구조와 문서에 대한 트리구조를 구현할 수 있는 DOM을 이용하여 DTD의 전자서명을 생성하는 방법으로 해결하였다.

XML 구문지향 편집기의 자동 생성 방안 (An Automatic Generation Method of XML Syntax-Directed Editor)

  • 유재우;박호병;조용윤
    • 한국통신학회논문지
    • /
    • 제30권6B호
    • /
    • pp.369-376
    • /
    • 2005
  • XML은 다양한 분야에서 널리 사용되고 있지만, 일반 사용자가 XML 문서를 작성하기란 아직 많은 어려움이 있다. 본 논문에서는 일반 사용자도 손쉽게 XML 문서를 작성할 수 있는 XML 구문지향 편집기를 소개하고, 구문지향 편집기의 내부 자료구조인 추상구문을 정의하고, 정의된 추상구문 규칙으로 문서를 편집하기 위한 편집기의 구성요소를 설명한다. 또한 DTD로부터 추상구문 규칙을 자동 생성하는 방법을 제시함으로써 더욱 빠르고 정확하게 XML 구문지향 편집기를 생성하는 방안을 제안한다. 추상구문의 구조와 구문지향 편집기의 작성 절차를 통하여 더욱 용이하게 XML 구문지향 편집기 생성이 가능하다.

XQuery 작성기 설계 및 구현

  • 김태권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.22-24
    • /
    • 2004
  • XML은 관계형 데이터는 물론 구조화 또는 반구조화 된 데이터를 효과적으로 조직화하여 표현할 수가 있다. XQuery는 구조화된 XML 데이터를 대상으로 필요한 정보를 검색하는 질의어이다. 평면적인 테이블 형태의 SQL과는 달리 XQuery는 데이터의 내부구조 정보 없이는 질의어를 작성하는데 어려움이 따른다. 이 논문은 내부적으로 구조화된 XML데이터에서 필요한 정보를 검색하는 검색언어 XQuery질의를 효과적으로 작성할 수 있도록 질의 대상이 되는 XML 데이터 구조를 트리 형태로 보여주고, 필요한 경로식을 효과적으로 지정함으로써 질의어를 보다 쉽게 작성하도록 도와주는 XQuery 작성기를 설계하고 구현한다.

  • PDF

웹 스키마를 이용한 HTML 문서의 XML 변환 (XML Conversion of HTML Documents Using Web Schema)

  • 오금용;박동문;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.175-177
    • /
    • 2001
  • 최근에 웹(Web) 사용의 지속적이 증가로 인하여 정보가 급증하고, 이로 인하여 웹은 정보교환의 의미뿐아니라 정보 저장이라는 중요한 의미를 지니게 되었다. 하지만 현재 많은 웹 페이지들이 HTML(Hyper Text Markup Language)문서로 제작되어 있어 정보관리의 의미에서 많은 부족함이 있고 이를 보완하기 위한 방법 중에 하나가 구조적이고 기능적 언어로 부상하고 있는 XML(exTensive Markup Language)을 기반으로 하여 문서를 제작하거나 변환하는 것이다. 본 논문은 HTML문서를 XML문서로 변환하는데 있어HTML문서 구조를 분석하고 분석결과를 토대로 형성되는 웹 스키마(Schema)를 이용하여 구조 중심의 변환이 이루어지도록 하는 방법에 대해서 제안한다.

  • PDF