• 제목/요약/키워드: XML 인덱스

검색결과 117건 처리시간 0.024초

깊이탐색과 노드간 최단거리를 이용한 XML 인덱싱 알고리즘 설계 및 구현 (Design and Implementation of XML-based Indexing Algorithm Using Depth-First and Shortest Distance Between Nodes)

  • 김광남;윤희병;김화수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.547-549
    • /
    • 2004
  • 웹기반 하에서 구조적인 정보를 표현하기 위해서 XML이 다양하게 사용되고 있으나 XML 기반 문서는 다양한 Schema와 노드의 표현으로 구성되어 있어서 이를 효율적으로 인덱싱 하여 저장하는 것은 매우 어려운 일이다 이를 해결하기 위하여 추상화, DTD, K-ary 완전트리 기법 등 다양한 연구가 이루어지고 있으나 응용에 많은 제한을 가지고 있다. 본 논문에서는 XML 기반의 웹문서를 효율적으로 인덱싱하고 사용자의 질의에 최적의 결과를 제공하기 위한 알고리즘을 설계 및 구현한다. 인덱싱 시스템 설계를 위해서 먼저 노드(부모 형제)의 ID를 추출하는 알고리즘을 제안하며, 문서 및 노드 테이블 설계 결과를 제시한다. 그리고 C#을 이용한 파싱과 인덱스 알고리즘을 구현하기 위하여 깊이탐색과 관계 노드간 최단거리를 이용하며, 알고리즘 실행 결과와 이 결과로 자동 생성된 문서 및 노드 테이블의 파싱 결과를 또한 제시한다.

  • PDF

XLink를 이용한 XML 문서의 인덱싱 기법 (Indexing Scheme for XLink in XML Documents)

  • 김선경;김성완;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.97-99
    • /
    • 2002
  • 인터넷의 급속한 발전과 더불어 대량의 정보를 효과적으로 표현 및 교환할 수 있는 표준으로 XML이 제정된 이후, XHL 문서의 저장과 검색을 위한 많은 연구들이 진행되고 있다. 한편, XML 문서간의 관계를 표현하기 위한 XLink가 제정되면서, XLlnk로 표현된 링크 정보를 이용하여 문서들을 효과적으로 검색할 수 있는 정보 검색 시스템에 대한 연구가 진행되고 있지만 그 성과가 미흡하다. 따라서 첫째, 본 논문에서는 링크 정보를 가지고 있는 XML 문서의 데이터 모델을 정의하고, 문서간 링크 정보가 가져야 할 링크 참조 무결성을 제안하였다. 둘째, 링크 정보를 이용한 질의 처리를 위해 제안한 모델과 최신 XLink 표준을 준수하여 테이블 형식의 링크 정보 인덱스 구조를 설계하였다.

  • PDF

의미적 연결 관계에 기반한 전자 카탈로그에서의 확장된 어휘 인덱스 구축 및 이를 이용한 검색 성능 향상 기법 (Construct ion of Keyword Index and Improved Search Methods for e-Catalogs Eased on Semantic Relationship)

  • 이동주;이태희;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.67-69
    • /
    • 2005
  • 본 논문에서는 기 구축된 전자 카탈로그를 의미적 연결 관계에 기초한 확장된 전자 카탈로그로 변환하는 방법을 제안한다. 이를 통해 구축된 확장된 전자 카탈로그에서 의미적 태깅에 의한 확장된 어휘 인덱스 구축 방안과, 이를 이용한 검색 성능 향상 기법을 제안한다. 기존의 전자 카탈로그는 상품 정보가 분류별로 생성된 테이블에 저장되고 저장된 테이블로부터 생성된 키워드 인덱스로부터 검색이 이루어 졌다. 이러한 검색은 상품이 가지는 정보를 데이터베이스에 구축된 테이블에만 한정하게 되어 전자 카탈로그에 포함된 상품이나 분류간의 의미적 연결 관계들을 충분히 이용하지 못하였다 전자 카탈로그에 내재된 의미적 요소를 충분히 활용하기 위해서는 전자 카탈로그를 의미적 연결 관계에 기초한 모델로 구성할 필요가 있다. 본 논문에서는 의미적 모델 기반 전자 카탈로그 시스템으로의 전환 과정을 XML형태의 명세를 이용해 반자동적으로 전환할 수 있는 툴을 구현하며, 단순 키워드 어휘 인덱스 구축이 아닌, 어휘 인덱스의 의미적 확장을 제안하고, 이를 위한 태그 요소로써 어휘에 대한 형태소 분석 결과, 수치 환산 및 확장 요소, 속성간의 도메인 정보 등을 제시하였다. 이를 기반으로 최적의 검색 결과를 얻어 내도록 하는 인접도 평가 함수에 적용하는 방법을 제시한다.

  • PDF

MPEG-7에 기반한 동영상 검색 시스템 인덱스 기법 (A Method of Movie Retrieval System Index based on MPEG-7)

  • 김택곤;김우생
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.25-27
    • /
    • 2003
  • MPEG-7은 XML을 이용하여 사용자가 원하는 내용을 검색하고 브라우징할 수 있도록 하는 멀티미디어 컨텐츠의 다양한 정보를 기술하고 있다. 그러나 많은 부분으로 나누어진 세부화된 장면들을 찾는 질의가 주어졌을때 원하는 정보를 찾기 위하여 모든 문서의 내용을 검색하는 것은 상당한 시간이 요구되며, 일반적인 XML 문서의 인덱싱 기법을 적용할 경우 MPEG-7의 관점에서 부합되지 않은 점이 있다. 본 논문에서는 이를 개선하기 위하여 MPEG-7 문서의 구조적인 정보를 기반으로 하는 인덱싱 기법을 제안하고 질의를 하여 동영상내의 원하는 부분을 효율적으로 찾는 방법을 보인다.

  • PDF

XML 문서의 효과적인 색인방법을 위한 Order-Array의 사용 (An Efficient Indexing Method For XML Documents Using Order-Array)

  • 김영;안찬민;박상호;박선;이주홍;전석주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.77-80
    • /
    • 2004
  • 최근 XML은 전자상거래에서 의학, 국방, 법률 등의 전문분야에 이르기까지 많은 분야에서 활용되고 있으며, 데이터의 양 또한 방대해지고 있다. 따라서 대량의 XML 문서들을 효과적으로 저장하고 빠르게 검색할 수 있는 많은 인덱싱 기법들이 연구되고 있다. 최근의 인덱싱 기법들 중 Numbering Scheme 을 기반으로 한 인덱싱 기법들은 대부분의 검색에 우수한 성능을 보이나 하위노드의 수가 늘어나면 검색 오버헤드가 커질 수 있으며, 대량의 XML 문서의 추가 삽입 및 구조가 다른 XML 문서의 삽입시에 인덱스와 데이터 값의 재조정에 따른 많은 비용이 발생하게 된다. 이에 우리는 Numbering Scheme 을 기반으로 하지만, 각 노드별로 노드범위(Node-Range)와 Order-Array를 추가하여 검색성능을 향상시키고 대량의 XML 문서의 삽입 및 구조가 다른 XML 문서의 삽입시에 발생되는 문제를 해결하고자 한다.

  • PDF

상호연동성을 지원하는 XML기반의 심전도 데이터 관리를 위한 메타데이터 시스템 (Metadata System for XML-based ECG Management Supporting Interoperability)

  • 구흥서
    • 한국지능시스템학회논문지
    • /
    • 제16권6호
    • /
    • pp.704-709
    • /
    • 2006
  • 본 연구에서는 의료정보시스템 간에 상호연동성을 지원한 수 있는 XML 기반의 심전도(electrocardiography, 이하 ECG) 데이터의 효율적인 저장구조 및 관리방법을 제시하고, 웹기반으로 ECG 정보서비스를 제공할 수 있는 ECG 메타데이터 시스템을 구현한다. ECG 메타데이터 시스템은 ECG 데이터와 메타데이터의 저장, 검색, 그리고 pdf 파일형식의 리포팅 서비스 기능을 포함한다. ECG 데이터의 저장구조는 심전도 데이터의 특성과 액세스 특성을 분석하여 비분할 저장방식을 사용하였고, 효율적인 검색기능을 제공하기 위해 HL7 aECG 데이터로부터 메타데이터를 추출하여 인덱스로 활용하였다. ECG 리포팅 서비스를 제공하기 위해 템플릿 메커니즘을 이용하여 텍스트 XML 형태의 데이터를 여러 데이터 포맷으로 변환한다.

방향 그래프 기반 XML 데이터 모델과 대수 구현 (Implementation of Algebra and Data Model based on a Directed Graph for XML)

  • 박성희;최은선;류근호
    • 정보처리학회논문지D
    • /
    • 제8D권6호
    • /
    • pp.799-812
    • /
    • 2001
  • 데이터 교환을 위한 표준 형식으로 XML 활용 증가에 따라 데이터베이스 분야에서 XML 처리의 중요성이 증가하고있다. 현재까지 XML 데이터모델과 정규표현 질의 같은 복잡한 질의처리를 위한 XML대수에 관한 연구가 수행되고 있지만 미디에이터 시스템처럼 XML질의 처리 시 기능이 제한적이다. 따라서 이 논문에서는 반 구조데이터 모델을 확장한 방향 그래프 기반 XML 모델을 설계하고 XML 질의를 위한 XML 대수 연산을 정의하며 그 구현기법을 제시한다. XML 대수 연산 구현을 위해 물리적 저장소인 RDBMS를 접근하기 위한 접근 메소드와 패스 인덱스를 이용하여 알고리즘을 구현한다. 아울러 제안 알고리즘의 효율성을 보이기 위하여 반 구조 특성을 가지는 EST유전체 서열에 대한 XML 문서를 대상으로 성능을 평가한다.

  • PDF

구조 유사도를 이용한 경로 기반의 색인 기법 (An Indexing Method based on the Path using Structure Similarity)

  • 김연혜;이재민;황병연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.58-60
    • /
    • 2003
  • 기존의 웹 문서나 컨텐츠의 한계를 극복하기 위해 메타데이터에 대한 연구가 활발히 이루어진 가운데 그 산물로 등장한 XML은 현재 다양한 분야에서 그 활용에 관한 연구가 활발히 진행되고 있다. 그리고 그 중에서 XML문서 자체를 저장 및 검색하는 부분에 대한 연구도 많은 성과가 있었다. XML의 대표적인 특징은 기존의 다른 컨텐츠와는 달리 문서의 구조를 기술할 수 있다는 것이며 이런 구조적 정보는 활용 방법에 따라 XML문서의 다양한 처리에 있어 성능을 향상시키는 핵심적인 요소가 될 수 있다. 이에 본 논문에서는 기존의 비트맵 인덱스(Bitmap Index)를 확장하여 역파일 색인 방법과 결합시켜 P_INDEX를 제안하고, P_INDEX를 활용한 다양한 경로 중심의 검색 방법을 제시한다.

  • PDF

XML 문서 클러스터링을 위한 경로 유사도의 계산 (Path Similarity Calculation for Clustering of XML Documents)

  • 이범석;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.325-328
    • /
    • 2006
  • 최근 DTD (Document Type Descriptor)를 포함하고 있지 않은 XML 문서의 사용이 증가하고 있다. 따라서 서로 다른 구조를 갖는 많은 양의 XML 문서를 관계형 DBMS에 저장하거나, 인덱스를 이용하여 매핑하는 등 보다 효율적으로 관리하기 위한 다양한 인덱싱 기법에 대한 연구가 진행되고 있다. 이러한 연구들 중 경로 비트맵 인덱싱 기법은 경로 구성 유사도를 기반으로 3차원 비트맵 클러스터를 생성하고, 클러스터 단위의 검색을 수행함으로서 빠른 검색 속도를 보여주었다. 그러나 이 기법은 비교하려는 두 경로 중 항상 짧은 경로가 기준 경로가 되는 한계점과, 같은 노드 구성을 가지는 두 경로에서도 노드의 위치에 따라 그 유사도가 크게 변하는 등의 여러 문제점을 가지고 있었다. 이러한 문제점을 해결하고, 정확한 클러스터링을 수행하기 위해서는 합리적인 경로 유사도 계산식이 필요하게 되었다. 본 논문에서는 기존 방법의 문제점을 해결하고, 보다 정확한 클러스터링을 수행할 수 있는 새로운 경로 유사도 계산식을 제안한다.

  • PDF

메타정보 인터페이스를 이용한 이질 구조 분석 XML문서 통합 검색 (Integrated Information Retrieval with Metadata Interface for Heterogeneous Distributed XML Documents)

  • 류성준;황재문;김태훈;남영광
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1505-1518
    • /
    • 2004
  • 본 논문은 구조적, 의미론적 이질성을 가진 분산 XML 문서의 통합 검색을 위해 반자동으로 생성된 인터페이스를 통해 각 지역 문서에 대한 질의를 생성하여 검색하는 방법을 제안한다. 본 시스템에서는 데이타 통합을 위한 메타데이타 인터페이스인 DDXMI(Distributed Documents XML Metadata Interface)를 정의하고, 분산 데이타에 대한 DTD를 입력으로 받아 사용자로 하여금 전역 DTD와 각 지역 DTD 간의 의미 차이를 극복하기 위한 사용자 인터페이스 생성 방법을 제안하였다. 전역 DTD와 지역 DTD의 특성을 고려하여 인덱스 매핑과 그에 필요한 함수 이름의 매핑 정보를 기반으로 DDXMI가 자동으로 생성된다. XML 질의 언어인 Quilt를 사용하여 생성된 DDXMI를 통해 각 지역 문서에 적합한 질의를 생성, 수행한다 사용자는 검색 대상 문서의 스키마와 통합스키마의 구조를 잘 알고 있다고 가정하였다. XML로 만들어진 석박사 논문, 논문지, 연구보고서에 대한 소규모, 중규모 전역 DTD를 만들어 실제로 질의를 생성하여 검색 결과를 검증할 수 있도록 하였다. 본 시스템은 JavaCC와 Java 서블릿을 이용하여 개발하였다.