• 제목/요약/키워드: XML retrieval

검색결과 277건 처리시간 0.031초

GDIT를 기반으로 한 구조적 문서의 효율적 검색과 갱신을 위한 인덱스 설계 (An Indexing Scheme for Efficient Retrieval and Update of Structured Documents Based on GDIT)

  • 김영자;배종민
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.411-425
    • /
    • 2000
  • SGML이나 XML언어를 사용하여 작성된구조적 문서들에 대한 정보검색 시스템들은 문서의 부분검색을 지원한다. 문서의 구조에 바탕을 둔 질의를 효율적으로 처리하기 위해서는 색인에 관련된 메모리 오버헤드를 줄여야 하고, 질의에 대한 응답시간이 빨라야 하고, 문서 구조에 바탕를 둔 다양한 유형의 사용자 질의를 지원해야 하며, 문서 구조에 대한 변경이 발생했을 때 색인 구조에 대한 변경사항을 최소화하여야 한다. 본 논문에서는 전체문서인스턴스트리 구조를 제안하고, 이를 기반으로 텍스트 레벨 엘리먼트만을 색인하여, 색인과 검색의 효율성을 유지하면서 자료의 추가나 삭제등의 갱신이 발생할 때, 갱신의 파장을 최소화시킬 수 있는 색인구조와 질의처리 알고리즘을 제시하고 그 성능을 분석한다.

  • PDF

CORBA를 기반으로 한 XML통합 정보 검색 시스템 개발에 관한 연구 (A Study on the Development of Integrated XML Information Retrieval System Based on CORBA)

  • 정병인;이재완;이정식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2000년도 추계종합학술대회
    • /
    • pp.345-348
    • /
    • 2000
  • 컴퓨터와 통신기술의 발달로 분산되고 이질적인 시스템들간에 상호연동이 가능해졌다. 그렇지만 전통적인 정보 시스템은 서버의 수가 많아질수록 애플리케이션이 복잡해지는 문제점이 있다. 이러한 점을 극복하기 위해 XML을 공통 데이터 형식으로 사용하여 데이터에 동적으로 접근 할 수 있도록 하고, 또한 CORSA를 기반으로 하여 각각의 데이터베이스에 접근의 투명성을 보장하였으며, 인터페이스의 복잡도를 감소시킬수 있는 3-Tier 클라이언트/서버 시스템을 개발한다.

  • PDF

공간유사도와 XML을 이용한 이미지 검색기법 (Image Retrieval scheme using Spatial Similarity and XML)

  • 이수철;황인준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.1063-1068
    • /
    • 2002
  • 공간 관계는 이미지나 멀티미디어 데이터를 검색하기 위한 시스템에서 오브젝트들을 표현하는데 중요한 요소이다. 본 논문에서는 기존의 검색 방식과 다르게 이미지에 있는 여러 오브젝트들간의 공간 관계와 각 오브젝트들이 가지고 있는 특징을 이용한 새로운 방식의 이미지 데이터 검색기법을 제안한다. 이것은 질의와 데이터베이스 내에 있는 이미지들간의 유사성을 효율적으로 계산하는데 유용하다. 또한 각 오브젝트의 공간정보와 특징들에 대한 정보들이 XML형태로 주석 처리되어 있기 때문에 이전 검색 기법보다 정확도가 높다. 마지막으로 제안한 검색기법을 이용한 이미지 검색 시스템을 구현하여, 실제 데이터를 검색함으로써 성능을 평가하였다.

  • PDF

효율적 문서 검색 및 변경을 위한 XML문서 저장 시스템 설계 (Design of an XML Document Storage System for Efficient Document Retrieval and Updates)

  • 박충희;이상준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.548-550
    • /
    • 2003
  • 본 논문에서는 관계형 데이터베이스를 이용하여 XML 문서를 효과적으로 검색 및 갱신을 수행할 수 있는 데이터 저장 모델을 제안한다. 저장 시스템의 스키마는 DTD 독립적인 형태를 채택하였고, 가상 분할 모델과 분할 모델의 장점을 취합한 혼합형태로 설계하였다. 본 시스템에서는 엘리먼트 추가 또는 삭제시 문서의 구조정보 변경으로 인한 변경사항 발생을 방지하기 위하여 타 노드의 위치정보와 독립적인 position id를 사용하였다.

  • PDF

XML 명세에 기반한 소프트웨어 컴포넌트 검색 (Retrieval of Software Component based on XML Specification)

  • 권태삼;이윤수;윤경섭;왕창중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.501-503
    • /
    • 1999
  • 소프트웨어 컴포넌트의 재사용은 새로운 소프트웨어를 개발하기 위해 이미 개발되어진 컴포넌트나 적절하게 수정된 컴포넌트를 사용하는 것이다. 따라서 컴포넌트 저장소에 저장되어 있는 컴포넌트를 효율적으로 검색할 수 있어야 하며, 검색된 컴포넌트를 적용하여 새로운 소프트웨어를 개발할 수 있어야 한다. 이 논문에서는 컴포넌트 저장소에 XML 기반으로 명세된 컴포넌트들의 검색 방법과 소프트웨어 아키텍쳐 재구성을 위한 구조 검색 방법을 제안한다. 제안한 검색 방법에서 시그니쳐 일치 방법은 컴포넌트 검색의 재현율을 향상시키며, 행위 일치 검색은 컴포넌트 검색의 정확성을 향상시킬 수 있다. 또한, 구조 검색 방법은 소프트웨어 아키택쳐의 재구성을 위해 컴포넌트의 구조적인 관점에서 컴포넌트를 검색할 수 있다.

  • PDF

XML을 이용한 MPEG-7 내용기반 검색 시스템 (MPEG-7 Content-Based Retrieval System using XML)

  • 조철범;박만곤
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.632-635
    • /
    • 2004
  • 디지털 정보기술의 급속한 발전과 고속 네트워크의 보급으로 멀티미디어 데이터가 급격하게 늘어나고 있다. 이러한 데이터들을 빠르고 정확하게 검색하기 위하여 가장 중요한 기반이 되는 것이 데이터의 적절한 표현이다. 최근 최종화 단계를 거친 MPEG-7은 멀티미디어 데이터에 대한 구조화 및 의미 정보를 제공함으로써 효율적인 검색과 필터링을 가능하게 하는 멀티미디어 데이터의 표현에 대한 표준화를 다루고 있다. 본논문에서는 MPEG-7의 표준화와 내용기반 검색 시스템을 소개하고 MPEG-7의 비주얼 기술자를 내용 정보 간의 상호 연관성을 표현하기에 적합한 XML로 구조화 하여 효과 적인 검색이 가능한 내용기반 검색 시스템을 제안한다.

  • PDF

XML 문서의 내용기반 검색을 위한 인덱싱 모델 및 색인어의 가중치 부여 (Indexing Model and Weight Assignment on Keywords for Contents based Retrieval in XML Documents)

  • 한예지;한창우;서동혁;김수희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.103-105
    • /
    • 2004
  • 본 논문에서는 XML 문서의 내용을 효율적으로 검색하기 위해 필요한 메타데이터의 스키마몰 개발하고 이론 바탕으로 구축되는 내용기반 인덱싱 모델을 제안한다. 제안하는 내용기반 인덱싱 모델은 엘리먼트타입에 따라 랭킹 검색과 불리언 검색을 지원한다. 랭킹 검색 결과의 재현도와 정확도를 높이기 위해, 검색 결과의 출력 기준 노드가 리프 노드와 내부 노드인 경우를 구별하여 색인어에 대한 가중치를 부여하고, 이를 이용하여 질의와 엘리먼트간의 유사도를 계산하는 방법을 제안한다.

  • PDF

구조 검색을 위한 XML 문서 저장 시스템 (XML Document Repository System for structured retrieval)

  • 임산송;현득창;정회경
    • 정보학연구
    • /
    • 제4권4호
    • /
    • pp.89-100
    • /
    • 2001
  • XML(extensible Markup Language)은 W3C(World Wide Web Consortium)에서 표준으로 제정, 발표한 대표적인 전자문서 표준이다. XML 문서는 구조화된 정보를 체계적으로 생성하고 전송할 수 있으며, 기존의 파일 형태 정보에 비하여 의미적인 정보 단위를 구조로 표현하고 이러한 구조 정보를 이용해 문서의 관리 및 검색, 저장에 이용할 수 있다. 이에 본 논문에서는 XML의 구조적 정보를 이용하여 저장 검색하기 위한 XML 저장 시스템을 설계 및 구현하였다. 문서의 기본 단위인 엘리먼트(element) 단위로 모델링(modeling)하여 저장하였고, 저장된 XML 정보를 구조 단위로 검색 할 수 있도록 모델링 하였다. 또한 DTD(Document Type Definition)와 인스턴스(instance)에 대하여 스키마(schema)를 생성하여 다양한 문서에 대한 구조를 효과적으로 관리, 저장할 수 있도록 하였다.

  • PDF

객체 관계형 DBMS를 이용한 XBench 성능평가 (Peformance Evaluation of XBench using an Object-Relational DBMS)

  • 김재욱;송용호;이상원
    • 한국통신학회논문지
    • /
    • 제30권1C호
    • /
    • pp.9-17
    • /
    • 2005
  • XML은 데이터 표현과 교환을 위한 표준으로 급격히 자리잡아가고 있으며, XML 문서는 다양한 응용분야에 도입되고 있다. 이러한 흐름에 따라 데이터베이스 분야에서도 XML 문서 데이터의 효율적인 저장과 검색에 관한 연구가 활발히 진행되어왔다. 최근에 여러 상용 (객체) 관계형 DBMS에서 XML 데이터베이스를 지원하고 있으며, Native XML DBMS도 학계와 산업계에서 지속적으로 개발되고 있는 실정이다. 또한, 이러한 여러 종류의 XML 데이터베이스의 성능을 평가하기 위한 다양한 종류의 벤치마크가 제안되었다. 본 논문에서는 특정 객체 관계형 DBMS를 이용해서 XBench 벤치마크를 수행해서 객체 관계형 데이터베이스의 성능을 평가/분석하는데 향후 개선 방향을 밝히는데 그 목적이 있다.

유효성을 고려한 XML 데이타 암호화 시스템의 설계 및 구현 (Design and Implementation of on XML Data Encryption System considering Validation)

  • 남궁영환;박대하;허승호;백두권
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권6호
    • /
    • pp.417-428
    • /
    • 2002
  • XML은 정보공유 및 검색에 있어서 매우 효과적인 장점을 지닌 마크업 언어이지만 보안에 취약한 단점을 가지고 있다. 한편, 이를 보완하는 XML 전자 서명, XML 데이타 암호화, XML 접근 제어 등의 연구는 XML 문서의 유효성을 배제하고 있다. 그러나 XML 기반 정보 교환 및 공유 환경에서 XML 문서의 유효성은 필수적으로 요구된다. 본 논문에서는 XML 문서의 보안성과 유효성을 동시에 지원하는 XML 보안 시스템을 설계하고 구현하였다. 제안된 시스템은 XML 데이타의 암호화 과정에서 유효성 유지를 위해 XML 스키마 정보를 갱신하여 이의 참조를 통해 XML 문서의 유효성 지원한다. 또한 XML 스키마 전자 서명과 같은 XML 스키마 관련 보안 기능을 지원하며 이 과정에서 빠른 정규화 XML 스키마 해석을 위해 DOMHash 기법을 사용하였다. 제안된 시스템을 통해 유효성을 유지하는 XML 문서는 유연성 및 확장성과 신뢰성에 있어 기존 시스템보다 좋은 기능을 갖는다.