• 제목/요약/키워드: XML Keyword Retrieval

검색결과 18건 처리시간 0.022초

XML 문서의 효율적인 검색과 관리를 위한 SCOF 모델 (Service-centric Object Fragmentation Model for Efficient Retrieval and Management of XML Documents)

  • 정창후
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.595-598
    • /
    • 2007
  • XML 문서가 기하급수적으로 증가하면서 XML 문서를 처리하는 방법론에 대한 많은 논의가 있어왔다. 본 논문에서는 두 가지 중요한 목적을 가지고 XML 정보 검색 및 관리 시스템을 개발하는데, 첫 번째는 질의에 적합한 내용을 쉽고 빠르게 검색해서 제공하는 것이고, 두 번째는 시스템의 부담을 최소화하면서 효율적이고 안정적인 관리 기능을 제공하는 것이다. 이렇게 실용적인 시스템을 개발하는 핵심 기술은 XML 문서를 어떻게 효과적으로 분할하여 구조적으로 서비스하는가에 달려 있다. 이러한 목적을 달성하기 위하여 본 논문에서는 SCOF(Service-centric Object Fragmentation) 모델을 제안한다. SCOF 모델은 XML 데이터베이스 관리자에 의해서 정의되는 변환 규칙(conversion rule)을 이용하여 문서를 분할하는 준분할(semi-decomposition) 저장 방식이다. SCOF 모델을 사용한 키워드 기반 검색은 전형적인 XML 질의 언어처럼 문서의 특정 엘리먼트나 속성 값을 이용하여 검색을 수행할 수 있다. 비록 이러한 접근법이 XML 문서 컬렉션에 대한 관리자의 지식을 필요로 한다고 하더라도, 개별 문서의 크기나 전체 문서의 양에 상관없이 검색과 관리를 효율적으로 수행할 수 있기 때문에 실용적인 시스템을 구축할 수 있다는 장점이 있다.

  • PDF

온톨로지 기반 문서여과 및 질의확장에 의한 XML 정보검색 (XML Information Retrieval by Document Filtering and Query Expansion Based on Ontology)

  • 김명숙;공용해
    • 한국멀티미디어학회논문지
    • /
    • 제8권5호
    • /
    • pp.596-605
    • /
    • 2005
  • 기존의 XML 질의 방법은 단순 키워드 정합이나 단순 구조적 확장 등에 국한되므로 문서에 내재된 정보를 검색하기에 불충분할 뿐만 아니라,모든 문서에 질의를 인가함으로써 정보검객의 효율을 저하시킨다. 본 연구는 온톨로지로부터 생성한 포괄적 BTD에 의해 검객대상 문서를 사전에 미리 선별하는 문서여과 방법과 온톨로지의 개념구조와 개념 간 연관관계를 추론하여 질의를 확장하는 방법을 제안함으로써 XML정보검색의 효과를 증대 하고자 한다. 제안한 문서여과 및 질의확장 방법은 다양한 XML 문서를 대상으로 검색 효과를 실험하였다.

  • PDF

기초학문자료 메타데이터 설계 분석 및 온톨로지 적용 방안 연구 (A Study on Design and Analysis of Metadata and Ontology based on Humanities and Social Sciences)

  • 이정연;김정민;최석두;김이겸
    • 한국문헌정보학회지
    • /
    • 제41권2호
    • /
    • pp.291-316
    • /
    • 2007
  • 기초학문자료의 특성인 복잡한 관계의 개념구조, 자료유형 및 자료간의 의미적 상관관계 등을 표현할 수 있는 기초학문자료 메타데이터 모형을 설계하였다. 설계된 메타데이터 모형의 정당성 및 효율성을 평가하기 위해 실제 구축된 자료의 분석을 토대로 실제적인 메타데이터 구성요소를 제시하였다. 메타데이터의 기반검색의 한계를 극복할 수 있는 확장된 시소러스를 설계하였으며 도메인 온톨로지를 구축하는 방안을 모색해 보았다. 또한 철학 종교학 분야의 주제분류 중심의 확장시소러스를 설계하고 토픽맵 기반 시스템으로 구현하여 주제 중심의 메타데이터 검색이 가능함을 보였다.

Semantic Web과 Semantic Network을 활용한 다국어 상품검색 에이전트 (Multilingual Product Retrieval Agent through Semantic Web and Semantic Networks)

  • 문유진
    • 지능정보연구
    • /
    • 제10권2호
    • /
    • pp.1-13
    • /
    • 2004
  • 상품검색은 고객들이 전자상거래의 접촉을 시작하는 인터페이스로서 매우 중요한 프로세스이다. 또한 전자상거래는 고객들에게 검색 시 쉽게 접근할 수 있는 프로세스를 제공하여야 한다. 특히 World Wide Web에서 상품정보는 광범위한 고객들이 신속하게 팽창하는 정보를 추적하기 위해서 통합과 표준화가 이뤄져야 한다. 상품 카탈로그(catalogue)에 대한 국제 표준화가 다양한 분야와 업종에서 구축되어져 왔는데, 요즈음은 UNSPSC((Universal Standard Products and Services Classification) 코드로의 수렴에 대한 논의가 활발해지고 있다. 이 표준을 채택하여 이 논문은 다국어상품검색 에이전트의 아키텍쳐(architecture)를 설계한다. 이 아키텍쳐는 중앙등록기 모델의 상품 카탈로그 관리를 기반으로 하여 분산처리의 update프로세스를 채택한다. 또한 이 아키텍쳐는 구매자 관점과 공급자 관점을 모두 고려한다. 상품정보의 일관성과 버전 관리는 UNSPSC코드 시스템에 의하여 제어된다. 고객이 사용하기 편리하도록 표준화에 포함되어져 있지 않은 상품명과 다국어 상품명은 Semantic Network, 시소러스(thesaurus)와 Semantic Web의 상품명 온톨로지 등을 활용하여 해결한다. 이를 위한 알고리즘들을 설계하고 또한 구현한다.

  • PDF

A Study of User XQuery Pattern Method based Recommender System

  • Kim, Jin-Hong;Lee, Eun-Seok
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.476-479
    • /
    • 2005
  • The information available on the Internet has become widely used, primarily due to the ability of Web based E-Commerce and M-Commerce Retrieval Engines to find useful information for users. However, present day Commerce Retrieval Engines are far from perfect because they return results based on simple user keyword matches without any regard for the concepts in which the user is interested. In this thesis, we design and evaluate a Recommender system for web context aware based information retrieval using user profiles. Also, we designed personalization framework in ubiquitous environment based both e-commerce and m-commerce and presented the interaction of user profile including User XQuery pattern in semantic web.

  • PDF

정보 검색 기술을 이용한 대규모 이질적인 XML 문서에 대한 효율적인 선형 경로 질의 처리 (Efficient Linear Path Query Processing using Information Retrieval Techniques for Large-Scale Heterogeneous XML Documents)

  • 박영호;한욱신;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.540-552
    • /
    • 2004
  • 본 논문에서는 대규모 이질 XML 문서들에 대한 부분 매치 질의를 효과적으로 처리하는 새로운 방법 XIR-Linear를 제안한다. XPath 질의는 XML 문서를 표현하는 트리 구조에 대한 경로 표현식 (path expression)으로 쓰여진다. 주요한 형태의 XPath 질의는 부분 매치 질의(partial match query)이다. XIR-Linear의 목적은 이질적인 스키마들을 가진 대규모 문서들에 대한 부분 매치 질의를 효과적으로 지원하는 것이다. XIR-Linear는 관계형 테이블을 이용한 스키마-레벨 방법에 기반을 두고, 역 인덱스 (inverted index) 기술을 사용하여 XPath 질의 처리의 효율성을 획기적으로 향상시킨다. 본 방법은 레이블 경로(label path)를 덱스트로 간주하고 레이블 경로 내의 레이블(label)들을 텍스트 내에 있는 키워드(keyword)로 간주한 후, 레이블들을 정보 검색 기술을 이용하여 인덱스 함으로써 전통적인 방법들에서 사용된 스트링 매치(string match) 보다 효율적인 방법으로 질의와 매치되는 레이블 경로들을 찾을 수 있도록 하였다. 성능 평가에서는 인터넷에서 수집한 XML 문서들을 사용하여 기존의 관계형 테이블을 이용하는 XRel, XParent와 비교 실험함으로써, 제안한 방법의 효율성을 입증한다. 실험을 통해 XIR-Linear가 실험 범위 내에서 XRel 이나 XParent에 비해 수십 배 이상 좋은 성능을 보이며, XML 문서 수의 증가함에 따라 더욱 우수하다는 것을 보인다.

MPEG-7 기반의 영상정보 검색시스템설계 및 구현 (A Design and Implementation of Movie Information Retrieval System based on MPEG-7)

  • 곽길신;주경수
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.73-84
    • /
    • 2005
  • 멀티미디어 데이터의 증가에 따라 데이터의 빠르고 정확한 검색의 필요성이 대두되었다. 또한 효과적인 검색을 위해서는 데이터에 대한 적절한 표현 방식이 필요하다 이런 이유로, 2001년에 멀티미디어 컨텐츠를 묘사하기 위한 MPEG-7 표준이 제정되었다. 최근 국내에서는 이미 존재하는 영상정보 메타데이터의 한계를 극복하고 영상정보의 다양한 관점을 표현하기 위해 한국영상자료원의 지원으로 새로운 영상정보메타데이터가 제안되었다. 이 영상정보 메타데이터는 영상정보의 자원에 대한 특성을 좀 더 효과적으로 표현한다. 본 논문에서는 한국영상자료원의 지원으로 개발된 영상정보 메타데이터를 수용하기 위하여, 멀티미디어 컨텐츠의 메타데이터 표현을 MPEG-7으로 확장한 XML스키마 기반의 영상정보 검색시스템을 개발하였다. 이에 따라, 영상정보 메타데이터 기반의 high-level 메타데이터와 MPEG-7 기반의 low-level 메타데이터를 이용한 검색을 통해 기존의 멀티미디어 검색시스템에 비해 국내 영상정보 이미지의 상호교환이 용이 해질 것이며, 영상정보 메타데이터의 재사용성을 높일 수 있고 체계적이고 빠른 검색이 가능할 것이다.

  • PDF

비디오 샷 검증 시스템 (A Video Shot Verification System)

  • 정지문
    • 디지털융복합연구
    • /
    • 제7권2호
    • /
    • pp.93-102
    • /
    • 2009
  • Since video is composed of unstructured data with massive storage and linear forms, it is essential to conduct various research studies to provide the required contents for users who are accustomed to dealing with standardized data such as documents and images. Previous studies have shown the occurrence of undetected and false detected shots. This thesis suggested shot verification and video retrieval system using visual rhythm to reduce these kinds of errors. First, the system suggested in this paper is designed to detect the parts easily and quickly, which are assumed as shot boundaries, just by changing the visual rhythm without playing the image. Therefore, this enables to delete the false detected shot and to generate the unidentified shot and key frame. The following are the summaries of the research results of this study. Second, during the retrieving process, a thumbnail and keyword method of inquiry is possible and the user is able to put some more priorities on one part than the other between the color and shape. As a result, the corresponding shot or scene is displayed. However, in the case of not finding the preferred shot, the key picture frame of similar shot is supplied and can be used in the further inquiry of the next scene.

  • PDF