• 제목/요약/키워드: XML Keyword Retrieval

검색결과 18건 처리시간 0.017초

대용량 XML 문서의 효율적인 검색과 관리를 위한 SCOF 모델 (Service-centric Object Fragmentation Model for Efficient Retrieval and Management of Huge XML Documents)

  • 정창후;최윤수;진두석;김진숙;윤화묵
    • 인터넷정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.103-113
    • /
    • 2008
  • XML 문서가 증가하면서 XML 문서를 처리하는 방법론에 대한 많은 논의가 있어왔다. 본 논문에서는 두 가지 중요한 목적을 가지고 XML 정보 검색 및 관리 시스템을 개발하는데, 첫 번째는 질의에 적합한 내용을 쉽고 빠르게 검색해서 제공하는 것이고, 두 번째는 시스템의 부담을 최소화하면서 효율적이고 안정적인 관리 기능을 제공하는 것이다. 이렇게 실용적인 시스템을 개발하는 핵심 기술은 XML 문서를 어떻게 효과적으로 분할하여 구조적으로 서비스하는가에 달려 있다. 이러한 목적을 달성하기 위하여 본 논문에서는 SCOF(Service-centric Object Fragmentation) 모델을 제안한다. SCOF 모델은 XML 데이터 베이스 관리자에 의해서 정의되는 변환 규칙(conversion rule)을 이용하여 문서를 분할하는 준분할(semi-decomposition) 저장 방식이다. SCOF 모델을 사용한 키워드 기반 검색은 전형적인 XML 질의 언어처럼 문서의 특정 엘리먼트나 속성 값을 이용하여 검색을 수행할 수 있다. 비록 이러한 접근법이 XML 문서 컬렉션에 대한 관리자의 지식을 필요로 한다고 하더라도, 개별 문서의 크기나 전체 문서의 양에 상관없이 검색과 관리를 효율적으로 수행할 수 있기 때문에 실용적인 시스템을 구축할 수 있다는 장점이 있다.

  • PDF

네비게이션 정보추출에 의한 XML 본문검색시스템 (XML Fulltext Retrieval System by Extracting Navigation Information)

  • 강남규;이응봉;이석형
    • 정보관리학회지
    • /
    • 제19권3호
    • /
    • pp.91-110
    • /
    • 2002
  • 최근, 키워드 기반 정보검색의 한계를 극복하기 위한 구조문서 기반의 연구가 활발하게 진행되고 있지만, 실제 적용에는 많은 어려움이 존재한다. 본 고에서는 구조문서에 대한 본문검색시스템을 제안한다. 본문검색시스템에 적용된 문서는 XML로 구축된 국가 연구개발보고서를 대상으로 하였으며, XML 연구보고서의 DTD. 본문 간의 이동을 위한 네비게이션 정보추출, 본문검색을 위한 검색엔진의 적용 방안에 관하여 살펴본다. 본 시스템은 XML 문서에 대해 문서의 구조정보를 저장하고 이를 검색하여 다양한 형태로 열람할 수 있는 검색엔진의 부재 상황을 본문검색이라는 방법으로 극복하기 위한 것이다.

XML 웹 서비스 검색 엔진의 개발 (Development of a XML Web Services Retrieval Engine)

  • 손승범;오일진;황윤영;이경하;이규철
    • Journal of Information Technology Applications and Management
    • /
    • 제13권4호
    • /
    • pp.121-140
    • /
    • 2006
  • UDDI (Universal Discovery Description and Integration) Registry is used for Web Services registration and search. UDDI offers the search result to the keyword-based query. UDDI supports WSDL registration but it does not supports WSDL search. So it is required that contents based search and ranking using name and description in UDDI registration information and WSDL. This paper proposes a retrieval engine considering contents of services registered in the UDDI and WSDL. It uses Vector Space Model for similarity comparison between contents of those. UDDI registry information hierarchy and WSDL hierarchy are considered during searching process. This engine suppports two discovery methods. One is Keyword-based search and the other is template-based search supporting ranking for user's query. Template-based search offers how service interfaces correspond to the query for WSDL documents. Proposed retrieval engine can offer search result more accurately than one which UDDI offers and it can retrieve WSDL which is registered in UDDI in detail.

  • PDF

키워드 질의를 이용한 순위화된 웹 서비스 검색 기법 (Ranked Web Service Retrieval by Keyword Search)

  • 이경하;이규철;김경옥
    • 한국전자거래학회지
    • /
    • 제13권2호
    • /
    • pp.213-223
    • /
    • 2008
  • 오늘날 XML 웹 서비스의 보급에 따라 많은 양의 서비스로부터 적합한 서비스들을 발견해 내는 문제는 중요한 문제로 부각되고 있다[7, 24]. 본 논문에서는 의미론적인 서비스 발견을 행하는 기존 연구와 다르게 구문적인 방법으로 서비스 발견 문제에 접근한다. 우리는 웹서비스 발견의 문제를 레지스트리에 저장된 웹 서비스 설명 정보들에 대한 정보 검색의 문제로 인식하고, 웹 서비스와 질의의 모델링과 유사도 측정을 통한 검색 기법을 고안하였다. 이 서비스 설명정보는 특정 구조를 가지는 XML 문서이며, 본 논문에서는 이를 대상으로 한 키워드 질의를 통해 서비스 발견을 수행한다. 본 논문의 특징은 다음과 같다. 사용자는 키워드 질의를 통해 순위화된 서비스 검색 결과를 제공받을 수 있다. 서비스 검색에 있어 기존 기법들과 달리 UDDI 레지스트리에 저장된 서비스 설명 정보와 WSDL 서비스 정의 모두를 활용한다. 또한 시스템은 기존 관계형 DBMS의 기능을 이용하여 구현됨으로써 의미적인 서비스 발견에 비해 구현이 용이하고, DBMS의 여러 장점을 취할 수 있다.

  • PDF

효과적인 소프트웨어 컴포넌트 분류 및 검색에 관한 연구 (A Study for the Effective Classification and Retrieval of Software Component)

  • 조병호
    • 인터넷정보학회논문지
    • /
    • 제7권6호
    • /
    • pp.1-10
    • /
    • 2006
  • 컴포넌트 재사용을 통한 소프트웨어의 개발은 소프트웨어 생산비용을 절감할 수 있는 유용한 방법이다. 그러나 컴포넌트 재사용에 있어 키워드나 카테고리 분류에 의한 검색 방법은 컴포넌트 개체의 복잡성으로 인하여 정확한 컴포넌트 검색이 어렵다. 따라서 기존의 다른 연구 방법을 조사/분석하여 XML 명세를 이용한 컴포넌트 분류 및 검색에 효과적인 방법 및 이를 기반으로 한 컴포넌트 통합관리 시스템 구조를 제시하고자 한다. 컴포넌트 검색에 있어 많은 일치하지 않은 컴포넌트 메타 표현인 DTD 항목이 존재한다. 이를 보완하기 위하여 정확도 및 간결도 측정을 사용한 검색 방법은 우선적으로 고려해야할 컴포넌트를 찾는데 효과적인 하나의 방법이다. 이 방법은 기존의 키워드 검색으로 어려운 유사하게 일치하는 항목의 컴포넌트를 찾음으로써 보다 나은 우선순위를 갖는 적합한 컴포넌트 검색이 가능하게 한다.

  • PDF

Syslog 데이터의 의미론적 검색을 위한 XML 기반의 모델링 (XML-based Modeling for Semantic Retrieval of Syslog Data)

  • 이석준;신동천;박세권
    • 정보처리학회논문지D
    • /
    • 제13D권2호
    • /
    • pp.147-156
    • /
    • 2006
  • 이벤트 로깅은 시스템 및 네트워크 관리에 있어 그 역할이 증대되고 있으며, syslog는 해당 분야에 있어 사실상의 표준으로 사용되고 있다. 그러나 대부분의 로그 분석은 반구조적 특징을 보이는 로그 형식으로 인하여 빈번히 출현하는 패턴에만 집중하고 있다. XML은 syslog 데이터를 구조화하는 데 있어 유용한 방식을 제공하고 정보 탐색을 용이하게 해 준다. 하지만 이전의 XML 형식들 및 어플리케이션들은 로그 데이터를 위한 순위 기반 검색이나 유사도 측정 등과 같은 의미론적 접근에 적합하지 않다. 본 논문에서는 XML 기반의 순위 키워드 검색 기법을 기초로, 새로운 로그 데이터 모델링을 통해 syslog 데이터를 위한 XML 트리 구조를 제안한다. 그리고 기존의 XML 구조보다 의미론적 검색에 적합함을 보인다.

XML 문서 검색을 위한 경로 역 색인 기법 (The Path Inverted Index Technique for XML Document Retrieval)

  • 문경원;황병연
    • 정보처리학회논문지D
    • /
    • 제17D권2호
    • /
    • pp.103-110
    • /
    • 2010
  • 최근에 관계형 데이터베이스 관리 시스템(RDBMS)의 장점을 이용하여 XML로 표현된 문서를 효과적으로 저장, 관리, 검색하는 XML 문서관리 시스템에 대한 많은 연구들이 활발하게 진행되어 왔다. 그러나 경로 질의 중에서 LIKE 연산과 같은 부분 패턴 매칭 질의의 경우는 비효율적인 비교 연산으로 인해 검색 성능이 현저하게 떨어지기 때문에 RDBMS의 색인의 효과를 볼 수 없다. 본 논문에서는 XML 문서를 RDBMS에 효율적으로 저장하는 계층형 XML 저장 기법과 경로 역 색인 기법을 제안한다. 제안하는 기법은 XML문서의 엘리먼트를 키워드로 보고 해당 키워드가 속한 경로의 식별자와 시퀀스로 포스팅 파일을 구성하여 경로 기반 질의의 검색 속도를 향상하는데 주안점을 둔다. 검색 성능에 관한 실험을 통해서 제안된 기법이 기존의 RDBMS를 이용한 기법보다 약 60% 우수한 성능을 가지고 있음을 입증한다.

XML 정보검색의 효율적 전처리를 위한 문서여과 알고리즘 (Document Filtering Algorithm for Efficient Preprocessing of XML Information Retrieval)

  • 공용해;김명숙
    • 한국산학기술학회논문지
    • /
    • 제6권1호
    • /
    • pp.1-11
    • /
    • 2005
  • 본 논문은 다수의 XML문서들을 대상으로 하는 XML 정보검색에서, XML의 효율적 질의검색을 위한 전처리 방법을 제안한다. 기존의 전처리 방법은 질의의 키워드에 대하여 XML 문서를 파싱하거나, 질의와 XML 문서로부터 생성된 시그너처 정보를 비교하여 XML 문서를 여과한다. 그러나 이러한 방법은 질의에 종속적이며 다량의 XML 문서들이 존재할 경우 매우 비효율적이다. 이를 위하여, 본 연구는 온톨로지를 사용하여 서로 다른 구조와 속성을 갖지만 동일 영역의 정보를 포함하고 있는 XML 문서에 적용 가능한 포괄적 DTD를 생성하고, 이를 이용하여 검색 영역에 포함되지 않는 불필요한 XML문서를 여과한다. 예제 XML 문서를 적용하여 제안한 문서여과 알고리즘의 성능을 테스트한다.

  • PDF

의료영상 관리를 위한 검색시스템 구현 (An Implementation of Retrieval System for Medical Image Management)

  • 김경수
    • 디지털산업정보학회논문지
    • /
    • 제5권4호
    • /
    • pp.61-67
    • /
    • 2009
  • PACS and Medical Image System use only high level metadata in retrieving desired image nowadays. In order to retrieve Medical Image Data more efficiently, it would be needed to retrieve similarity by utilizing low level metadata as well as keyword retrieval by high level metadata. Thus, In this paper presents that it has realized similarity retrieval by low level metadata on the basis of MPEG-7, and keyword retrieval by high level metadata of DICOM base. It would be also available to look into medical image data in various methods and read accurate image promptly for diagnosis and treatment by retrieval with integrating two metadata.

SCORM 기반의 XML 학습 컨텐츠 검색 시스템 (XML-based Retrieval System for SCORM-based Virtual Learning Contents)

  • 최병욱;송미숙;조정원
    • 컴퓨터교육학회논문지
    • /
    • 제6권1호
    • /
    • pp.9-17
    • /
    • 2003
  • 차세대 인터넷 표준 언어인 XML(eXtensible Markup Language)은 데이터(data)와 표현(presentation) 그리고 구조(structure)가 구분되기 때문에 어느 환경에서나 재사용성이나 재구성이 용이한 장점을 보이고 있다. 본 논문에서는 XML 문서를 가상교육 시스템(Virtual Education System)의 멀티미디어 컨텐츠로 범위를 제한하여 사용자 위주의 효율적인 검색 시스템을 구현한다. 본 시스템에서는 가상교육 표준안으로 제안되고 있는 SCORM(Sharable Content Object Reference Model)에서 정의한 SCO(Sharable Content Object)단위의 메타데이터를 기반으로 컨테츠를 설계하고 각 문서를 키워드, 엘리먼트, 애트리뷰트 단위로 색인한다. 또한 사용자 인터페이스에서 엘리먼트 검색화면을 구조적으로 구성해줌으로써 사용자가 DTD(Document Type Definition)에 대한 사전지식 없이도 검색이 가능하며, XML-QL로 재구성된 XML 문서의 형태와 XSL(eXtensible markup language Stylesheet Language)을 이용한 HTML 형태의 두 가지 결과화면을 제시함으로써 사용자 선택의 폭을 넓혀준다.

  • PDF