• Title/Summary/Keyword: 구조문서검색

Search Result 519, Processing Time 0.034 seconds

XML Document Structure Search based on XQL (XQL 기반의 XML문서 구조 검색)

  • 박종훈
    • Proceedings of the Korea Database Society Conference
    • /
    • 2000.11a
    • /
    • pp.95-100
    • /
    • 2000
  • 사실 표준 XQL(XML Query Language) 기반의 문서 질의를 이용하여 XML 문서에 대한 구조 검색과 내용 검색을 위한 문서검색 시스템을 구성하였다. 즉 XML 문서를 파징하여 내용 및 구조 정보를 트리구조로 구성하고, 표준 XQL을 이용하여 트리 구조 정보에 질의함으로서 구조 및 내용 검색을 하도록 구현하였다. 이를 이용한 응용분야로는 향후 방대한 크기의 XML문서 검색과 문서 관리, 전자 상거래 등 다양한 분야에 활용될 수 있는 요소기술로서 기대된다.

  • PDF

Design and implementation of a structure-and content-based document retrieval system for XML documents (XML 문서를 위한 구조 및 내용기반 문서검색 시스템 설계 및 구현)

  • 이정재;장재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.93-95
    • /
    • 1999
  • 최근 XML 문서에 대한 활용이 늘어나면서 이들 문서에 대한 저장 및 검색에 대한 요구가 증가하고 있다. XML문서는 SGML(Standard Generalized Markup Language) 문서가 가지고 있는 다양한 기능들과 구조적인 표현 능력, 그리고 사용의 용이성 등의 장점을 지닌 언어로 1996년 웹의 문서 표준으로 제안되었다. 따라서 XML 문서의 특성을 반영한 문서 검색시스템에 대한 요구가 시급한 상태이며, 기존의 시스템의 경우 구조 및 내용-기반 멀티미디어 문서검색을 효과적으로 지원하지 못하고 있다. 본 논문에서는 XML 문서의 구조정보 및 내용정보를 효과적으로 검색할 수 있는 XML 문서 저장 시스템을 설계 및 구현한다. 구현하는 시스템은 구조-기반 검색을 위해 o2store위에 역파일 인덱스를 구축하고 내용-기반 검색을 위해 X-tree를 사용한다. 또한 검색 인터페이스를 JAVA로 구현하여 효율적인 검색이 이루어지도록 한다.

  • PDF

Update conscious and depth insensitive inverted indexes for XML full-text queries (XML 문서의 변경을 고려한 XML 전문 검색 역인덱스)

  • Kwon, Guk-Bong;Hong, Dong-Kweon;Kim, Kweon-Yang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.81-84
    • /
    • 2004
  • XML 문서는 관계형 테이블과는 달리 문서의 구조가 매우 복잡하고 불규칙하여 부분적인 정보를 최대한 활용하는 전문 검색이 일반적인 구조적 검색보다 더 중요한 역할을 한다. XML 문서는 계층이 있으므로 계층을 사용하는 전문 검색 연산은 계층을 제공함으로써 검색 공간을 줄여서 검색의 정확성과 효율성을 훨씬 더 높일 수 있다. 전문 검색 연산을 효과적으로 지원하기 위한 방법으로는 역인덱스를 (inverted index) 사용하는 것이 가장 일반적인 방법이다. 지금까지의 전문 검색을 위한 XML 문서의 구조 정보를 표현, 저장하는 방법들은 문서의 내용이 변경되지 않는 정적 문서(static documents)만을 고려하여 왔다. 이 방법들은 문서가 동적으로 변화할 경우 저장된 문서의 구조 정보 중에서 많은 부분을 다시 표현해야 하는 비효율적인 면이 있다. 본 논문은 XML 문서의 동적인 변화를 지원하면서 동시에 복잡한 XML 전문 검색을 지원하기 위한 방법으로 경로 스트링을 사용하는 효율적인 역 인덱스 구축 기법을 제안하고 제안하는 방법이 복잡한 문서의 검색과 문서의 동적인 변화를 효율적으로 검색할 수 있음을 보인다.

  • PDF

Design and Implementation of a Retrieval System for SGML Documents (SGML 문서 검색시스템의 설계 및 구현)

  • 고승규;조승기;백승욱;이경호;최윤철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.84-86
    • /
    • 1999
  • 문서의 논리적 구조정보를 표현하는 SGML 문서는 CALS, 디지털 도서관(Digital Library), 인터넷 분야에서 많이 사용되고 있다. 이렇게 SGML 문서들이 널리 사용됨에 따라 문서들의 효율적인 관리가 필요하게 되었고, 사용자가 원하는 문서를 정확하고 신속하게 검색해 줄 수 있는 검색 시스템의 개발이 필요하게 되었다. 좀 더 정확한 문서를 검색해 내기 위해서는 SGML 문서의 특징인 구조정보를 이용한 검색이 필수적이다. 이에 본 연구에서는 효율적인 SGML 문서의 검색을 위한 구조적 기반의 질의어로 eXQL을 정의하고, 이를 지원하는 검색시스템을 개발하였다. 특히 질의어에 경로 연산자를 지원하여 원하는 정보를 정확하게 찾을 수 있도록 하였다. 또한 본 시스템은 구조적인 검색을 효율적으로 지원하기 위하여 구조정보를 DSSL의 Grove에 기반한 구조로 저장한다.

  • PDF

Study for XML document retrieval to use XSL (XSL를 이용한 XML 문서 검색에 관한 연구)

  • 김충성;김용성
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.66-68
    • /
    • 1999
  • 최근 들어 이 기종 간의 문서 교환을 위해 SGML(Standard Markup Language) 문서보다 XML(eXtend Markup Language) 문서가 인터넷 기반에서 표준으로 자리잡고 있다. 앞으로 인터넷상의 수많은 정보들을 XML을 기반으로 할 것이고 이를 위해 문서 정보 검색 시스템이 필요하게 된다. 문서의 논리 구조를 표현하는 DTD(Document Type Definition) 기반으로 구조 검색을 할 수 있지만 본 논문에서는 XSL(XML Style Sheet Language) 문서에서 DTD의 Element를 지정하는 Pattern을 이용하여 문서 구조와 속성을 새로운 Tree로 표현하며 검색에 필요한 질의어 또한 XSL의 Pattern 자체를 이용하고 있다. 사용자에게 편하고 효율적인 검색 환경을 위해서 검색 인터페이스의 모형을 제안하였다.

  • PDF

Structure-based Clustering for XML Document Retrieval (XML 문서 검색을 위한 구조 기반 클러스터링)

  • Hwang Jeong Hee;Ryu Keun Ho
    • The KIPS Transactions:PartD
    • /
    • v.11D no.7 s.96
    • /
    • pp.1357-1366
    • /
    • 2004
  • As the importance or XML is increasing to manage information and exchange data efficiently in the web, there are on going works about structural integration and retrieval. The XML. document with the defined structure can retrieve the structure through the DTD or XML schema, but the existing method can't apply to XML. documents which haven't the structure information. Therefore. in this paper we propose a new clus-tering technique at a basic research which make it possible to retrieve structure fast about the XML documents that haven't the structure information. We first estract the feature of frequent structure from each XML document. And we cluster based on the similar structure by con-sidering the frequent structure as representative structure of the XML document, which makes it possible to retrieve the XML document raster than dealing with the whole documents that have different structure. And also we perform the structure retrieval about XML documents based on the clusters which is the group of similar structure. Moreover, we show efficiency of proposed method to describe how to apply the structure retrieval as well as to display the example of application result.

Cross Field Searching Model for Field Structured Documents (필드 구조 문서를 위한 교차 필드 검색 모델)

  • 윤보현;왕지현;강현규
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.224-230
    • /
    • 2000
  • 기존의 전문 검색 시스템은 문서를 단지 단어의 연속이라는 제한적 관점에서만 바라보았다. 또한 기존의 필드 검색 시스템은 고정된 필드를 색인 및 검색대상으로 하거나, 문서의 내용이 아닌 메타 정보에 관한 검색만이 가능하였다. 본 논문에서는 내용과 필드 구조를 통합하여 가변 필드 구조 문서를 색인 및 검색하는 모델인 교차 필드 검색 모델을 제안한다. 기존 정보검색 시스템의 기능을 기본으로 제공하면서 필드구조를 색인/검색하기 위한 기능적 요구사항을 제시하고, 내용 및 필드 구조를 색인하면서 동적인 삽입/삭제가 가능한 색인 구조를 제안한다. 아울러 검색시에 문서 가중치를 계산하여 문서를 순위조정하는 분리언 모델, 확장 불리언 모델, 벡터 공간 모델의 변형 모델을 제시한다. 아울러 구현 사례로 STEER-XDS 검색 시스템에 대해 알아본다.

  • PDF

Cross Field Searching Model for Field Structured Documents (필드 구조 문서를 위한 교차 필드 검색 모델)

  • Yun, Bo-Hyun;Wang, Ji-Hyun;Kang, Hyun-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.224-230
    • /
    • 2000
  • 기존의 전문 검색 시스템은 문서를 단지 단어의 연속이라는 제한적 관점에서만 바라보았다. 또한 기존의 필드 검색 시스템은 고정된 필드를 색인 및 검색대상으로 하거나, 문서의 내용이 아닌 메타 정보에 관한 검색만이 가능하였다. 본 논문에서는 내용과 필드 구조를 통합하여 가변 필드 구조 문서를 색인 및 검색하는 모델인 교차 필드 검색 모델을 제안한다. 기존 정보검색 시스템의 기능을 기본으로 제공하면서 필드구조를 색인/검색하기 위한 기능적 요구사항을 제시하고, 내용 및 필드 구조를 색인하면서 동적인 삽입/삭제가 가능한 색인 구조를 제안한다. 아울러 검색시에 문서 가중치를 계산하여 문서를 순위조정하는 불리언 모델, 확장 불리언 모델, 벡터 공간 모델의 변형 모델을 제시한다. 아울러 구현 사례로 STEER-XDS 검색 시스템에 대해 알아본다.

  • PDF

Design of A Page Modification Detector for Meta-search Engines (메타 검색엔진을 위한 페이지 변경 탐지기 설계)

  • 박상위;오정석;이상호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.205-207
    • /
    • 2001
  • 웹 상의 HTML 문서들은 수시로 변경되고 있으며, 정보를 검색하는 웹사이트 또한 예외는 아니다. 다수의 웹 검색엔진들의 결과를 통합하는 메타 검색엔진은 각 검색엔진의 정보 변경에 민감해야 된다. 본 논문은, 수시로 변경되는 검색엔진들의 HTML 문서 정보를 메타 검색 엔진에 반영하기 위해, 자동적으로 검색엔진들의 질의 형태 변경과 검색 엔진의 검색 결과 HTML 문서의 구조 변경 탐지는 질의 결과가 반복되는 HTML 태그(tags) 문서 구조를 패턴(pattern)으로 이용한다. 패턴 발견 알고리즘은 문자열에서 규칙적으로 발생하는 패턴을 찾아내는 Jaak Vilo 알고리즘을 기반으로 HTML 문서를 처리할 수 있도록 확장하였다. 발견된 HTML 문서 패턴과 기존의 검색 엔진 HTML 페이지의 구조적 패턴 정보를 비교하여 문서 구조 변경을 탐지한다.

  • PDF

Design and Implementation of a Structure and Content-based Multimedia Document Retrieval System (구조 및 내용-기반 멀티미디어 문서검색 시스템의 설계 및 구현)

  • Jin, Du-Seok;Lee, Jeong-Jae;Chang, Jae-Woo
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.11
    • /
    • pp.3341-3355
    • /
    • 2000
  • 최근 멀티미디어 문서의 개수가 기하 급수적으로 증가함에 따라, 사용자가 요구하는 멀티미디어 문서를 보다 효과적으로 저장 및 검색할 수 있는 멀티미디어 문서 검색 시스템을 개발하는 것이 필요하다. 본 논문에서는 XML로 정의된 문서를 문서 구조 및 이미지 내용을 기반으로 보다 효율적으로 검색할 수 있는 시스템을 설계 및 구현한다. 효율적인 구조-기반 검색을 지원하기 위해서 구조 인덱스를 o2store 저장 시스템을 사용하여 구현한다. 아울러 내용-기반 검색을 지원하기 위해서 X-트리에 기반한 효율적인 고차원 색인구조를 구현한다. 마지막으로 구현된 멀티미디어 문서검색 시스템을 검색시간, 저장시간, 부가 저장 공간의 관점에서 성능평가를 수행한다.

  • PDF