• 제목/요약/키워드: Structure Retrieval

검색결과 429건 처리시간 0.02초

BRS/Search 시스템을 이용한 XML 문서 검색시스템 설계 및 구현 (Design and Implementation of a XML Document Retrieval System Using the BRS/Search System)

  • 손충범;이병엽;유재수
    • 인터넷정보학회논문지
    • /
    • 제2권2호
    • /
    • pp.51-63
    • /
    • 2001
  • 본 논문에서는 상용 검색 엔진인 BRS/Search 시스템을 이용하여 XML문서에 대한 구조 기반 검색이 가능하도록 XML문서 검색시스템을 설계하고 구현한다. 본 논문에서 구현한 시스템은 XML문서의 논리적인 구조를 Unix 파일시스템의 디렉토리 구조로 표현한다. 이렇게 표현된 XML 문서를 BRS/Search 시스템의 데이터베이스에 정보의 손실 없이 저장하기 위해 데이터베이스 스키마를 정의하고 내용 검색뿐만 아니라, 구조 검색, 혼합 검색, 애트리뷰트 검색이 가능하도록 BRS/search 시스템에 부가적으로 필요한 ETID 추출기, 구조정보 추출기, 저장 관리기, 질의 처리기를 설계하고 구현한다.

  • PDF

XML 문서의 효율적인 구조 검색을 위한 색인 모델 (An Indexing Model for Efficient Structure Retrieval of XML Documents)

  • 박종관;손충범;강형일;유재수;이병엽
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.451-460
    • /
    • 2001
  • 본 논문에서는 XML 문서의 효율적인 구조 검색을 위한 색인 모델을 제안한다. 색이 모델은 문선 계층상의 모든 레벨에서 내용 기반 질의와 구조 및 에트리뷰트 질의와 같은 다양한 질의를 지원하기 위한 구조정보와 이를 이용한 색이 구조로 구성된다. 구조검색을 지원하기 위해 새로운 구조정보 표현 방법을 제안한다. 제안한 구조정보 표현 방법에 따라 표현된 구조정보를 이용해 효율적인 검색을 위한 내용 색인, 구조 색인, 에트리뷰트 색인을 구성한다. 또한 내용과 구조가 혼합된 질의의 처리과정을 설명하고, 제안하는 색인 모델의 성능평가를 보임으로써 기존의 방법보다 성능이 우수함을 보인다.

  • PDF

인덱스 그래프 : 동적 문서 데이터베이스를 위한 IR 인덱스 구조 (Index Graph : An IR Index Structure for Dynamic Document Database)

  • 박병권
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제10권1호
    • /
    • pp.257-278
    • /
    • 2001
  • An IR(information retrieval) index for dynamic document databases where insertion, deletion, and update of documents happen frequently should be frequently updated. As the conventional structure of IR index is, however, focused on the information retrieval purpose, its structure is inefficient to handle dynamic update of it. In this paper, we propose a new structure for IR Index, we call it Index Graph, which is organized by connecting multiple indexes into a graph structure. By analysis and experiment, we prove the Index Graph is superior to the conventional structure of IR index in the performance of insertion, deletion, and update of documents as well as the performance of information retrieval.

  • PDF

Dependency Structure Applied to Language Modeling for Information Retrieval

  • Lee, Chang-Ki;Lee, Gary Geun-Bae;Jang, Myung-Gil
    • ETRI Journal
    • /
    • 제28권3호
    • /
    • pp.337-346
    • /
    • 2006
  • In this paper, we propose a new language model, namely, a dependency structure language model, for information retrieval to compensate for the weaknesses of unigram and bigram language models. The dependency structure language model is based on the first-order dependency model and the dependency parse tree generated by a linguistic parser. So, long-distance dependencies can be naturally captured by the dependency structure language model. We carried out extensive experiments to verify the proposed model, where the dependency structure model gives a better performance than recently proposed language models and the Okapi BM25 method, and the dependency structure is more effective than unigram and bigram in language modeling for information retrieval.

  • PDF

효율적인 정보 검색 시스템 구축을 위한 새로운 프로세스 구조 (A New process Structure for Constructing Efficient Information Retrieval Systems)

  • 고형대;유재수;김병기
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.76-86
    • /
    • 1997
  • 기존 정보 검색 시스템의 프로세스 구조는 사용자를 위한 클라이언트 프로세스와 정보검색 시스템을 위한 서버 프로세스가 일대일로 대응하는 간단한 구조이다. 그러 나 사용자 마다 사용자 인터페이스, 검색 모델, 자동색인 및 저장 시스템으로 구성되 어 있는 큰 서버 프로세스가 하나씩 할당되기 때문에 많은 수의 사용자가 정보검색 시스템을 사용할 때 시스템 오버헤드가 커져 시스템을 사용할 수 없는 문제를 발생시 킨다. 본 논문에서는 이와 같은 기존 정보 검색 시스템의 프로세스 구조가 갖는 문제 점을 해결한 효율적인 정보 검색 시스템 구축을 위한 새로운 프로세스 구조를 제안한 다. 제안된 프로세스 구조는 정보 검색 시스템의 전체적인 동작 성능 및 컴퓨터 시스 템 자원의 효율적인 활용에 기여할 수 있게 된다. 제안된 프로세스의 구축은 프로세 스 오버헤드를 최소화하여 많은 수의 사용자 환경을 지원할 수 있는 다중 스레드와 전체 시스템의 성능을 향상시키기 위해 제공되는 트랜잭션 처리 모니터에 근거한다.

  • PDF

효율적인 검색을 위한 Tree 형태의 XML 문서 구조 모델 (XML Structured Model of Tree-type for Efficient Retrieval)

  • 김영란
    • 한국컴퓨터정보학회논문지
    • /
    • 제9권4호
    • /
    • pp.27-32
    • /
    • 2004
  • XML 문서가 DTD를 포함하지 않거나 여러 곳에서 XML문서를 모았을 때, 그 구조는 비정규적일 수 있다. 비정규적인 구조를 가지는 문서들에 대해 정확한 구조적 질의를 작성하는 것은 어려운 일이다. 이 논문에서는 XML 문서의 효율적인 관리와 검색을 위한 XML 문서 모델과 구조적 검색 방법을 제안한다. 이를 위해 XML 문서의 구조 정보를 표현하기 위해 엘리먼트에 대한 정보를 갖는 고정된 크기의 LETID를 사용하고, 구조 정보 검색을 위한 부모 및 자식 엘리먼트 검색 알고리즘을 제시하였다. 제안된 방법을 이용하여 XML 문서의 구조 정보를 효율적으로 표현할 수 있을 뿐만 아니라. 간단한 연산으로 특정 엘리먼트에 직접적인 접근과 다양한 질의 처리가 가능하다. 또한, 특정 엘리먼트의 부모. 자식, 형제에 대한 다양한 구조 검색을 효율적으로 지원할 수 있는 효과가 기대된다.

  • PDF

Modified Element Type ID Representation for XML Structure Retrieval

  • Jin, Seung-Hoon;Kim, Soon-Cheol;Kim, Jong-Wan;Kang, Sin-Jae
    • 한국산업정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.61-68
    • /
    • 2003
  • In this paper, a representation method for structure information retrieval without schema and DTD of XML documents is presented. While existing researches have used DTD or schema to extract structure information, we extract structure information directly from XML documents. Especially the well-formed XML documents are only required to retrieve documents in the proposed method. Thus it can retrieve more general and various documents easily compared to the existing XML retrieval systems requiring DTD or schema. Experimental result indicates that the proposed method retrieves effectively structure information of XML documents independently to DTD information.

  • PDF

단말노드 언어모델 기반의 XML문서검색에서 구조 제한의 유용성에 관한 실험적 연구 (A Experimental Study on the Usefulness of Structure Hints in the Leaf Node Language Model-Based XML Document Retrieval)

  • 정영미
    • 정보관리학회지
    • /
    • 제24권1호
    • /
    • pp.209-226
    • /
    • 2007
  • XML웹 문서 포맷은 문헌 내에 내용과 의미있는 논리적인 구조 정보를 포함할 수 있어, 검색에서 문서의 내용뿐만 아니라 구조로 접근하는 것을 제공한다. 그래서 본 연구의 목적은XML검색에 있어 내용 검색에 추가적인 요소로 사용된 구조적인 제한이 얼마나 유용한지를 실험하기 위해 내용만으로 검색한 결과와 내용과 구조적인 제한을 가지고 검색한 결과간의 성능을 비교하였다. 이 실험은 자체 개발된 단말노드 언어모델기반의 XML 검색시스템을 사용하였고 INEX 2005의 ad-hoc track에 참여하여 모든 실험방법과 INEX 2005의 실험 문헌 집단을 사용하였다.

이용자 문제의 구조와 이의 이용자 문제 지향적 정보검색에 대한 적용 - 대학원에서의 학술 연구과제를 대상으로 한 사례연구 - (The Structure of the User's Problem and It's Implication for User-Oriented Information Service - A Case Study in an Academic Research Environment -)

  • 박홍석
    • 한국문헌정보학회지
    • /
    • 제28권
    • /
    • pp.247-266
    • /
    • 1995
  • The purpose of information retrieval is to help users solve their problems. To fulfill the purpose the user's problem needs to be focused on. The purpose of this study is to identify components and the structure of the user's problem in an academic research environment. From this study it was found that the scientific problem dealt within an academic environment is complicate and the problem is composed of 8 topical and 4 non-topical components. And they could be organized into a stucture. This study has three implications for user-oriented information retrieval. (1) The components and the structure of the problem need to be the framework for the effective information retrieval process and for the evaluation of information retrieval. (2) The research methodology used in this study can be applied to other information service situations and this will result in greater practical implication of a study for more effective information retrieval. And (3) for more effective user-oriented information retrieval, the user needs to be observed and studied in the actual' situation. This study showed that the complicate problem of the actual user can be studied in a systematic way and this resulted in important implications for information retrieval.

  • PDF