• 제목/요약/키워드: information retrieval model

검색결과 616건 처리시간 0.025초

The Study On the Effectiveness of Information Retrieval in the Vector Space Model and the Neural Network Inductive Learning Model

  • Kim, Seong-Hee
    • 정보기술과데이타베이스저널
    • /
    • 제3권2호
    • /
    • pp.75-96
    • /
    • 1996
  • This study is intended to compare the effectiveness of the neural network inductive learning model with a vector space model in information retrieval. As a result, searches responding to incomplete queries in the neural network inductive learning model produced a higher precision and recall as compared with searches responding to complete queries in the vector space model. The results show that the hybrid methodology of integrating an inductive learning technique with the neural network model can help solve information retrieval problems that are the results of inconsistent indexing and incomplete queries--problems that have plagued information retrieval effectiveness.

  • PDF

피드백 정보를 이용한 불논리 검색 시스템의 성능 증진에 관한 실험적 연구 (A study on improving the effectiveness of a boolean retrieval system with feedback information)

  • 신은자;정영미
    • 정보관리학회지
    • /
    • 제15권1호
    • /
    • pp.129-148
    • /
    • 1998
  • 본 연구의 목적은 기존의 불논리 검색 시스템에서 사용할 수 있는 실용적인 피드백 검색 기법을 찾아내는 것으로서, 이용자의 적합성 평가 부담을 덜어줄 수 있도록 사전에 이용자 모형을 구축하여 놓고 피드백 검색시 시스템이 자동으로 적합성 평가를 하는 이용자 모형 기반 피드백 검색 기법을 제안하고 이의 유용성을 실험적으로 입증하였다. 이를 위하여 먼저 증진된 불논리 검색 모형인 DNF 검색 모형과 P-norm 검색 모형을 사용한 피드백 검색 실험을 실시한 후, 검색효율이 높게 나온 DNF 모형을 채택하여 이용자 모형 기반 피드백 검색을 실시하였다. 실험 결과 모든 피드백 검색은 초기검색에 비해 검색효율이 크게 향상되었으며, 이용자 모형 기반 피드백 검색은 DNF 피드백 검색 결과에는 못미치지만 P-norm 피드백 검색 결과와는 거의 같은 수준의 검색효율을 보였다.

  • PDF

Interactive Information Retrieval: An Introduction

  • Borlund, Pia
    • Journal of Information Science Theory and Practice
    • /
    • 제1권3호
    • /
    • pp.12-32
    • /
    • 2013
  • The paper introduces the research area of interactive information retrieval (IIR) from a historical point of view. Further, the focus here is on evaluation, because much research in IR deals with IR evaluation methodology due to the core research interest in IR performance, system interaction and satisfaction with retrieved information. In order to position IIR evaluation, the Cranfield model and the series of tests that led to the Cranfield model are outlined. Three iconic user-oriented studies and projects that all have contributed to how IIR is perceived and understood today are presented: The MEDLARS test, the Book House fiction retrieval system, and the OKAPI project. On this basis the call for alternative IIR evaluation approaches motivated by the three revolutions (the cognitive, the relevance, and the interactive revolutions) put forward by Robertson & Hancock-Beaulieu (1992) is presented. As a response to this call the 'IIR evaluation model' by Borlund (e.g., 2003a) is introduced. The objective of the IIR evaluation model is to facilitate IIR evaluation as close as possible to actual information searching and IR processes, though still in a relatively controlled evaluation environment, in which the test instrument of a simulated work task situation plays a central part.

2단계 유사관계 행렬을 기반으로 한 순위 재조정 검색 모델 (A Re-Ranking Retrieval Model based on Two-Level Similarity Relation Matrices)

  • 이기영;은희주;김용성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1519-1533
    • /
    • 2004
  • 웹 기반의 학술분야 전문 검색 시스템은 사용자의 정보 요구 표현을 극히 제한적으로 허용함으로써 검색된 정보의 내용 분석과 정보 습득의 과정이 일관되지 못해 무분별한 정보 제공이 이루어진다. 본 논문에서는 용어의 상대적인 중요 정도를 축소용어 집합으로 구성하여 검색 시스템의 높은 시간 복잡도를 해결할 수 있도록 퍼지 검색 모델을 적용하였다. 또한 퍼지 호환관계의 특성을 만족하는 유사관계 행렬을 통해 사용자 질의를 정확하게 반영할 수 있도록 클러스터 검색을 수행하였다. 본 논문에서 제안한 퍼지 검색과 문서 클러스터 검색의 유사도 결합을 통한 순위 재조정 검색 모델은 검색 성능을 표현하는 정확률과 재현율 척도에서 향상됨을 입증하였다.

양기준 선호모형: 비 정형적 자료검색을 위한 의사결정 모형 (Double Anchors Preference Model (DAPM) : A Decision Model for Non-binary Data Retrieval)

  • 이춘열
    • Asia pacific journal of information systems
    • /
    • 제2권1호
    • /
    • pp.3-15
    • /
    • 1992
  • This paper proposes a new referential model for data retrieval as an alternative to exact matching. While exact matching is an effective data retrieval model, it is based on fairly strict assumptions and limits our capabilities in data retrieval. This study redefines data retrieval to include non-binary data retrieval in addition to binary data retrieval, proposes Double Anchor Preference Model (DAPM), and analyzes its logical charateristics. DAPM supports non-binary data retrieval. Further, it produces the same result as exact matching for the conventional binary data retrieval. These findings show that, at the logical level, the proposed DAPM retains all the desirable features for data retrieval.

  • PDF

주제별 분산 지식베이스에 의한 개념기반 정보검색시스템의 성능향상에 관한 연구 (A Study on the Improvement of Performance of Concept-Based Information Retrieval Model Using a Distributed Subject Knowledge Base)

  • 노영희
    • 정보관리학회지
    • /
    • 제19권1호
    • /
    • pp.47-69
    • /
    • 2002
  • 개념기반 정보검색기법은 불리언 검색기법의 문제점을 해소했다고 평가받고 있는 단순 매칭함수 기법이나 P-norm 검색기법보다 높은 성능을 보여주고 있다. 그러나 개념화장에 필수적인 의미망 지식베이스를 구축하는데 시간이 너무 오래 걸리는 단점이 있다. 본 연구에서는 이러한 문제를 해결하기 위해 주제범주별로 지식베이스를 분산 구축함으로써 지식베이스 구축에 소요되는 시간을 단축하면서도 검색성능이 떨어지지 않도록 하는 방안을 모색하고자 하였다.

검색효율 측정척도에 관한 연구 (A Study on measuring techniques of retrieval effectiveness)

  • 윤구호
    • 한국문헌정보학회지
    • /
    • 제16권
    • /
    • pp.177-205
    • /
    • 1989
  • Retrieval effectiveness is the principal criteria for measuring the performance of an information retrieval system. This paper deals with the characteristics of 'relevance' of information and various measuring techniques of retrieval effectivess. The outlines of this study are as follows: 1) Relevance decision for evaluation should be devided into the user-oriented and the system-oriented decisions. 2) The recall-precision measure seems to be user-oriented, and the recall-fallout measure to be system-oriented. 3) Many of composite measures can not be justified III any rational manner unfortunately. 4) The Swets model has demonstrated that it yields, in general, a straight line instead of a curve of varying curvature and emphasized the fundamentally probabilistic nature of information retrieval. 5) The Cooper model seems to be a good substitute for precision and a useful measure for systems which ranked documents. 6) The Rocchio model were proposed for the evaluation of retreval systems which ranked documents, and were designed to be independent of cut-off. 7) The Cawkell model suggested that the Shannon's equation for entropy can be applied to measuring of retrieval effectiveness.

  • PDF

XML 문서의 효율적인 구조 검색을 위한 색인 모델 (An Indexing Model for Efficient Structure Retrieval of XML Documents)

  • 박종관;손충범;강형일;유재수;이병엽
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.451-460
    • /
    • 2001
  • 본 논문에서는 XML 문서의 효율적인 구조 검색을 위한 색인 모델을 제안한다. 색이 모델은 문선 계층상의 모든 레벨에서 내용 기반 질의와 구조 및 에트리뷰트 질의와 같은 다양한 질의를 지원하기 위한 구조정보와 이를 이용한 색이 구조로 구성된다. 구조검색을 지원하기 위해 새로운 구조정보 표현 방법을 제안한다. 제안한 구조정보 표현 방법에 따라 표현된 구조정보를 이용해 효율적인 검색을 위한 내용 색인, 구조 색인, 에트리뷰트 색인을 구성한다. 또한 내용과 구조가 혼합된 질의의 처리과정을 설명하고, 제안하는 색인 모델의 성능평가를 보임으로써 기존의 방법보다 성능이 우수함을 보인다.

  • PDF

정보검색(情報檢索)시스템의 평가(評価)에 관한 연구(硏究) (A study on evaluation of information retrieval system)

  • 박인웅
    • 한국비블리아학회지
    • /
    • 제5권1호
    • /
    • pp.85-105
    • /
    • 1981
  • Information is an essential factor leading the rapid progress which is one of the distinguished characteristics in modem society. As more information is required and as more is supplied by individuals, governmental units, businesses, and educational institutions, the greater will be the requirement for efficient methods of communication. One possibility for improving the information dissemination process is to use computers. The capabilities of such machine are beginning to be used in the process of Information storage, retrieval and dissemination. An important problems, that must be carefully examined is whether one technique for information retrieval is better for worse than another. This paper examines problem of how to evaluate an information retrieval system. One specific approach is a cost accounting model for use in studying how to minimize the cost of operating a mechanized retrieval system. Through the use of cost analysis, the model provides a method for comparative evaluation between systems. The general cost accounting model of the literature retrieval system being designed by this study are given below. 1. The total cost accounting model of the literature retrieval system. The total cost of the literature retrieval system = (the cost per unit of user time X the amount of user time) + ( the cost per unit of system time X the amount of system time) 2. System cost accounting model system cost = (the pre-search system cost per unit of time X time) + (the search system cost per unit of time X time) + (the post search system cost per unit of time X time) 1) Pre-search system cost per unit of time = cost of channel per unit time + cost of central processing unit per unit time + cost of storage per unit time 2) Search system cost per unit of time = comparison cost + document representation cost. 3) Post-search system cost per unit of time. = cost of channel per unit time + cost of central processing unit per unit time + cost of storage per unit time 3. User cost accounting model Total user cost = [pre-search user cost per unit of time X (time + additional time) ] + [search user cost per unit of time X (time + additional time) ] + [post-search user cost per unit of time X (time + additional time) ].

  • PDF

정보검색에서의 언어모델 적용에 관한 분석 (An Analysis of the Applications of the Language Models for Information Retrieval)

  • 김희섭;정영미
    • 한국도서관정보학회지
    • /
    • 제36권2호
    • /
    • pp.49-68
    • /
    • 2005
  • 본 연구의 목적은 정보검색 분야에서의 언어모델의 적용에 관한 연구동향을 개관하고 이 분야의 선행연구 결과들을 분석해 보는 것이다. 선행연구들은 (1)전통적인 모델 기반 정보검색과 언어모델링 정보검색의 성능 비교 실험에 초점을 두고 있는 1세대 언어모델링 정보검색(LMIR)과 (2)기본적인 언어모델링 정보검색과 확장된 언어모델링 정보검색의 성능 비교를 통해 보다 우수한 언어모델링 확장기법을 찾아내는 것에 초점을 두고 있는 2세대 LMIR로 구분하여 분석하였다. 선행연구들의 실험결과를 분석해 본 결과 첫째, 언어모델링 정보검색은 확률모델, 벡터모델 정보검색보다 그 성능이 뛰어나고 둘째 확장된 언어모델들은 기본적인 언어 모델 정보검색보다 그 성능이 우수한 것으로 나타났다.

  • PDF