• 제목/요약/키워드: information retrieval.

검색결과 3,674건 처리시간 0.031초

Shape Description and Retrieval Using Included-Angular Ternary Pattern

  • Xu, Guoqing;Xiao, Ke;Li, Chen
    • Journal of Information Processing Systems
    • /
    • 제15권4호
    • /
    • pp.737-747
    • /
    • 2019
  • Shape description is an important and fundamental issue in content-based image retrieval (CBIR), and a number of shape description methods have been reported in the literature. For shape description, both global information and local contour variations play important roles. In this paper a new included-angular ternary pattern (IATP) based shape descriptor is proposed for shape image retrieval. For each point on the shape contour, IATP is derived from its neighbor points, and IATP has good properties for shape description. IATP is intrinsically invariant to rotation, translation and scaling. To enhance the description capability, multiscale IATP histogram is presented to describe both local and global information of shape. Then multiscale IATP histogram is combined with included-angular histogram for efficient shape retrieval. In the matching stage, cosine distance is used to measure shape features' similarity. Image retrieval experiments are conducted on the standard MPEG-7 shape database and Swedish leaf database. And the shape image retrieval performance of the proposed method is compared with other shape descriptors using the standard evaluation method. The experimental results of shape retrieval indicate that the proposed method reaches higher precision at the same recall value compared with other description method.

Region Division for Large-scale Image Retrieval

  • Rao, Yunbo;Liu, Wei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권10호
    • /
    • pp.5197-5218
    • /
    • 2019
  • Large-scale retrieval algorithm is problem for visual analyses applications, along its research track. In this paper, we propose a high-efficiency region division-based image retrieve approaches, which fuse low-level local color histogram feature and texture feature. A novel image region division is proposed to roughly mimic the location distribution of image color and deal with the color histogram failing to describe spatial information. Furthermore, for optimizing our region division retrieval method, an image descriptor combining local color histogram and Gabor texture features with reduced feature dimensions are developed. Moreover, we propose an extended Canberra distance method for images similarity measure to increase the fault-tolerant ability of the whole large-scale image retrieval. Extensive experimental results on several benchmark image retrieval databases validate the superiority of the proposed approaches over many recently proposed color-histogram-based and texture-feature-based algorithms.

검색효율 측정척도에 관한 연구 (A Study on measuring techniques of retrieval effectiveness)

  • 윤구호
    • 한국문헌정보학회지
    • /
    • 제16권
    • /
    • pp.177-205
    • /
    • 1989
  • Retrieval effectiveness is the principal criteria for measuring the performance of an information retrieval system. This paper deals with the characteristics of 'relevance' of information and various measuring techniques of retrieval effectivess. The outlines of this study are as follows: 1) Relevance decision for evaluation should be devided into the user-oriented and the system-oriented decisions. 2) The recall-precision measure seems to be user-oriented, and the recall-fallout measure to be system-oriented. 3) Many of composite measures can not be justified III any rational manner unfortunately. 4) The Swets model has demonstrated that it yields, in general, a straight line instead of a curve of varying curvature and emphasized the fundamentally probabilistic nature of information retrieval. 5) The Cooper model seems to be a good substitute for precision and a useful measure for systems which ranked documents. 6) The Rocchio model were proposed for the evaluation of retreval systems which ranked documents, and were designed to be independent of cut-off. 7) The Cawkell model suggested that the Shannon's equation for entropy can be applied to measuring of retrieval effectiveness.

  • PDF

Semantic-based Query Generation For Information Retrieval

  • Shin Seung-Eun;Seo Young-Hoon
    • International Journal of Contents
    • /
    • 제1권2호
    • /
    • pp.39-43
    • /
    • 2005
  • In this paper, we describe a generation mechanism of semantic-based queries for high accuracy information retrieval and question answering. It is difficult to offer the correct retrieval result because general information retrieval systems do not analyze the semantic of user's natural language question. We analyze user's question semantically and extract semantic features, and we .generate semantic-based queries using them. These queries are generated using the se-mantic-based question analysis grammar and the query generation rule. They are represented as semantic features and grammatical morphemes that consider semantic and syntactic structure of user's questions. We evaluated our mechanism using 100 questions whose answer type is a person in the TREC-9 corpus and Web. There was a 0.28 improvement in the precision at 10 documents when semantic-based queries were used for information retrieval.

  • PDF

An Efficient Information Retrieval System for Unstructured Data Using Inverted Index

  • Abdullah Iftikhar;Muhammad Irfan Khan;Kulsoom Iftikhar
    • International Journal of Computer Science & Network Security
    • /
    • 제24권7호
    • /
    • pp.31-44
    • /
    • 2024
  • The inverted index is combination of the keywords and posting lists associated for indexing of document. In modern age excessive use of technology has increased data volume at a very high rate. Big data is great concern of researchers. An efficient Document indexing in big data has become a major challenge for researchers. All organizations and web engines have limited number of resources such as space and storage which is very crucial in term of data management of information retrieval system. Information retrieval system need to very efficient. Inverted indexing technique is introduced in this research to minimize the delay in retrieval of data in information retrieval system. Inverted index is illustrated and then its issues are discussed and resolve by implementing the scalable inverted index. Then existing algorithm of inverted compared with the naïve inverted index. The Interval list of inverted indexes stores on primary storage except of auxiliary memory. In this research an efficient architecture of information retrieval system is proposed particularly for unstructured data which don't have a predefined structure format and data volume.

Design and Development of a Multimodal Biomedical Information Retrieval System

  • Demner-Fushman, Dina;Antani, Sameer;Simpson, Matthew;Thoma, George R.
    • Journal of Computing Science and Engineering
    • /
    • 제6권2호
    • /
    • pp.168-177
    • /
    • 2012
  • The search for relevant and actionable information is a key to achieving clinical and research goals in biomedicine. Biomedical information exists in different forms: as text and illustrations in journal articles and other documents, in images stored in databases, and as patients' cases in electronic health records. This paper presents ways to move beyond conventional text-based searching of these resources, by combining text and visual features in search queries and document representation. A combination of techniques and tools from the fields of natural language processing, information retrieval, and content-based image retrieval allows the development of building blocks for advanced information services. Such services enable searching by textual as well as visual queries, and retrieving documents enriched by relevant images, charts, and other illustrations from the journal literature, patient records and image databases.

대학도서관의 분류검색 운영 분석 (An Analysis on Classification Retrieval Operation in University Libraries)

  • 이종문
    • 한국도서관정보학회지
    • /
    • 제36권2호
    • /
    • pp.165-178
    • /
    • 2005
  • 본 연구는 대학도서관의 단행본에 대한 분류검색 환경을 조사${\cdot}$분석함으로써, 그 실태를 파악하기 위한 것이다. 조사내용은 분류검색 제공여부, 접근방법, 검색수준 등에 중점을 두었다. 데이터 수집은 계통추출법에 의해 표집된 100개 도서관 중, 조사기간 동안 URL 연결이 가능한 97개 도서관을 대상으로 이루어졌다. 그 결과, 97개 도서관 중, $92.8\%$가 분류검색을 제공하고 있었으나, 이중 $52.2\%$가 분류기호만을 통해, $47.8\%$가 분류기호와 분류 디렉터리를 통해 접근이 가능한 것으로 나타났다. 따라서, 분류검색을 활성화하기 위해서는 분류기호만을 통해 접근이 가능한 도서관에 대한 검색환경 개선이 시급한 것으로 파악되었다.

  • PDF

XLinks를 이용한 하이퍼텍스트 검색 시스템 (Hypertext Retrieval System Using XLinks)

  • 김은정;배종민
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.483-494
    • /
    • 2001
  • 일반적인 하이퍼텍스트 검색 모델은 문서와 문서사이의 관계나 링크의 의미를 무시하고, 모든 문서를 독립적인 존재로 간주하여 검색한다. 그러나 하이퍼텍스트 검색 시스템에 있어 링크 정보를 이용하며 검색의 성능을 향상시킬 수 있다. 기존의 링크 기반 하이퍼텍스트 검색 모델은 문서의 색인 과정에서 링크 정보를 무시하고, 검색 결과 집합에 대하여 문서의 우선 순위를 제조정하는데 링크 정보를 활용한다. 이는 링크정보의 활용이 검색 결과 집합의 문서들에만 한정된다는 단점이 있다. 본 논문에서는 링크 정보를 문서의 색인 과정에서 활용한다. 색인 과정에서 링크 정보를 이용하여 문서 내 용어의 가중치와 문서 내 inLinks의 가중치를 정의하고, 이들의 이용하여 문서의 우선 순위를 위한 확장된 RSV 계산식을 제시한다. 실험 결과에서 링크 의미에 따른 검색 조회율과 정확도를 제시하고 기존 링크 기반 검색 모델과의 비교, 분석 결과를 제시한다.

  • PDF

시멘틱 검색시스템 구축을 위한 요구사항 분석 및 설계에 관한 연구 (A Study on Analysis of Requirements and Design of IR System for Semantic-based Information Retrieval)

  • 김용
    • 한국비블리아학회지
    • /
    • 제23권1호
    • /
    • pp.91-111
    • /
    • 2012
  • 웹 정보의 폭발적인 성장과 함께, 단순히 한 두 개의 키워드의 입력에 따른 검색은 너무 많은 검색결과를 가져오게 되기 때문에 전통적인 정보검색기법은 이용자들에게 있어서 만족할 수 없는 결과를 제공하고 있다. 본 연구에서는 정보에 대한 의미를 기반으로 정보검색의 질적 향상을 위한 기술의 개발을 목표로 하고 있다. 이를 위하여 시멘틱 웹 기술에서 요구되는 시멘틱 기반 검색에 대한 최근의 연구동향 및 기술을 분석하여 시멘틱 기반 검색시스템에서 요구사항을 파악하고, 지능형 검색시스템의 아키텍처, 시멘틱 검색 서비스 개발 과정과 핵심기술 등을 살펴보았다. 분석결과와 함께, 시멘틱 기반 정보검색 시스템의 전체적인 아키텍처에 대한 설계 및 요구사항을 제안하였다.

완전 매치와 부분 매치 검색 기법에 관한 연구 ((A Study of an Exact Match and a Partial Match as an Information Retrieval Technique))

  • 김영귀
    • 정보관리학회지
    • /
    • 제7권1호
    • /
    • pp.79-95
    • /
    • 1990
  • 본 연구는 그동안 연구되고 개발된 여러 검색 기법을 검색된 문헌 집합의 특성과 사용된 표현에 의해서 완전 매치 검색과 부분 매치 검색으로 구분하였다. 완전 매치는 부울 논리가 그 대표적이며 현행 대부분의 정보 검색 시스템에서 사용하고 있는 검색 기법이다. 부분 매치는 부울논리가 가지고 있는 문제점과 한계점을 극복하기 위한 대한으로서 많은 연 구가 있었으나 그 본질은 부울 논리 구조안에서 검색을 향상시킨다는 점에서 한계를 가질수 밖에 없다 하겠다. 대표적인 예로 확률 검색, 벡터 공간 모델, 그리고 퍼지 집합을 대상으로 두 검색 기법을 비교하고 앞으로의 검색 기법이 나아가야 할 방향을 제시하였다.

  • PDF