• 제목/요약/키워드: Information retrieval techniques

검색결과 274건 처리시간 0.025초

질의어 확장에 기반을 둔 클러스터링 및 필터링 문서의 검색효율 제고에 관한 연구 (A Study on the Improvement of Retrieval Effectiveness to Clustered and Filtered Document through Query Expansion)

  • 노동조
    • 한국비블리아학회지
    • /
    • 제14권1호
    • /
    • pp.219-230
    • /
    • 2003
  • 인터넷을 비롯한 대다수의 정보검색에서 사용자가 느끼는 공통된 어려움중의 하나는 검색결과가 너무 많다는 것이다. 본 연구는 검색결과를 줄이는 방법의 하나로써 검색 문헌에 대한 정제 방법에 대하여 논의한 것이다. 궁극적으로 종전의 검색시스템에서 제대로 고려하지 않은 개념망을 통한 질의어 확장과 확장 질의어와 전처리된 문서와의 유사도 측정을 통한 문서의 선택, 백과사전 정보에 의한 의미 확장과 클러스터링, 필터링 기법 등이 정보검색의 효율을 향상시키는데 효과적인 방안임을 제안한다.

  • PDF

완전 매치와 부분 매치 검색 기법에 관한 연구 ((A Study of an Exact Match and a Partial Match as an Information Retrieval Technique))

  • 김영귀
    • 정보관리학회지
    • /
    • 제7권1호
    • /
    • pp.79-95
    • /
    • 1990
  • 본 연구는 그동안 연구되고 개발된 여러 검색 기법을 검색된 문헌 집합의 특성과 사용된 표현에 의해서 완전 매치 검색과 부분 매치 검색으로 구분하였다. 완전 매치는 부울 논리가 그 대표적이며 현행 대부분의 정보 검색 시스템에서 사용하고 있는 검색 기법이다. 부분 매치는 부울논리가 가지고 있는 문제점과 한계점을 극복하기 위한 대한으로서 많은 연 구가 있었으나 그 본질은 부울 논리 구조안에서 검색을 향상시킨다는 점에서 한계를 가질수 밖에 없다 하겠다. 대표적인 예로 확률 검색, 벡터 공간 모델, 그리고 퍼지 집합을 대상으로 두 검색 기법을 비교하고 앞으로의 검색 기법이 나아가야 할 방향을 제시하였다.

  • PDF

TIP-인덱싱 기법과 오디오 화일의 특징계수에 의한 내용기반 음악 검색 (Content-based Music Retrieval by TIP-indexing Techniques and Features of Audio files)

  • 김영인
    • 한국산업정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.10-14
    • /
    • 2006
  • 방대한 양의 음악 데이터를 효율적으로 검색하기 위해서는 오디오 특징에 의해 인덱싱하고 검색하는 인덱싱 기법이 요구된다. 그러나 이와 관련한 인덱싱 기법에 대한 연구는 미진한 실정이다. 본 논문에서는 TIP-인덱싱 화일을 이용하여 오디오 특징 계수를 인텍싱하고 검색할 수 있는 내용기반 음악 정보 검색 기법을 제안한다. 또한 다양한 블록킹 인수를 이용한 성능 비교 실험을 위하여 TIP-인덱싱 화일을 만들고 실험한다. 실험 결과는 제안한 방법의 유효성을 보여준다.

  • PDF

A Comparative Study between LSI and LDA in Constructing Traceability between Functional and Non-Functional Requirements

  • Byun, Sung-Hoon;Lee, Seok-Won
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권7호
    • /
    • pp.19-29
    • /
    • 2019
  • Requirements traceability is regarded as one of the important quality attributes in software requirements engineering field. If requirements traceability is guaranteed then we can trace the requirements' life throughout all the phases, from the customers' needs in the early stage of the project to requirements specification, deployment, and maintenance phase. This includes not only tracking the development artifacts that accompany the requirements, but also tracking backwards from the development artifacts to the initial customer requirements associated with them. In this paper, especially, we dealt with the traceability between functional requirements and non-functional requirements. Among many Information Retrieval (IR) techniques, we decided to utilize Latent Semantic Indexing (LSI) and Latent Dirichlet Allocation (LDA) in our research. Ultimately, we conducted an experiment on constructing traceability by using two techniques and analyzed the experiment results. And then we provided a comparative study between two IR techniques in constructing traceability between functional requirements and non-functional requirements.

정보시각화에 대한 스킴모형별 비교 분석 (A Three Schematic Analysis of Information Visualization)

  • 서은경
    • 한국문헌정보학회지
    • /
    • 제36권4호
    • /
    • pp.175-205
    • /
    • 2002
  • 인터넷과 대용량 데이터베이스가 정보검색환경을 주도하게 되면서 이용자가 원하는 정보를 효율적으로 찾을 수 있는 강력한 검색도구가 요구되었다. 정보시각화 기법은 이러한 요구에 부응하여 개발된 것으로 복잡하고도 대규모의 데이터를 의미적으로 그리고 조직적으로 보여주는 시각표상 기법이라 할 수 있다. 본 연구는 정보검색시스템에서 다각적으로 응용되고 있는 정보시각화 기법을 조사 분석하였다. 그 결과, 첫째 연구결과 데이터, 검색대상인 문헌, 검색결과로 나타난 검색정보를 시각화 대상으로 하여 연구가 진행되고 있었다. 둘째, 이용자의 상호작용과 항해를 수월하게 하는 정보시각화 기법으로는 줌과 팬기법, focus+ context기법, 점증탐사기법, 클러스터링 기법 둥을 들 수 있다. 셋째, 이용자에게 실제 시각메타포로 보여주는 방식으로 선형구조 표현방식, 계층구조 표현방식, 네트워크구조 표현방식, 벡터분산구조 표현방식을 찾아볼 수 있었다. 정보검색시스템에 계속적으로 정보시각화 기법이 응용되고 구현되기 위해서는 기존 기법의 평가와 이용자 요구분석이 수행되어야 하므로 본 연구의 결과 또한 새로운 시각화 인터페이스 개발에 도움이 될 것으로 본다.

연속미디어 저장 서버에서의 실시간 저장 및 검색 기법 (Real-Time Storage and Retrieval Techniques for Continuous Media Storage Server)

  • CheolSu Lim
    • 전자공학회논문지B
    • /
    • 제32B권11호
    • /
    • pp.1365-1373
    • /
    • 1995
  • In this paper, we address the issues related to storage and retrieval of continuous media (CM)data we face in designing multimedia on-demand (MOD) storage servers. To support the two orthogonal factors of MOD server design, i.e., storage and retrieval of CM data, this paper discusses the techniques of disk layout, disk striping and real-time disk scheduling, which are integrated as a combined solution to the high- performance MOD storage subsystem. The proposed clustered striping technique enables either a multiple-disk or a parallel system to guarantee a continuous retrieval of CM data at the bandwidth required to support user playback rate by avoiding the formation of I/O bottlenecks.

  • PDF

디지털 도서관을 위한 분산색인 기법에 대한 연구 (A Study on Distributed Indexing Technique for Digital Library)

  • 유춘식;이종득;김용성
    • 한국정보처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.315-325
    • /
    • 1999
  • Indexing techniques for distributed resources have much effect on an information service system based on distributed environment like digital library. There is a centralized indexing technique, a distributed technique, and a mixed technique for distributed indexing techniques. In this paper, we propose new distributed indexing technique using EIF(extended Inverted File) structure that mix the centralized technique and t도 distributed technique. And we propose management techniques using EIF structure and retrieval technique using EIF structure. This distributed indexing technique proposed is able to fast process retrieval request and reduce network overload and select servers relevant to query terms. This paper investigated performance of a proposed distributed indexing technique.

  • PDF

시소러스의 기본 용어관계에 관한 연구 (A Study on the Basic Term Relationship of Thesaurus)

  • 한상길
    • 한국도서관정보학회지
    • /
    • 제30권4호
    • /
    • pp.107-136
    • /
    • 1999
  • With the development of indexing and retrieval techniques and the trends of information retrieval environment becoming more and more user-friendly, existing guideline for international thesaurus establishment standards and basic term relations currently used in thesaurus have become to longer adequate. The purpose of this study is to present solutions to expanding term relations which will fit new information retrieval environment. This report views standards for ISO 2788 and ANSI/NISO Z 39.19, and compares and analyzes 20 thesaurus basis term relations currently used both at home and abroad(14 overseas and 6 in Korea) to find out problems and limitations. Based on findings of the study, this report suggests how to expand thesaurus basic term relations to accomodate changes in information retrieval environment.

  • PDF

정보 검색 연구를 위한 KRIST 테스트 컬렉션의 개발 (Developing the KRIST Test Collection for Researches in Information Retrieval)

  • 이준호
    • 정보관리학회지
    • /
    • 제12권2호
    • /
    • pp.225-232
    • /
    • 1995
  • 정보검색에 대한 연구를 위해 테스트 컬렉션은 필수적인 요소로 인식되어 왔다. 외국의 경우, 다양한 테스트 컬렉션들이 개발되어 정보 검색에 대한 연구에 이용되어 왔다. 그러나 국내의 경우, 최근에 한글 정보 검색에 대한 관심이 확산되었음에도 불구하고 정보 검색용 테스트 컬렉션에 대한 부족으로 인하여 한글 정보 검색에 대한 연구에 어려움을 겪고 있다. 본 연구에서는 연구개발정보센터 소유의 KRIST 데이타베이스를 기반으로 하여 개발된 KRIST 테스트 컬렉션에 대하여 기술한다. KRIST 테스트 컬렉션은 과기처 연구보고서에 대한 서지 레코드 13, 515건과 30개의 자연어 질의 그리고 각 질의에 대한 적합 문헌리스트로 구성된다.

  • PDF

Multi-granular Angle Description for Plant Leaf Classification and Retrieval Based on Quotient Space

  • Xu, Guoqing;Wu, Ran;Wang, Qi
    • Journal of Information Processing Systems
    • /
    • 제16권3호
    • /
    • pp.663-676
    • /
    • 2020
  • Plant leaf classification is a significant application of image processing techniques in modern agriculture. In this paper, a multi-granular angle description method is proposed for plant leaf classification and retrieval. The proposed method can describe leaf information from coarse to fine using multi-granular angle features. In the proposed method, each leaf contour is partitioned first with equal arc length under different granularities. And then three kinds of angle features are derived under each granular partition of leaf contour: angle value, angle histogram, and angular ternary pattern. These multi-granular angle features can capture both local and globe information of the leaf contour, and make a comprehensive description. In leaf matching stage, the simple city block metric is used to compute the dissimilarity of each pair of leaf under different granularities. And the matching scores at different granularities are fused based on quotient space theory to obtain the final leaf similarity measurement. Plant leaf classification and retrieval experiments are conducted on two challenging leaf image databases: Swedish leaf database and Flavia leaf database. The experimental results and the comparison with state-of-the-art methods indicate that proposed method has promising classification and retrieval performance.