• 제목/요약/키워드: Text Retrieval

검색결과 342건 처리시간 0.026초

전문에 대한 검색시스템의 구현 (Implementation of Information Retrieval System for Full-Text)

  • 김대규;정희택;강영만;한순희;조혁현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2000년도 추계종합학술대회
    • /
    • pp.337-340
    • /
    • 2000
  • 인터넷을 이용한 정보검색이 일반화되면서, 보다 정확하고 꼭 필요한 정보의 요구가 일반화되었다. 정확한 정보의 제공을 위해, 된 정보에 대한 중심어(keyword) 검색뿐만 아니라 전문(Full-Text)에 대한 검색 요구가 일반화되었다. 본 연구에서는 전문 검색을 위한 설계 방안을 제안한다. 기존에 제안된 전문 검색 방안과 오라클에서 제공하는 interMedia Text를 이용한 전문 검색 방안을 비교한다. 이를 기반으로 정보 검색 시스템에서 구현 방안을 제시한다.

  • PDF

공통기술표현포맷에 기반한 다매체자료의 검색효율 향상에 관한 연구 (A Study on the Improvement of Retrieval Efficiency Based on the CRFMD)

  • 박일종;정기태
    • 정보관리학회지
    • /
    • 제23권3호
    • /
    • pp.5-21
    • /
    • 2006
  • 최근 수년 동안 영상자료와 음성자료 분석에 대한 이론들이 텍스트자료 검색 시스템과 함께 사용되기 위해서 제안되어 왔으며 데이터 처리 속도의 급격한 향상과 함께 발전되어 왔다. 일반적 검색 방법들은 단지 텍스트만을 사용하지만 텍스트와 그림을 동시에 사용하는 검색 방법 또한 최근에 제안되어 왔다. 본 연구는 다매체자료의 공통기술표현포맷(CRFMD)이라는 이름으로 화상자료와 텍스트자료를 하나의 자료 구조로 통합하는 방법을 제안하고 있으며, 주어진 테스트자료에 대한 화상자료의 유사성 분석에서 텍스트와 그림의 형태소를 함께 사용하였을 때 현격히 개선되어 짐을 보여주고 있다. CRFMD는 의료문서 검색, WWW 검색, 박물관 소장품 검색과 같은 다양한 분야의 다매체자료 검색 및 처리에 응용될 수가 있을 것이다.

적합성피이드백을 이용한 전문검색시스템의 검색효율성 증진을 위한 연구 (Enhancing performance of full-text retrieval systems using relevance feedback)

  • 문성빈
    • 정보관리학회지
    • /
    • 제10권2호
    • /
    • pp.43-67
    • /
    • 1993
  • 본 연구의 주목적은 전문검색시스템의 문제점인 낮은 정확율을 향상시키는 검색기법을 제시하는 것이다. 높은 재현율을 유지하면서 정확율을 증진시키기 위하여 확률검색모형 (이진독립형과 투포이슨독립모형)에 기초를 둔 적합성피이드백을 이용하였고, 이것이 전문검색시스템의 검색효율성에 미치는 영향을 조사하였다.

  • PDF

텍스트-비디오 검색 모델에서의 캡션을 활용한 비디오 특성 대체 방안 연구 (A Study on the Alternative Method of Video Characteristics Using Captioning in Text-Video Retrieval Model)

  • 이동훈;허찬;박혜영;박상효
    • 대한임베디드공학회논문지
    • /
    • 제17권6호
    • /
    • pp.347-353
    • /
    • 2022
  • In this paper, we propose a method that performs a text-video retrieval model by replacing video properties using captions. In general, the exisiting embedding-based models consist of both joint embedding space construction and the CNN-based video encoding process, which requires a lot of computation in the training as well as the inference process. To overcome this problem, we introduce a video-captioning module to replace the visual property of video with captions generated by the video-captioning module. To be specific, we adopt the caption generator that converts candidate videos into captions in the inference process, thereby enabling direct comparison between the text given as a query and candidate videos without joint embedding space. Through the experiment, the proposed model successfully reduces the amount of computation and inference time by skipping the visual processing process and joint embedding space construction on two benchmark dataset, MSR-VTT and VATEX.

퍼지 논리를 이용한 사용자 중심적인 Full-Text 검색방법에 관한 연구 (Consideration of a Robust Search Methodology that could be used in Full-Text Information Retrieval Systems)

  • 이원부
    • Asia pacific journal of information systems
    • /
    • 제1권1호
    • /
    • pp.87-101
    • /
    • 1991
  • The primary purpose of this study was to investigate a robust search methodology that could be used in full-text information retrieval systems. A robust search methodology is one that can be easily used by a variety of users (particularly naive users) and it will give them comparable search performance regardless of their different expertise or interests In order to develop a possibly robust search methodology, a fully functional prototype of a fuzzy knowledge based information retrieval system was developed. Also, an experiment that used this prototype information retreival system was designed to investigate the performance of that search methodology over a small exploratory sample of user queries To probe the relatonships between the possibly robust search performance and the query organization using fuzzy inference logic, the search performance of a shallow query structure was analyzes. Consequently the following several noteworthy findings were obtained: 1) the hierachical(tree type) query structure might be a better query organization than the linear type query structure 2) comparing with the complex tree query structure, the simple tree query structure that has at most three levels of query might provide better search performance 3) the fuzzy search methodology that employs a proper levels of cut-off value might provide more efficient search performance than the boolean search methodology. Even though findings could not be statistically verified because the experiments were done using a single replication, it is worth noting however, that the research findings provided valuable information for developing a possibly robust search methodology in full-text information retrieval.

  • PDF

관계형 모델에서 XML 변경과 전문 검색을 지원하기 위한 역 인덱스 구축 기법 (Inverted Indexes for XML Updates and Full-Text Retrievals in Relational Model)

  • 천윤우;홍동권
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.509-518
    • /
    • 2004
  • 최근 산업체를 중심으로 XML 전문 검색과 XML 문서의 변성 기능에 대한 표준의 시도가 활발히 이루어지고 있다. XML 질의어에서의 전문 검색 기능은 매우 중요한 부분을 차지한다. XML 문서는 관계형 테이블과는 달리 문서의 구조가 복잡하며 때로는 매우 불규칙하다. 이런 상황에서의 검색은 부분적인 정보를 최대한 활용해야 하는 전문 검색이 일반적인 구조적 검색보다 매우 중요한 역할을 한다. 본 논문은 XML 데이터를 관리하기 위하여 관계형 모델을 사용하는 환경에서 XML 문서의 변경과 다양한 형태의 전문 검색을 동시에 지원하기 위한 방안으로 효율적인 역 인덱스 구축 기법을 제안한다. 본 논문에서 제안한 방법은 인덱스 크기의 큰 변화 없이 역 인덱스를 구축하며, 대용량의 XML 문서의 다양한 전문 검색 기능을 성능의 저하 없이 지원한다. 또 XML 문서의 부분적인 변화에 역 인덱스의 변경이 기존의 방법들에 비해서 급격히 줄어든 좋은 성능을 보인다.

이미지 인지 유형 및 검색질의 방식에 따른 검색 효율성에 관한 연구 (A Study on the Retrieval Effectiveness Based on Image Query Types)

  • 김성희;이근영
    • 한국문헌정보학회지
    • /
    • 제47권3호
    • /
    • pp.321-342
    • /
    • 2013
  • 본 연구에서는 이미지 인지유형 및 질의방식에 따른 검색방법의 효율성을 분석하기 위해 32명의 대학생들이 구글 이미지 검색시스템을 이용하여 검색실험을 실시하였다. 이미지 인지유형은 구체적(specific), 일반적(generic), 추상적(abstract) 유형으로 구분하였으며, 각 유형별 이미지를 텍스트검색, 예제에 따른 검색(QBE: Query by example), 하이브리드검색 등 3가지 질의방식으로 구분하여 실험을 실시하였다. 독립변수는 이미지 인지유형 및 질의방식이며 종속변수는 검색된 적합한 이미지의 수이다. 데이터 분석은 일원배치 분산분석(One-way ANOVA)과 이원배치분석(Two way ANOVA)을 이용하여 검증하였다. 분석결과로는 구체적 이미지와 일반적 이미지 인지유형에서는 텍스트 및 하이브리드 방식이 검색효율성이 높게 나타났고 추상적 이미지 인지유형에서는 QBE이 검색효율성이 높은 것으로 나타났다. 본 연구 결과는 이미지 검색에서 검색효율성을 높이기 위한 방안을 마련하는데 기초자료로 활용될 수 있을 것이다.

웹 문서 검색을 위한 검색어 추출과 확장에 관한 연구 (A Study on Keyword Extraction and Expansion for Web Text Retrieval)

  • 윤성희
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권9호
    • /
    • pp.1111-1118
    • /
    • 2004
  • 웹 문서 검색 시스템 사용자에게 자연어 질의를 입력하는 방법은 가장 이상적인 인터페이스이다. 본 논문은 자연어 질의를 입력하는 웹 문서 검색 시스템을 위해 자연어 처리 기술에 기반하여 사용자의 입력 질의 문장을 구문 분석한 후 검색어를 추출하고 확장하는 다중검색 기법을 제안한다. 질의문에 대한 형태소 분석 및 구문 분석을 수행하고, 구문 트리를 순회하여 구조적으로 연관된 복합명사를 조합하거나 분할하며, 검색어가 되는 음역어와 축약어들을 확장하여 다중 검색함으로써 재현율과 정확도를 향상시킬수 있음을 보였다.

  • PDF

An Optimal Weighting Method in Supervised Learning of Linguistic Model for Text Classification

  • Mikawa, Kenta;Ishida, Takashi;Goto, Masayuki
    • Industrial Engineering and Management Systems
    • /
    • 제11권1호
    • /
    • pp.87-93
    • /
    • 2012
  • This paper discusses a new weighting method for text analyzing from the view point of supervised learning. The term frequency and inverse term frequency measure (tf-idf measure) is famous weighting method for information retrieval, and this method can be used for text analyzing either. However, it is an experimental weighting method for information retrieval whose effectiveness is not clarified from the theoretical viewpoints. Therefore, other effective weighting measure may be obtained for document classification problems. In this study, we propose the optimal weighting method for document classification problems from the view point of supervised learning. The proposed measure is more suitable for the text classification problem as used training data than the tf-idf measure. The effectiveness of our proposal is clarified by simulation experiments for the text classification problems of newspaper article and the customer review which is posted on the web site.

사용자 태그와 중심성 지수를 이용한 블로그 검색 성능 향상에 관한 연구 (Enhancing the Performance of Blog Retrieval by User Tagging and Social Network Analysis)

  • 김은희;정영미
    • 정보관리학회지
    • /
    • 제27권1호
    • /
    • pp.61-77
    • /
    • 2010
  • 최근 다양한 주제 분야의 블로그가 이용자의 정보요구를 충족시켜주는 웹 정보원 중 하나로 활용되고 있다. 본 연구에서는 블로그 페이지의 검색 성능을 향상시키기 위하여 이용자가 부여한 태그 및 트랙백을 이용하여 블로그 페이지의 검색 실험을 수행하였다. 실험을 위해 4,908개의 블로그 페이지와 각 페이지에 트랙백으로 연결된 다른 블로그 페이지의 URL을 수집하였다. 검색 자질로 본문의 용어에 이용자 태그를 추가하였을 경우와 네트워크 중심성 값을 반영하였을 경우 모두 검색 성능이 향상되었고, 본문 용어와 이용자 태그를 검색 자질로 함께 사용하고 여기에 중심성 값을 반영하였을 경우 가장 좋은 성능을 보였다.