• 제목/요약/키워드: user's relevance feedback

검색결과 33건 처리시간 0.029초

대화형 감성기반 칼라영상 검색 (Interactive emotion-based color image retrieval)

  • 엄경배;박중수
    • 한국컴퓨터산업학회논문지
    • /
    • 제7권1호
    • /
    • pp.17-22
    • /
    • 2006
  • 영상으로부터 여러 가지 내용을 추출하여 검색에 사용함으로써 내용기반 영상검색에서 검색의 정확도를 높이고 있다. 내용기반 영상검색 방법은 영상 검색을 위하여 물리적 속성을 이용한다. 즉 사용자가 검색을 원하는 영상의 물리적인 속성 또는 이들의 공간적인 배치등의 내용을 상당부분 알아야 검색이 가능하다는 제약을 수반한다. 그러므로, 이방법은 사용자의 의도를 반영하는데 제약이 있다. 따라서, 본 논문에서는 사용자의 의도를 반영하는 감성기반 검색 시스템을 제안하였다. 제안된 시스템은 사용자의 의도를 추정하기위해 relevance feedback을 이용한다는 점에 있어 기존의 내용기반 영상 검색 방법과 다르고, 제안된 시스템은 내용기반 영상검색 방법에 기반하고 있으므로 기존의 내용기반 검색방법과 통합이 용이하다. 속성들과 유사도측도들은 MPEG-7 칼라 기술자를 사용하였다. 벽지 영상을 이용하여 이같은 실험을 행하였고, 감성형용사들을 적용하여 DB에 저장된 벽지 영상들을 대상으로 검색한 결과 만족할 만한 결과를 얻을 수 있었다.

  • PDF

분산 정보 검색을 위한 신경망 기반 사용자 피드백 학습 메카니즘 (Neural Net Based User Feedback Learning Mechanism for Distributed Information Retrieval)

  • 최용석
    • 컴퓨터교육학회논문지
    • /
    • 제4권2호
    • /
    • pp.85-95
    • /
    • 2001
  • 웹과 같은 분산 정보 검색 환경에서 문서들은 많은 문서 데이터 베이스들에 자연스럽게 분할되어서 존재한다. 그러므로 이러한 문서들의 효율적인 검색을 위해서는 먼저 질의에 관련되어 문서들을 제공할 것으로 판단되는 문서 데이터 베이스를 찾아내고 다음으로 그 문서 데이터 베이스에 질의를 줌으로써 분산 정보 검색을 수행해야 한다. 본 논문에서는 이러한 효율적인 분산 정보 검색을 위한 신경망 기반 사용자 피드백 학습 메카니즘을 제안한다. 제안된 학습 메카니즘은 질의 검색 예제들을 통하여 얻어진 질의에 대한 사용자의 관련도 피드백 정보에 기반하여 역전파 알고리즘으로 분산 정보 검색 지식을 학습한다. 충분히 학습한 후의 학습 메카니즘은 주어진 질의에 대하여 관련 문서 데이터 베이스들을 찾아내고 그 문서 데이터 베이스들로부터 관련되는 문서들을 검색하는데 효과적으로 사용될 수 있다. 실험에서는 제안된 학습 메카니즘을 적용한 신경망 에이전트 시스템을 구현하고 이 시스템의 정보 검색 성능을 기존 시스템들과 비교하여 제안된 학습 메카니즘의 유용성을 입증한다.

  • PDF

영역 기반 영상 검색을 위한 다중클래스 피드백 알고리즘 (Multi-class Feedback Algorithm for Region-based Image Retrieval)

  • 고병철;남재열
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.383-392
    • /
    • 2006
  • 본 논문에서는 영역기반 영상검색의 성능 향상을 위한 피드백 알고리즘으로 다중 클래스를 갖는 확률적 신경망(Probabilistic Neural Networks)을 이용한 방법론을 제안하고 이를 영역기반 영상 검색 시스템인 FRIP(Finding Regions In the Pictures) 시스템에 적용하였다. 본 논문에서 제안하는 피드백 알고리즘은 특정 벡터가 독립적이라는 가정을 할 필요가 없으며 보다 상세한 분류를 위해 추가적인 클래스들을 추가할 수 있도록 허용하고 있다. 또한 단지 4개 층(layer)만을 가지고 있음으로 학습을 위한 계산시간이 적게 든다는 장점이 있다. 추가적으로 다음단계에서의 성능 향상을 위해 분류 단계에서 사용자의 이전 피드백 행동을 모두 히스토리(history)로 모두 기억시켜 놓고 다음 단계를 위한 가중치 학습을 위해 사용하도록 한다. 히스토리를 사용함으로써 제안하는 알고리즘은 사용자의 주관적 의도를 보다 정확하게 파악 할 수 있을 뿐만 아니라 학습을 위해 이전 단계만을 사용 했을 때 발생할 수 있는 성능 감소를 막을 수 있다. 본 논문에서는 Corel-photo CD에서 3000장의 자연 영상을 무작위로 추출하여 기존의 방법론들과 제안하는 방법론의 성능을 측정하여 본 논문에서 제안하는 방법론이 성능이 우수함을 증명하였다.

Word Embeddings-Based Pseudo Relevance Feedback Using Deep Averaging Networks for Arabic Document Retrieval

  • Farhan, Yasir Hadi;Noah, Shahrul Azman Mohd;Mohd, Masnizah;Atwan, Jaffar
    • Journal of Information Science Theory and Practice
    • /
    • 제9권2호
    • /
    • pp.1-17
    • /
    • 2021
  • Pseudo relevance feedback (PRF) is a powerful query expansion (QE) technique that prepares queries using the top k pseudorelevant documents and choosing expansion elements. Traditional PRF frameworks have robustly handled vocabulary mismatch corresponding to user queries and pertinent documents; nevertheless, expansion elements are chosen, disregarding similarity to the original query's elements. Word embedding (WE) schemes comprise techniques of significant interest concerning QE, that falls within the information retrieval domain. Deep averaging networks (DANs) defines a framework relying on average word presence passed through multiple linear layers. The complete query is understandably represented using the average vector comprising the query terms. The vector may be employed for determining expansion elements pertinent to the entire query. In this study, we suggest a DANs-based technique that augments PRF frameworks by integrating WE similarities to facilitate Arabic information retrieval. The technique is based on the fundamental that the top pseudo-relevant document set is assessed to determine candidate element distribution and select expansion terms appropriately, considering their similarity to the average vector representing the initial query elements. The Word2Vec model is selected for executing the experiments on a standard Arabic TREC 2001/2002 set. The majority of the evaluations indicate that the PRF implementation in the present study offers a significant performance improvement compared to that of the baseline PRF frameworks.

사용자 적합성 피드백과 구루 평가 점수를 고려한 블로그 검색 방법 (Blog Search Method using User Relevance Feedback and Guru Estimation)

  • 정경석;박혁로
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.487-492
    • /
    • 2008
  • 대부분의 웹 검색엔진은 문서의 적합도와 중요도를 함께 고려하는 순위화 방법을 사용한다. 문서의 적합도는 문서가 사용자의 검색의도를 만족시키는 정도이고, 중요도는 인기 있거나 양질의 내용을 포함하는 등 문서의 품질을 표시하는 정도라고 할 수 있다. 지금까지 웹 문서의 중요도를 평가하는 방법으로 가장 성공적인 것은 하이퍼링크 구조를 사용한 방법이다. 하지만 블로그의 경우, 해당 블로그를 작성한 블로거와 그 블로거가 소유하는 다른 문서들을 알 수 있기 때문에 문서의 중요도를 평가하는 다른 방법을 생각할 수 있다. 본 논문에서 제안하는 방법은 사용자의 북마크와 클릭를 이용하여 문서의 중요도를 계산하고, 그러한 문서 점수를 바탕으로 블로거의 구루점수를 계산한다. 마지막으로 문서를 순위화할 때 해당 문서를 작성한 구루의 구루 점수를 반영한다. 이렇게 되면 구루점수가 높은 구루 블로거의 문서들이 상위에 검색됨에 따라서 전반적으로 검색 품질이 개선될 수 있다. 블로그 문서를 대상으로 한 실험결과 제안하는 방법이 기존의 전통적인 웹 검색 성능과 비교하여 정답집합과의 연관성이 높음을 알 수 있었다.

Interactive Semantic Image Retrieval

  • Patil, Pushpa B.;Kokare, Manesh B.
    • Journal of Information Processing Systems
    • /
    • 제9권3호
    • /
    • pp.349-364
    • /
    • 2013
  • The big challenge in current content-based image retrieval systems is to reduce the semantic gap between the low level-features and high-level concepts. In this paper, we have proposed a novel framework for efficient image retrieval to improve the retrieval results significantly as a means to addressing this problem. In our proposed method, we first extracted a strong set of image features by using the dual-tree rotated complex wavelet filters (DT-RCWF) and dual tree-complex wavelet transform (DT-CWT) jointly, which obtains features in 12 different directions. Second, we presented a relevance feedback (RF) framework for efficient image retrieval by employing a support vector machine (SVM), which learns the semantic relationship among images using the knowledge, based on the user interaction. Extensive experiments show that there is a significant improvement in retrieval performance with the proposed method using SVMRF compared with the retrieval performance without RF. The proposed method improves retrieval performance from 78.5% to 92.29% on the texture database in terms of retrieval accuracy and from 57.20% to 94.2% on the Corel image database, in terms of precision in a much lower number of iterations.

퍼지와 의미특징을 이용한 스니핏 추출 향상 방법 (Enhancing Snippet Extraction Method using Fuzzy and Semantic Features)

  • 박선;이연우;조광문;양후열;이성로
    • 한국정보통신학회논문지
    • /
    • 제16권11호
    • /
    • pp.2374-2381
    • /
    • 2012
  • 본 논문은 퍼지와 의미특징을 이용한 새로운 스니핏 추출의 성능향상 방법을 제안한다. 제안방법은 문장집합의 의미특징을 이용하여 대표문장을 생성하고, 대표문장과 문장집합의 퍼지관계를 이용함으로써 질의를 잘 나타내는 스니핏을 추출한다. 또한 의사연관 피드백을 이용하여 질의를 확장함으로써 사용자의 의도가 의미적으로 더 잘 포함되는 스니핏을 추출할 수 있다. 실험결과 제안방법이 다른 방법에 비해서 스니핏 추출에 더 좋은 성능을 보인다.

불리언 질의 재구성에서 의사결정나무의 학습 성능 감도 분석 (Sensitivity Analysis of Decision Tree's Learning Effectiveness in Boolean Query Reformulation)

  • 윤정미;김남호;권영식
    • 한국경영과학회지
    • /
    • 제23권4호
    • /
    • pp.141-149
    • /
    • 1998
  • One of the difficulties in using the current Boolean-based information retrieval systems is that it is hard for a user, especially a novice, to formulate an effective Boolean query. One solution to this problem is to let the system formulate a query for a user from his relevance feedback documents in this research, an intelligent query reformulation mechanism based on ID3 is proposed and the sensitivity of its retrieval effectiveness, i.e., recall, precision, and E-measure, to various input settings is analyzed. The parameters in the input settings is the number of relevant documents. Experiments conducted on the test set of Medlars revealed that the effectiveness of the proposed system is in fact sensitive to the number of the initial relevant documents. The case with two or more initial relevant documents outperformed the case with one initial relevant document with statistical significances. It is our conclusion that formulation of an effective query in the proposed system requires at least two relevant documents in its initial input set.

  • PDF

내용 기반 음악 정보 검색에서 주제 선율의 변화 패턴을 이용한 색인 및 검색 기법 (Indexing and Retrieval Mechanism using Variation Patterns of Theme Melodies in Content-based Music Information Retrievals)

  • 구경이;신창환;김유성
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.507-520
    • /
    • 2003
  • 본 연구에서는 내용 기반 음악 정보 검색 시스템의 검색 속도를 증진하기 위해 음악의 대표 선율인 주제 선율을 추출하여 주제 선율 색인을 구성하고 이를 이용한 효율적인 내용 기반 음악 정보 검색 기법을 제안하였다. 추출된 주제 선율을 다차원 공간 색인 기법인 M-tree를 이용하여 주제 선율 색인으로 구성하기 위해 주제 선율의 평균 음 높이 변화량과 평균 음 길이 변화량을 이용하였으며 검색의 정확도를 증진하기 위해 음 높이 변화 패턴을 요약한 높이 시그니처와 음 길이 변화 패턴을 요약한 길이 시그니처를 이용하였다. 또한 제안된 내용 기반 음악 정보 검색 기법에서는 사용자의 질의 선율로부터 질의 선율의 패턴 정보를 구성하고 M-tree의 k-근접 검색 및 범위 검색 기법을 이용하여 사용자의 질의 선율과 유사한 주제 선율을 포함하고 있는 음악 정보를 검색한다. 검색된 결과로부터 순위 부여한 후 사용자 피드백을 하여 사용자의 만족도를 증진하기 위한 특성을 포함하도록 하였다. 또한, 본 논문에서 제안된 주제 선율 색인 기법 및 내용 기반 검색 기법을 포함한 내용 기반 음악 정보 검색 시스템의 프로토타입을 구현하여 제안된 기법의 실효성을 입증하였다.

Integration of the PubAnnotation ecosystem in the development of a web-based search tool for alternative methods

  • Neves, Mariana
    • Genomics & Informatics
    • /
    • 제18권2호
    • /
    • pp.18.1-18.5
    • /
    • 2020
  • Finding publications that propose alternative methods to animal experiments is an important but time-consuming task since researchers need to perform various queries to literature databases and screen many articles to assess two important aspects: the relevance of the article to the research question, and whether the article's proposed approach qualifies to being an alternative method. We are currently developing a Web application to support finding alternative methods to animal experiments. The current (under development) version of the application utilizes external tools and resources for document processing, and relies on the PubAnnotation ecosystem for annotation querying, annotation storage, dictionary-based tagging of cell lines, and annotation visualization. Currently, our two PubAnnotation repositories for discourse elements contain annotations for more than 110k PubMed documents. Further, we created an annotator for cell lines that contain more than 196k terms from Cellosaurus. Finally, we are experimenting with TextAE for annotation visualization and for user feedback.