• 제목/요약/키워드: Similarity retrieval

검색결과 437건 처리시간 0.026초

인터넷에 기반한 내용기반 검색 시스템 설계 (Content-Based Retrieval System Design over the Internet)

  • 김영호;강대성
    • 제어로봇시스템학회논문지
    • /
    • 제11권5호
    • /
    • pp.471-475
    • /
    • 2005
  • Recently, development of digital technology is occupying a large part of multimedia information like character, voice, image, video, etc. Research about video indexing and retrieval progresses especially in research relative to video. This paper proposes the novel notation in order to retrieve MPEG video in the international standards of moving picture encoding For realizing the retrieval-system, we detect DCT DC coefficient, and then we obtain shot to apply MVC(Mean Value Comparative) notation to image constructed DC coefficient. We choose the key frame for start-frame of a shot, and we have the codebook index generating it using feature of DC image and applying PCA(principal Component Analysis) to the key frame. Also, we realize the retrieval-system through similarity after indexing. We could reduce error detection due to distinguish shot from conventional shot detection algorithm. In the mean time, speed of indexing is faster by PCA due to perform it in the compressed domain, and it has an advantage which is to generate codebook due to use statistical features. Finally, we could realize efficient retrieval-system using MVC and PCA to shot detection and indexing which is important step of retrieval-system, and we using retrieval-system over the internet.

Shape Description and Retrieval Using Included-Angular Ternary Pattern

  • Xu, Guoqing;Xiao, Ke;Li, Chen
    • Journal of Information Processing Systems
    • /
    • 제15권4호
    • /
    • pp.737-747
    • /
    • 2019
  • Shape description is an important and fundamental issue in content-based image retrieval (CBIR), and a number of shape description methods have been reported in the literature. For shape description, both global information and local contour variations play important roles. In this paper a new included-angular ternary pattern (IATP) based shape descriptor is proposed for shape image retrieval. For each point on the shape contour, IATP is derived from its neighbor points, and IATP has good properties for shape description. IATP is intrinsically invariant to rotation, translation and scaling. To enhance the description capability, multiscale IATP histogram is presented to describe both local and global information of shape. Then multiscale IATP histogram is combined with included-angular histogram for efficient shape retrieval. In the matching stage, cosine distance is used to measure shape features' similarity. Image retrieval experiments are conducted on the standard MPEG-7 shape database and Swedish leaf database. And the shape image retrieval performance of the proposed method is compared with other shape descriptors using the standard evaluation method. The experimental results of shape retrieval indicate that the proposed method reaches higher precision at the same recall value compared with other description method.

Descriptor 조합 및 동일 병명 이미지 수량 역비율 가중치를 적용한 유사도 기반 작물 질병 검색 기술 설계 및 구현 (Design and Implementation of a Similarity based Plant Disease Image Retrieval using Combined Descriptors and Inverse Proportion of Image Volumes)

  • 임혜진;정다운;유성준;구영현;박종한
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권6호
    • /
    • pp.30-43
    • /
    • 2018
  • 영상의 특징인 색상, 모양, 질감 등을 이용해 영상을 검색하는 연구들은 많이 진행되어 왔다. 또한 작물의 질병 영상과 관련된 연구들도 진행되고 있다. 농업 현장에서 재배되는 작물에 발생한 질병을 확인하는데 도움이 되기 위해 본 논문에서는 시설원예 작물의 질병 영상을 이용한 유사도 기반 작물 질병 검색 시스템을 제안한다. 제안하는 시스템은 단일 Descriptor를 사용하지 않고, 조합 Descriptor를 통해 기존 대비 영상의 유사도 검색 성능을 높였고 유사도 검색 결과를 가독성 높게 사용자에게 제공하기 위해 가중치 기반 산출방법을 적용했다. 본 논문에서는 총 13개의 개별 Descriptor를 이용해 조합을 진행했다. 조합 Descriptor를 이용해 6개 작물의 질병에 대해 유사도 검색을 진행했고 작물별로 평균 accuracy가 높은 조합 Descriptor를 선정해 유사도 검색에 사용했다. 검색된 결과는 병명의 비율을 기반으로 한 산출방법과 가중치를 기반으로 한 산출방법을 사용해 백분율로 나타냈다. 병명의 비율을 기반으로 한 산출방법은 질의 영상과 유사도 검색에 사용되는 영상의 수가 많은 병명이 1순위로 출력되는 문제점이 있다. 이를 해결하기 위해 가중치를 기반으로 한 산출방법을 사용했다. 작물의 병명별 테스트 영상을 두 가지 산출방법에 적용해 검색 성능을 측정했다. 작물의 질병별로 두 가지 산출방법에 대해 검색 성능 값의 평균을 비교한 결과 고추, 사과 작물에서는 병명의 비율을 기반으로 한 산출방법의 성능이 가중치를 기반으로 한 산출방법의 성능보다 평균 약 11.89%의 높은 성능 결과를 보였다. 국화, 딸기, 배, 포도 작물에서는 가중치를 기반으로 한 산출방법이 병명의 비율을 기반으로 한 산출방법의 성능보다 평균 약 20.34%의 높은 성능 결과를 보였다. 또한 본 논문에서 제안하는 시스템의 UI/UX는 실제 사용자의 피드백을 통해 편리하게 구성했다. 시스템의 화면마다 상단에 제목과 설명을 출력했고 사용자가 질병의 정보를 보기 편리하게 화면을 구성했다. 검색된 질병의 정보는 위에서 제안한 산출방법을 토대로 유사한 질병의 영상과 병명을 출력한다. 시스템의 환경은 PC 환경 기반의 웹 브라우저와 모바일 디바이스 환경 기반의 웹 브라우저를 통해 사용할 수 있도록 구현했다.

Empirical Comparison of Word Similarity Measures Based on Co-Occurrence, Context, and a Vector Space Model

  • Kadowaki, Natsuki;Kishida, Kazuaki
    • Journal of Information Science Theory and Practice
    • /
    • 제8권2호
    • /
    • pp.6-17
    • /
    • 2020
  • Word similarity is often measured to enhance system performance in the information retrieval field and other related areas. This paper reports on an experimental comparison of values for word similarity measures that were computed based on 50 intentionally selected words from a Reuters corpus. There were three targets, including (1) co-occurrence-based similarity measures (for which a co-occurrence frequency is counted as the number of documents or sentences), (2) context-based distributional similarity measures obtained from a latent Dirichlet allocation (LDA), nonnegative matrix factorization (NMF), and Word2Vec algorithm, and (3) similarity measures computed from the tf-idf weights of each word according to a vector space model (VSM). Here, a Pearson correlation coefficient for a pair of VSM-based similarity measures and co-occurrence-based similarity measures according to the number of documents was highest. Group-average agglomerative hierarchical clustering was also applied to similarity matrices computed by individual measures. An evaluation of the cluster sets according to an answer set revealed that VSM- and LDA-based similarity measures performed best.

커버곡 검색을 위한 크로마 n-gram 선택에 관한 연구 (An investigation of chroma n-gram selection for cover song search)

  • 서진수;김정현;박지현
    • 한국음향학회지
    • /
    • 제36권6호
    • /
    • pp.436-441
    • /
    • 2017
  • 음악 유사도 계산은 음악 검색 시스템 구현에 있어서 필수적인 구성 요소이다. 본 논문은 음악 검색 중에서 커버곡 검색에 대해서 다룬다. 크로마 n-gram을 이용한 커버곡 검색에 있어서 특징 DB 저장 공간을 줄이고 성능을 향상시키기 위해서 t-tab n-gram을 제안하고, n-gram 선택 방법, n-gram 집합 간 비교 방법에 관해서 연구하였다. 공개되어 있는 커버곡 데이터셋에서 실험을 수행하여 제안된 방법이 저장 공간을 줄이면서 동시에 커버곡 검색 성능을 향상시킬 수 있음을 보였다.

영상 형태 특징을 이용한 내용 기반 검색 시스템 (Content-based Retrieval System using Image Shape Features)

  • 황병곤;정성호;이상열
    • 한국산업정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.33-38
    • /
    • 2001
  • 본 논문에서는 영상의 형태 특징을 이용한 영상 검색 시스템을 제안한다. 형태특징을 얻기 위해서 먼저 체인코드를 이용하여 경계선 추출을 추출하였다. 형태특징으로 객체의 경계선과 무게중심까지의 합, 표준편차 그리고 객체의 장축과 단축 비율 등을 추출하였다. 이러한 형태특징 정보를 이용하여 데이터 베이스에 저장된 영상과 질의 영상을 비교하여 유사도 순위에 따라 후보 영상들을 검색하였다. 본 실험의 결과 크기, 회전 이동 등의 변화에 둔감하였다. 약 170개의 폐곡선을 이루는 영상에 대한 검색 실험을 통하여 모양 정보에 대한 정확도를 측정하였다. 실험 결과 평균 Recall/Precision이 0.72/0.83를 보임으로써 제안된 방법이 유용함을 보였다.

  • PDF

Stochastic Non-linear Hashing for Near-Duplicate Video Retrieval using Deep Feature applicable to Large-scale Datasets

  • Byun, Sung-Woo;Lee, Seok-Pil
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권8호
    • /
    • pp.4300-4314
    • /
    • 2019
  • With the development of video-related applications, media content has increased dramatically through applications. There is a substantial amount of near-duplicate videos (NDVs) among Internet videos, thus NDVR is important for eliminating near-duplicates from web video searches. This paper proposes a novel NDVR system that supports large-scale retrieval and contributes to the efficient and accurate retrieval performance. For this, we extracted keyframes from each video at regular intervals and then extracted both commonly used features (LBP and HSV) and new image features from each keyframe. A recent study introduced a new image feature that can provide more robust information than existing features even if there are geometric changes to and complex editing of images. We convert a vector set that consists of the extracted features to binary code through a set of hash functions so that the similarity comparison can be more efficient as similar videos are more likely to map into the same buckets. Lastly, we calculate similarity to search for NDVs; we examine the effectiveness of the NDVR system and compare this against previous NDVR systems using the public video collections CC_WEB_VIDEO. The proposed NDVR system's performance is very promising compared to previous NDVR systems.

Robust Similarity Retrieval for Radial Distortion of Object Shape Based on the Normalized Phase Angles and Moment

  • An, Young Eun;Kim, Tae Yeun
    • 통합자연과학논문집
    • /
    • 제12권2호
    • /
    • pp.35-43
    • /
    • 2019
  • In the content-based image search properties, form information is simple because only the contours of objects are available, and although it can effectively extract the characteristics of the objects, it is sensitive to external noise. The radial distortion, one of these noises, is most prominent in the eyewear and, due to the structural characteristics of the imaging equipment, radiative distortion occurs in almost all imaging equipment. It is very important to determine the similarity of the objects in the images in which these distortions occurred to the actual objects. In order to improve this problem, we propose a strong image search technique for formative noise and radiative distortion using regularization phase angles and moments. Through simulation using Wang DB, the proposed algorithm proved excellent performance for radiation distortion that occurs in general. In addition, a system optimized for database can be implemented by making appropriate changes to the threshold values, enabling image retrieval with the desired level of confidence in various systems. The algorithm proposed in this paper is expected to be utilized as an optimal imaging system by extracting morphological form information of multimedia data.

내용기반 이미지 검색을 위한 색상, 텍스쳐, 에지 기능의 통합 (Integrating Color, Texture and Edge Features for Content-Based Image Retrieval)

  • 마명;박동원
    • 감성과학
    • /
    • 제7권4호
    • /
    • pp.57-65
    • /
    • 2004
  • 본 논문에서는 color, texture, shape의 정보를 통합 이용하여 내용기반 영상검색 시스템의 성능을 향상시키는 기법을 고찰하였다. 먼저 영상에 내재되어 있는 color를 분석 추출하여 몇 개의 대표색으로 요약 표현한 다음, 이를 활용한 근사치 측정도를 고안하였다. Texture정보 분석에 있어서는 영상의 주축 행렬 데이터를 통계적 접근 방법으로 추출하였다. Edge분석의 방법으로는 Edge 막대그래프에서 색상변환, 양자화, 필터링에 관련된 정보를 선행처리 후 Edge 정보를 추출하였다. 마지막으로, 본 연구의 결과인 내용기반 영상검색 시스템의 효율성을 precision-recall 분석과 실험적 결과를 통하여 입증하였다.

  • PDF

Word Embeddings-Based Pseudo Relevance Feedback Using Deep Averaging Networks for Arabic Document Retrieval

  • Farhan, Yasir Hadi;Noah, Shahrul Azman Mohd;Mohd, Masnizah;Atwan, Jaffar
    • Journal of Information Science Theory and Practice
    • /
    • 제9권2호
    • /
    • pp.1-17
    • /
    • 2021
  • Pseudo relevance feedback (PRF) is a powerful query expansion (QE) technique that prepares queries using the top k pseudorelevant documents and choosing expansion elements. Traditional PRF frameworks have robustly handled vocabulary mismatch corresponding to user queries and pertinent documents; nevertheless, expansion elements are chosen, disregarding similarity to the original query's elements. Word embedding (WE) schemes comprise techniques of significant interest concerning QE, that falls within the information retrieval domain. Deep averaging networks (DANs) defines a framework relying on average word presence passed through multiple linear layers. The complete query is understandably represented using the average vector comprising the query terms. The vector may be employed for determining expansion elements pertinent to the entire query. In this study, we suggest a DANs-based technique that augments PRF frameworks by integrating WE similarities to facilitate Arabic information retrieval. The technique is based on the fundamental that the top pseudo-relevant document set is assessed to determine candidate element distribution and select expansion terms appropriately, considering their similarity to the average vector representing the initial query elements. The Word2Vec model is selected for executing the experiments on a standard Arabic TREC 2001/2002 set. The majority of the evaluations indicate that the PRF implementation in the present study offers a significant performance improvement compared to that of the baseline PRF frameworks.