• 제목/요약/키워드: Binary Similarity

검색결과 93건 처리시간 0.02초

컬러와 블록영역 특징을 이용한 내용기반 화상 검색 (Content-based Image Retrieval using Color and Block Region Features)

  • 최기호
    • 한국통신학회논문지
    • /
    • 제27권6C호
    • /
    • pp.610-618
    • /
    • 2002
  • 본 논문에서는 질러 공간과 블록영역 정보에 기반한 새로운 화상검색 방법을 제시한다. 각 화상에 대한 컬러 공간 정보는 컬러 이진세트에 의해 구해지고 블록영역 정보는 영역 세그멘테이션에 의해서 구해진다. 화상 검색 과정에서, 질의 화상과 데이터베이스 화상들의 컬러 및 화상 이진세트들을 비교하여 검색될 후보 화상의 집합을 결정한다. 특히, 유사도 측정 시 컬러 공간 분포와 객체의 블록영역 특징에 가중치를 고려한 검색이 가능하도록 하였다. 제안된 방법을 구현하고 6,000개의 화상들로 이루어진 화상 데이터베이스에 대해 적용함으로써 컬러 공간 및 블록영역특징을 이용한 화상 검색이 매우 효과적임을 보였다.

Visual Object Tracking Fusing CNN and Color Histogram based Tracker and Depth Estimation for Automatic Immersive Audio Mixing

  • Park, Sung-Jun;Islam, Md. Mahbubul;Baek, Joong-Hwan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권3호
    • /
    • pp.1121-1141
    • /
    • 2020
  • We propose a robust visual object tracking algorithm fusing a convolutional neural network tracker trained offline from a large number of video repositories and a color histogram based tracker to track objects for mixing immersive audio. Our algorithm addresses the problem of occlusion and large movements of the CNN based GOTURN generic object tracker. The key idea is the offline training of a binary classifier with the color histogram similarity values estimated via both trackers used in this method to opt appropriate tracker for target tracking and update both trackers with the predicted bounding box position of the target to continue tracking. Furthermore, a histogram similarity constraint is applied before updating the trackers to maximize the tracking accuracy. Finally, we compute the depth(z) of the target object by one of the prominent unsupervised monocular depth estimation algorithms to ensure the necessary 3D position of the tracked object to mix the immersive audio into that object. Our proposed algorithm demonstrates about 2% improved accuracy over the outperforming GOTURN algorithm in the existing VOT2014 tracking benchmark. Additionally, our tracker also works well to track multiple objects utilizing the concept of single object tracker but no demonstrations on any MOT benchmark.

Stochastic Non-linear Hashing for Near-Duplicate Video Retrieval using Deep Feature applicable to Large-scale Datasets

  • Byun, Sung-Woo;Lee, Seok-Pil
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권8호
    • /
    • pp.4300-4314
    • /
    • 2019
  • With the development of video-related applications, media content has increased dramatically through applications. There is a substantial amount of near-duplicate videos (NDVs) among Internet videos, thus NDVR is important for eliminating near-duplicates from web video searches. This paper proposes a novel NDVR system that supports large-scale retrieval and contributes to the efficient and accurate retrieval performance. For this, we extracted keyframes from each video at regular intervals and then extracted both commonly used features (LBP and HSV) and new image features from each keyframe. A recent study introduced a new image feature that can provide more robust information than existing features even if there are geometric changes to and complex editing of images. We convert a vector set that consists of the extracted features to binary code through a set of hash functions so that the similarity comparison can be more efficient as similar videos are more likely to map into the same buckets. Lastly, we calculate similarity to search for NDVs; we examine the effectiveness of the NDVR system and compare this against previous NDVR systems using the public video collections CC_WEB_VIDEO. The proposed NDVR system's performance is very promising compared to previous NDVR systems.

Underwater Optical Image Data Transmission in the Presence of Turbulence and Attenuation

  • Ramavath Prasad Naik;Maaz Salman;Wan-Young Chung
    • 융합신호처리학회논문지
    • /
    • 제24권1호
    • /
    • pp.1-14
    • /
    • 2023
  • Underwater images carry information that is useful in the fields of aquaculture, underwater military security, navigation, transportation, and so on. In this research, we transmitted an underwater image through various underwater mediums in the presence of underwater turbulence and beam attenuation effects using a high-speed visible optical carrier signal. The optical beam undergoes scintillation because of the turbulence and attenuation effects; therefore, distorted images were observed at the receiver end. To understand the behavior of the communication media, we obtained the bit error rate (BER) performance of the system with respect to the average signal-to-noise ratio (SNR). Also, the structural similarity index (SSI) and peak SNR (PSNR) metrics of the received image were evaluated. Based on the received images, we employed suitable nonlinear filters to recover the distorted images and enhance them further. The BER, SSI, and PSNR metrics of the specific nonlinear filters were also evaluated and compared with the unfiltered metrics. These metrics were evaluated using the on-off keying and binary phase-shift keying modulation techniques for the 50-m and 100-m links for beam attenuation resulting from pure seawater, clear ocean water, and coastal ocean water mediums.

Face Representation and Face Recognition using Optimized Local Ternary Patterns (OLTP)

  • Raja, G. Madasamy;Sadasivam, V.
    • Journal of Electrical Engineering and Technology
    • /
    • 제12권1호
    • /
    • pp.402-410
    • /
    • 2017
  • For many years, researchers in face description area have been representing and recognizing faces based on different methods that include subspace discriminant analysis, statistical learning and non-statistics based approach etc. But still automatic face recognition remains an interesting but challenging problem. This paper presents a novel and efficient face image representation method based on Optimized Local Ternary Pattern (OLTP) texture features. The face image is divided into several regions from which the OLTP texture feature distributions are extracted and concatenated into a feature vector that can act as face descriptor. The recognition is performed using nearest neighbor classification method with Chi-square distance as a similarity measure. Extensive experimental results on Yale B, ORL and AR face databases show that OLTP consistently performs much better than other well recognized texture models for face recognition.

모양 특징정보 기반 이미지 검색을 위한 이진 영상 변환 및 유사도 검색 (Binary Conversion and Similarity Check for Shape feature Information based Image Retrieval)

  • 김주연;김진천
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.375-378
    • /
    • 2003
  • 본 논문에서는 공간적 정보로 이미지검색을 하는 모양 특징정보 기반 이미지 검색 시스템에서 검색효율을 향상 시킬 수 있는 이진 영상 변환 및 유사도 검색에 대한 기법을 제안하였다. 모양특징정보의 좀더 정확한 값의 추출을 위해 이미지의 잡음이 윤곽선으로 인식되는 값이 최소화 될 수 있도록 하는 이진 영상 변환방법을 제안하였으며, 유사도 검색에서는 영역별 특징정보 간의 비교와 병행하여 영역을 다시 소그룹화한 다음 소그룹간의 평균 유사도 값의 비교방법을 적용하였다. 성능 평가를 통하여 제안된 이진 영상 변환 겐 유사도 검색 방법을 사용한 경우 기존의 방법보다 향상된 검색 효율성을 보임을 알 수 있었다.

  • PDF

패턴인식을 위한 디지탈 DBNN의 설계 (Design of digital DBNN for pattern recoginition)

  • 송창영;문성룡;김환용
    • 한국통신학회논문지
    • /
    • 제21권11호
    • /
    • pp.3001-3011
    • /
    • 1996
  • In this paper, using DBNN algorithm which is used in the binary pattern classification or speech signal processing the digital DBNN circuit is designed having the variable expansion depending the size of input data and pattern type. The processing elemen(PE) of the proposed network consists of the synapse and MAXNET circuits for the similarity measurement between reference and input pattern. Global MAXNET selects the global winner among the local winners which is selected in each PE. Through the several simultions, and thus each PE and global MAXNET search the reference pattern that was the most simlar to input pattern for the discord of the pattern.

  • PDF

An Adaptive Steganography of Optical Image using Bit-Planes and Multi-channel Characteristics

  • Kang, Jin-Suk;Jeong, Taik-Yeong T.
    • Journal of the Optical Society of Korea
    • /
    • 제12권3호
    • /
    • pp.136-146
    • /
    • 2008
  • We proposed an adaptive steganography of an optical image using bit-planes and multichannel characteristics. The experiment's purpose was to compare the most popular methods used in optical steganography and to examine their advantages and disadvantages. In this paper we describe two digital methods: the first uses less significant bits(LSB) to encode hidden data, and in the other all blocks of $n{\times}n$ pixels are coded by using DCT(Digital Cosine Transformation), and two optical methods: double phase encoding and digital hologram watermarking with double binary phase encoding by using IFTA(Iterative Fourier Transform Algorithm) with phase quantization. Therefore, we investigated the complexity on bit plane and data, similarity insert information into bit planes. As a result, the proposed method increased the insertion capacity and improved the optical image quality as compared to fixing threshold and variable length method.

탄성변형에너지 측도를 이용한 부분적으로 가려진 이진 객체의 인식 (Recognition of Partially Occluded Binary Objects using Elastic Deformation Energy Measure)

  • 문영인;구자영
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권10호
    • /
    • pp.63-70
    • /
    • 2014
  • 주어진 이진영상 안에 존재하는 객체를 인식하기 위해서는 영상분할과 패턴정합 과정을 거친다. 영상 내의 이진 객체들이 서로 분리되었다는 조건 하에서는 면적, 경계선의 길이, 또는 그들 사이의 비례 등과 같은 대상 전체의 특징을 기술하는 전역적 특징을 이용해서 객체를 인식할 수 있지만 객체들이 서로에 의해 부분적으로 가리어져 있으면 전역적 특징은 사용될 수 없고 점, 선분 등 객체의 부분을 기술하는 국지적 특징들을 이용해서 인식해야 한다. 본 논문에서는 모델의 경계선상의 곡률이 큰 점들을 추출하여 특징점으로 삼고, 그 가운데 두 점을 택하여 하나의 국지적 특징으로 사용한다. 또한 모델과 입력영상에서 각기 추출된 국지적 특징들을 비교하여 정합함으로써 부분적으로 가려진 객체를 인식하는 방법을 제안하고 있다. 특징점의 쌍으로 표현되는 국지적 특징을 서로 비교함에 있어서 두 점간의 거리와 양 특징점에서의 그래디언트 벡터의 사이 각을 일치시키는데 필요한 탄성변형 에너지를 이용하여 국지적 특징 사이의 유사도를 정의한다. 인식대상 객체 상의 한 특징점의 레이블을 다른 특징점의 레이블들이 얼마나 지지하는 지를 계산함으로써 부분적으로 가려진 객체를 안정적으로 인식하는 방법을 제안한다. Kimia-25 데이터에 대한 실험 결과 최대 클리크 알고리즘의 4.5배의 속도로 동일한 인식률을 얻음을 보였다.

형상 유사도 기반의 유전 알고리즘을 활용한 이종 수치지도 간의 면 객체 집합 정합 알고리즘 개발 (Development of polygon object set matching algorithm between heterogeneous digital maps - using the genetic algorithm based on the shape similarities)

  • 허용;이재빈
    • 한국측량학회지
    • /
    • 제31권1호
    • /
    • pp.1-9
    • /
    • 2013
  • 본 연구는 유전 알고리즘을 이용하여 다대다 면 객체 정합을 수행하는 방법을 제안한다. 동일한 지형 지물을 표현하는 객체 집합의 형상은 서로 동일하다는 가정 하에 형상 유사도를 최적화하는 객체 집합을 두 지도 사이에서 탐색함으로써 정합을 수행한다. 이 때 어떤 객체가 객체 집합에 포함되는지의 여부를 이진 부호로 표현하고, 이진 부호들을 결합한 이진 문자열로 후보해를 표현한다. 초기 후보해들로 해집단을 생성한 뒤, 유전 알고리즘에 의하여 점진적으로 해집단의 품질을 개선함으로써 최적해를 탐색하였다. 제안된 방법을 평가하기 위하여 수원시 도심지역의 수치지형도와 지적도에서 가구계 대응 면 객체 집합을 탐색하였으며 제안된 알고리즘의 효용성을 확인할 수 있었다. 또한 수작업에 의한 탐색결과를 이용하여 평가한 결과 0.946의 정확도를 얻었다.