• 제목/요약/키워드: local descriptor

검색결과 86건 처리시간 0.026초

Intra-class Local Descriptor-based Prototypical Network for Few-Shot Learning

  • Huang, Xi-Lang;Choi, Seon Han
    • 한국멀티미디어학회논문지
    • /
    • 제25권1호
    • /
    • pp.52-60
    • /
    • 2022
  • Few-shot learning is a sub-area of machine learning problems, which aims to classify target images that only contain a few labeled samples for training. As a representative few-shot learning method, the Prototypical network has been received much attention due to its simplicity and promising results. However, the Prototypical network uses the sample mean of samples from the same class as the prototypes of that class, which easily results in learning uncharacteristic features in the low-data scenery. In this study, we propose to use local descriptors (i.e., patches along the channel within feature maps) from the same class to explicitly obtain more representative prototypes for Prototypical Network so that significant intra-class feature information can be maintained and thus improving the classification performance on few-shot learning tasks. Experimental results on various benchmark datasets including mini-ImageNet, CUB-200-2011, and tiered-ImageNet show that the proposed method can learn more discriminative intra-class features by the local descriptors and obtain more generic prototype representations under the few-shot setting.

비디오 감시 응용에서 확장된 기술자를 이용한 물체 검출과 분류 (Object Detection and Classification Using Extended Descriptors for Video Surveillance Applications)

  • 모하마드 카이룰 이슬람;파라 자한;민재홍;백중환
    • 대한전자공학회논문지SP
    • /
    • 제48권4호
    • /
    • pp.12-20
    • /
    • 2011
  • 본 논문은 비디오 감시 장치에 사용되는 효율적인 물체 검출 및 분류 알고리즘을 제안한다. 이전 연구는 주로 Scale Invariant Feature Transform (SIFT)나 Speeded Up Robust Feature (SURF)와 같은 특정 형태의 특징을 이용해 물체를 검출하거나 분류하였다. 본 논문에서는 물체 검출 및 분류에 상호 작용하는 알고리즘을 제안한다. 이는 로컬 패치들로부터 얻어지는 텍스쳐나 컬러 분포 같은 서로 다른 특성을 갖는 특징값을 이용해 물체의 검출 및 분류율을 높인다. 물체 검출에는 특징점들의 공간적인 클러스터링을, 이미지 표현이나 분류에는 Bag of Words 모델과 Naive Bayes 분류기를 사용한다. 실험을 통해 제안한 기법이 로컬 기술자를 사용한 물체 분류기법보다 우수한 성능을 나타냄을 보인다.

고차원 국부이진패턴과 결합베이시안 알고리즘을 이용한 얼굴인증 임베디드 시스템 구현 (Implementation of a Face Authentication Embedded System Using High-dimensional Local Binary Pattern Descriptor and Joint Bayesian Algorithm)

  • 김동주;이승익;강석근
    • 한국정보통신학회논문지
    • /
    • 제21권9호
    • /
    • pp.1674-1680
    • /
    • 2017
  • 본 논문에서는 고차원 국부이진패턴과 결합베이시안 알고리즘을 이용한 얼굴인증 임베디드 시스템을 제안한다. 또한, 제안된 알고리즘에 대한 임베디드 시스템을 라즈베리파이 3을 이용하여 구현한 결과를 제시한다. 제안된 얼굴인증 알고리즘에 대한 평가는 500명의 얼굴 데이터가 저장된 데이터베이스를 이용하여 수행하였다. 여기서 각각의 얼굴 데이터는 학습용과 테스트용 이미지로 구성하였다. 성능평가를 위한 척도로는 주성분분석법의 차원에 따른 스코어 분포와 얼굴인증 시간을 이용하였다. 그 결과, 최적화된 임베디드 환경에서 우수한 얼굴인증 성능을 가지는 임베디드 시스템을 상대적으로 저렴한 비용으로 구현할 수 있음을 확인하였다.

형상 특징자 기반 강인성 3D 모델 해싱 기법 (Robust 3D Model Hashing Scheme Based on Shape Feature Descriptor)

  • 이석환;권성근;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제14권6호
    • /
    • pp.742-751
    • /
    • 2011
  • 본 논문에서는 형상 특징자인 열 커널 인증 (Heat Kernel Signature, HKS)를 기반으로 강인한 3D 모델 해싱을 제안한다. 키와 매개변수에 의존한 형상 특징자 기반 3D 모델 해싱을 제안한다. 제안한 방법에서는 Mesh Laplace 연산자의 고유치와 고유벡터에 의하여 각 꼭지점에 대한 전역 및 국부 타임 HKS 계수를 구한 다음, 이 계수들을 정방형 2D 셀로 군집화한다. 그리고 각 셀에 할당된 HKS 계수 쌍의 거리 가중치 기반으로 정의된 특징계수와 랜덤 계수 키와의 조합에 의하여 중간 해쉬 계수를 생성한 다음, 이진화 과정에 의하여 최종 이진 해쉬를 생성한다. 본 실험에서는 3D 범용 툴을 이용한 다양한 기하하적 공격과 위상학적 공격을 통하여 강인성을 평가하였고, 모델과 키 조합에 대한 해쉬의 유일성을 평가하였다. 또한 인증 범위를 만족히는 공격 세기를 측정함으로써 모델 공간성을 평가하였다. 실험결과로부터 제안한 3D 모델 해싱이 기존 해싱에 비하여 강인성 모델 공간성 및 유일성이 우수함을 확인하였다.

MPEG-7 디스크립터들의 조합을 이용한 영상 검색 (Image Retrieval Using a Composite of MPEG-7 Visual Descriptors)

  • 강희범;원치선
    • 방송공학회논문지
    • /
    • 제8권1호
    • /
    • pp.91-100
    • /
    • 2003
  • 본 논문에서는 MPEG-7 영상 디스크립터 중 에지 히스토그램 디스크립터(EHD), 컬러 레이아웃 디스크립터(CLD), 그리고 호모니어스 텍스쳐 디스크립터(HTD)로 구성된 각각의 영상 데이터베이스를 조합하여 렐러번스 피드백을 적용한 영상 검색 방법을 제안한다. 본 논문에서 사용한 에지 히스토그램 디스크립터는 영상의 국부적인 방향성 에지 분포를 표현한 것으로서 영상에 대하여 그 내용물의 형태를 잘 표현하는 디스크립터이다. 컬러 레이아웃 디스크립터는 구조적인 단순함과 빠른 동작 속도에 의해 영상 검색에 넓게 사용되어지며 컬러의 공간적 분포로 표현된다. 호모지니어스 텍스쳐 디스크립터는 영상의 질감에 대하여 정밀한 통계상의 분할로 서술된다. 앞에서 언급한 디스크립터들은 각각의 특징을 반영한 영상 검색에 적용되어 진다. 렐러번스 피드백은 영상 검색에 있어 사용자가 요구하는 정보를 반영할 수 있어 영상의 검색 효율을 높일 수 있다. 제안한 방법은 사용자가 렐러번스 피드백으로 결정한 영상의 특징 정보가 각각의 디스크립터들에 새로운 가중치를 부여한다. 따라서, 사용자의 선택적 요구가 반영된 특징 정보 갱신을 통해 검색 효율을 높인다. 자연 영상에 대한 실험 결과로 제안한 방법이 검색 성능을 향상시켜주는 것을 확인할 수 있다.

Infrared Target Recognition using Heterogeneous Features with Multi-kernel Transfer Learning

  • Wang, Xin;Zhang, Xin;Ning, Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권9호
    • /
    • pp.3762-3781
    • /
    • 2020
  • Infrared pedestrian target recognition is a vital problem of significant interest in computer vision. In this work, a novel infrared pedestrian target recognition method that uses heterogeneous features with multi-kernel transfer learning is proposed. Firstly, to exploit the characteristics of infrared pedestrian targets fully, a novel multi-scale monogenic filtering-based completed local binary pattern descriptor, referred to as MSMF-CLBP, is designed to extract the texture information, and then an improved histogram of oriented gradient-fisher vector descriptor, referred to as HOG-FV, is proposed to extract the shape information. Second, to enrich the semantic content of feature expression, these two heterogeneous features are integrated to get more complete representation for infrared pedestrian targets. Third, to overcome the defects, such as poor generalization, scarcity of tagged infrared samples, distributional and semantic deviations between the training and testing samples, of the state-of-the-art classifiers, an effective multi-kernel transfer learning classifier called MK-TrAdaBoost is designed. Experimental results show that the proposed method outperforms many state-of-the-art recognition approaches for infrared pedestrian targets.

내용기반 이미지 검색을 위한 MPEG-7 우위컬러 기술자의 효과적인 유사도 (An Effective Similarity Measure for Content-Based Image Retrieval using MPEG-7 Dominant Color Descriptor)

  • 이종원;낭종호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권8호
    • /
    • pp.837-841
    • /
    • 2010
  • 본 논문에서는 MPEG-7 DCD를 이용하여 내용기반 이미지 검색을 할 때 적합한 유사도 측정 방법을 제안한다. 제안한 방법은 이미지에서 추출한 도미넌트 컬러의 비율에 따라 유사도를 측정할 수 있도록 하였다. 실험결과 제안한 방법은 MPEG-7 DCD의 QHDM[1]에 의한 검색결과보다 전역 DCD를 사용할 경우 ANMRR이 18.9%의 성능향상을 보였으며 블록별 DCD를 사용할 경우 47.2%라는 높은 성능향상을 보였다. 이는 제안한 방법이 DCD를 이용하여 내용기반 이미지 검색을 할 때 효과적인 유사도 측정 방법임을 보여준다. 특히, 영역 기반의 이미지 검색 방법에 유용하게 적용할 수 있을 것으로 보인다.

An Optimized CLBP Descriptor Based on a Scalable Block Size for Texture Classification

  • Li, Jianjun;Fan, Susu;Wang, Zhihui;Li, Haojie;Chang, Chin-Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권1호
    • /
    • pp.288-301
    • /
    • 2017
  • In this paper, we propose an optimized algorithm for texture classification by computing a completed modeling of the local binary pattern (CLBP) instead of the traditional LBP of a scalable block size in an image. First, we show that the CLBP descriptor is a better representative than LBP by extracting more information from an image. Second, the CLBP features of scalable block size of an image has an adaptive capability in representing both gross and detailed features of an image and thus it is suitable for image texture classification. This paper successfully implements a machine learning scheme by applying the CLBP features of a scalable size to the Support Vector Machine (SVM) classifier. The proposed scheme has been evaluated on Outex and CUReT databases, and the evaluation result shows that the proposed approach achieves an improved recognition rate compared to the previous research results.

위상차 현미경 영상 내 푸리에 묘사자를 이용한 암세포 형태별 분류 (Classification of Tumor cells in Phase-contrast Microscopy Image using Fourier Descriptor)

  • 강미선;이정엄;김혜련;김명희
    • 대한의용생체공학회:의공학회지
    • /
    • 제33권4호
    • /
    • pp.169-176
    • /
    • 2012
  • Tumor cell morphology is closely related to its migratory behaviors. An active tumor cell has a highly irregular shape, whereas a spherical cell is inactive. Thus, quantitative analysis of cell features is crucial to determine tumor malignancy or to test the efficacy of anticancer treatment. We use 3D time-lapse phase-contrast microscopy to analyze single cell morphology because it enables to observe long-term activity of living cells without photobleaching and phototoxicity, which is common in other fluorescence-labeled microscopy. Despite this advantage, there are image-level drawbacks to phase-contrast microscopy, such as local light effect and contrast interference ring. Therefore, we first corrected for non-uniform illumination artifacts and then we use intensity distribution information to detect cell boundary. In phase contrast microscopy image, cell is normally appeared as dark region surrounded by bright halo ring. Due to halo artifact is minimal around the cell body and has non-symmetric diffusion pattern, we calculate cross sectional plane which intersects center of each cell and orthogonal to first principal axis. Then, we extract dark cell region by analyzing intensity profile curve considering local bright peak as halo area. Finally, we calculated the Fourier descriptor that morphological characteristics of cell to classify tumor cells into active and inactive groups. We validated classification accuracy by comparing our findings with manually obtained results.

비디오 감시 응용을 위한 텍스쳐와 컬러 정보를 이용한 고속 물체 인식 (Fast Object Classification Using Texture and Color Information for Video Surveillance Applications)

  • 이슬람 모하마드 카이룰;자한 파라;민재홍;백중환
    • 한국항행학회논문지
    • /
    • 제15권1호
    • /
    • pp.140-146
    • /
    • 2011
  • 본 논문에서는 텍스쳐와 컬러 정보를 기반으로 비디오 감시를 위한 빠른 물체 분류 방법을 제안한다. 영상들로부터 SURF와 색 히스토그램의 국부적 패치들을 추출하여 그들의 장점을 이용한다. SURF는 명암 내용 정보를 제공하고 색 정보는 패치에 대한 특이성을 증강시킨다. SURF의 빠른 계산뿐만 아니라 객체의 색 정보를 활용한다. 국부적 특징을 이용하여 관심 영역 혹은 영상의 전역적 서술자를 생성하기 위해 Bag of Word 모델을 이용하고, 전역적 서술자를 분류하기 위해 Na$\ddot{i}$ve Bayes 모델을 이용한다. 또한 본 논문에서는 판별적인 기술자인 SIFT도 성능 분석한다. 네 종류의 객체에 대한 실험결과 95.75%의 인식률을 보였다.