• 제목/요약/키워드: Scale-invariant Feature

검색결과 234건 처리시간 0.025초

An Efficient Monocular Depth Prediction Network Using Coordinate Attention and Feature Fusion

  • Huihui, Xu;Fei ,Li
    • Journal of Information Processing Systems
    • /
    • 제18권6호
    • /
    • pp.794-802
    • /
    • 2022
  • The recovery of reasonable depth information from different scenes is a popular topic in the field of computer vision. For generating depth maps with better details, we present an efficacious monocular depth prediction framework with coordinate attention and feature fusion. Specifically, the proposed framework contains attention, multi-scale and feature fusion modules. The attention module improves features based on coordinate attention to enhance the predicted effect, whereas the multi-scale module integrates useful low- and high-level contextual features with higher resolution. Moreover, we developed a feature fusion module to combine the heterogeneous features to generate high-quality depth outputs. We also designed a hybrid loss function that measures prediction errors from the perspective of depth and scale-invariant gradients, which contribute to preserving rich details. We conducted the experiments on public RGBD datasets, and the evaluation results show that the proposed scheme can considerably enhance the accuracy of depth prediction, achieving 0.051 for log10 and 0.992 for δ<1.253 on the NYUv2 dataset.

Affine Local Descriptors for Viewpoint Invariant Face Recognition

  • Gao, Yongbin;Lee, Hyo Jong
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.781-784
    • /
    • 2014
  • Face recognition under controlled settings, such as limited viewpoint and illumination change, can achieve good performance nowadays. However, real world application for face recognition is still challenging. In this paper, we use Affine SIFT to detect affine invariant local descriptors for face recognition under large viewpoint change. Affine SIFT is an extension of SIFT algorithm. SIFT algorithm is scale and rotation invariant, which is powerful for small viewpoint changes in face recognition, but it fails when large viewpoint change exists. In our scheme, Affine SIFT is used for both gallery face and probe face, which generates a series of different viewpoints using affine transformation. Therefore, Affine SIFT allows viewpoint difference between gallery face and probe face. Experiment results show our framework achieves better recognition accuracy than SIFT algorithm on FERET database.

SIFT를 이용한 내시경 영상에서의 특징점 추출 (Feature Extraction for Endoscopic Image by using the Scale Invariant Feature Transform(SIFT))

  • 오장석;김호철;김형률;구자민;김민기
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.6-8
    • /
    • 2005
  • Study that uses geometrical information in computer vision is lively. Problem that should be preceded is matching problem before studying. Feature point should be extracted for well matching. There are a lot of methods that extract feature point from former days are studied. Because problem does not exist algorithm that is applied for all images, it is a hot water. Specially, it is not easy to find feature point in endoscope image. The big problem can not decide easily a point that is predicted feature point as can know even if see endoscope image as eyes. Also, accuracy of matching problem can be decided after number of feature points is enough and also distributed on whole image. In this paper studied algorithm that can apply to endoscope image. SIFT method displayed excellent performance when compared with alternative way (Affine invariant point detector etc.) in general image but SIFT parameter that used in general image can't apply to endoscope image. The gual of this paper is abstraction of feature point on endoscope image that controlled by contrast threshold and curvature threshold among the parameters for applying SIFT method on endoscope image. Studied about method that feature points can have good distribution and control number of feature point than traditional alternative way by controlling the parameters on experiment result.

  • PDF

멀티 프레임 기반 건물 인식에 필요한 특징점 분류 (Classification of Feature Points Required for Multi-Frame Based Building Recognition)

  • 박시영;안하은;이규철;유지상
    • 한국통신학회논문지
    • /
    • 제41권3호
    • /
    • pp.317-327
    • /
    • 2016
  • 영상에서 의미 있는 특징점(feature point)의 추출은 제안하는 기법의 성능과 직결되는 문제이다. 특히 나무나 사람 등에서의 가려짐 영역(occlusion region), 하늘과 산 등 객체가 아닌 배경에서 추출되는 특징점들은 의미없는 특징점으로 분류되어 정합과 인식 기법의 성능을 저하시키는 원인이 된다. 본 논문에서는 한 장 이상의 멀티 프레임을 이용하여 건물 인식에 필요한 특징점을 분류하여 인식과 정합단계에서 기존의 일반적인 건물 인식 기법의 성능을 향상시키기 위한 새로운 기법을 제안한다. 먼저 SIFT(scale invariant feature transform)를 통해 일차적으로 특징점을 추출한 후 잘못 정합 된 특징점은 제거한다. 가려짐 영역에서의 특징점 분류를 위해서는 RANSAC(random sample consensus)을 적용한다. 분류된 특징점들은 정합 기법을 통해 구하였기 때문에 하나의 특징점은 여러 개의 디스크립터가 존재하고 따라서 이를 통합하는 과정도 제안한다. 실험을 통해 제안하는 기법의 성능이 우수하다는 것을 보였다.

크기 및 회전 불변 영역 특징을 이용한 이미지 유사성 검색 (Image Similarity Retrieval using an Scale and Rotation Invariant Region Feature)

  • 유승훈;김현수;이석룡;임명관;김덕환
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.446-454
    • /
    • 2009
  • 다양한 영역 검출 및 형태 특징 추출 방법 중에서 MSER과 SIFT를 응용한 방법들이 컴퓨터비전 분야에 많이 사용된다. 하지만 기존의 SIFT를 이용한 특징 추출 방법은 자기 변화에 민감한 특성을 지니며, MSER 방법은 이미지의 크기 변화에 민감하고, 이미지 유사성 검색에 그대로 적용하기에는 어려움이 많다. 본 논문에서는 스케일 피라미드, MSER 그리고 어파인(affine) 정규화 과정 등을 이용한 영역 특징 서술자를 제안한다. 제안한 방법은 어파인 정규화 방법과 스케일 피라미드를 사용하기 때문에 이미지의 크기, 회전 및 자기 변화에 불변하다. 다양한 이미지들을 이용하여 실험하고, 실험 결과에서 제안한 방법이 SIFT, PCA-SIFT, CE-SIFT 그리고 SURF 방법에 비해서 각각 20%, 38%, 11%, 24% 이상 좋은 이미지 검색 성능을 보이고 있다.

Fuzzy Mean Method with Bispectral Features for Robust 2D Shape Classification

  • Woo, Young-Woon;Han, Soo-Whan
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 추계학술대회-지능형 정보기술과 미래조직 Information Technology and Future Organization
    • /
    • pp.313-320
    • /
    • 1999
  • In this paper, a translation, rotation and scale invariant system for the classification of closed 2D images using the bispectrum of a contour sequence and the weighted fuzzy mean method is derived and compared with the classification process using one of the competitive neural algorithm, called a LVQ(Learning Vector Quantization). The bispectrun based on third order cumulants is applied to the contour sequences of the images to extract fifteen feature vectors for each planar image. These bispectral feature vectors, which are invariant to shape translation, rotation and scale transformation, can be used to represent two-dimensional planar images and are fed into an classifier using weighted fuzzy mean method. The experimental processes with eight different shapes of aircraft images are presented to illustrate the high performance of the proposed classifier.

  • PDF

Hopfield 신경회로망을 이용한 모델 기반형 3차원 물체 인식 (Model-based 3-D object recognition using hopfield neural network)

  • 정우상;송호근;김태은;최종수
    • 전자공학회논문지B
    • /
    • 제33B권5호
    • /
    • pp.60-72
    • /
    • 1996
  • In this paper, a enw model-base three-dimensional (3-D) object recognition mehtod using hopfield network is proposed. To minimize deformation of feature values on 3-D rotation, we select 3-D shape features and 3-D relational features which have rotational invariant characteristics. Then these feature values are normalized to have scale invariant characteristics, also. The input features are matched with model features by optimization process of hopjfield network in the form of two dimensional arrayed neurons. Experimental results on object classification and object matching with the 3-D rotated, scale changed, an dpartial oculued objects show good performance of proposed method.

  • PDF

임의의 외란에 대한 영상 안정화 (Image Stabilization Scheme for Arbitrary Disturbance)

  • 곽휘권
    • 한국산학기술학회논문지
    • /
    • 제15권9호
    • /
    • pp.5750-5757
    • /
    • 2014
  • 본 논문은 의도하지 않게 카메라에 입력되는 회전, 병진 움직임뿐만 아니라 확대 축소에 의한 움직임을 SIFT 기법을 이용하여 추정하고 제거하는 영상 안정화 기법을 제시한다. 또한 영상 분할 및 통합 방법을 이용하여 움직이는 물체가 영상에 입력되었을 경우에도 이러한 외란을 제거하고 영상 안정화를 수행하도록 한다. 제시된 방법은 다른 방법과 결과를 비교하는 실험을 수행하여 성능이 우수함을 검증한다.

차량 헤드라이트 특징과 동질성 정보를 이용한 차종 인식 (A Vehicle Model Recognition using Car's Headlights Features and Homogeneity Information)

  • 김민호;최두현
    • 한국멀티미디어학회논문지
    • /
    • 제14권10호
    • /
    • pp.1243-1251
    • /
    • 2011
  • 본 논문에서는 차량의 헤드라이트 영상에 Scale Invariant Feature Transform(SIFT) 알고리즘을 적용하여 획득한 특징점을 이용하여 차량의 모델을 인식하는 차종 인식 방법을 제안한다. 보다 정확도 높은 차종 인식을 구현하기 위해서 특징점들의 분포로부터 동질성(homogeneity)을 계산하여 인식 정확성의 척도로 두었다. 제안한 방법의 성능을 평가하기 위해 국내 54종의 차량 영상으로부터 촬영된 400장의 실험 영상을 이용해 실험한 결과, 제안한 방법은 90%의 인식률과 16.45의 평균 동질성을 보였다.

Robust 2-D Object Recognition Using Bispectrum and LVQ Neural Classifier

  • HanSoowhan;woon, Woo-Young
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 추계학술대회 학술발표 논문집
    • /
    • pp.255-262
    • /
    • 1998
  • This paper presents a translation, rotation and scale invariant methodology for the recognition of closed planar shape images using the bispectrum of a contour sequence and the learning vector quantization(LVQ) neural classifier. The contour sequences obtained from the closed planar images represent the Euclidean distance between the centroid and all boundary pixels of the shape, and are related to the overall shape of the images. The higher order spectra based on third order cumulants is applied to tihs contour sample to extract fifteen bispectral feature vectors for each planar image. There feature vector, which are invariant to shape translation, rotation and scale transformation, can be used to represent two0dimensional planar images and are fed into a neural network classifier. The LVQ architecture is chosen as a neural classifier because the network is easy and fast to train, the structure is relatively simple. The experimental recognition processes with eight different hapes of aircraft images are presented to illustrate the high performance of this proposed method even the target images are significantly corrupted by noise.

  • PDF