• 제목/요약/키워드: Image Translation

검색결과 318건 처리시간 0.028초

단안영상에서 움직임 벡터를 이용한 영역의 깊이추정 (A Region Depth Estimation Algorithm using Motion Vector from Monocular Video Sequence)

  • 손정만;박영민;윤영우
    • 융합신호처리학회논문지
    • /
    • 제5권2호
    • /
    • pp.96-105
    • /
    • 2004
  • 2차원 이미지로부터 3차원 이미지 복원은 각 픽셀까지의 깊이 정보가 필요하고, 3차원 모델의 복원에 관한 일반적인 수작업은 많은 시간과 비용이 소모된다. 본 논문의 목표는 카메라가 이동하는 중에, 획득된 단안 영상에서 영역의 상대적인 깊이 정보를 추출하는 것이다. 카메라 이동에 의한 영상의 모든 점들의 움직임은 깊이 정보에 종속적이라는 사실에 기반을 두고 있다. 전역 탐색 기법을 사용하여 획득한 움직임 벡터에서 카메라 회전과 배율에 관해서 보상을 한다. 움직임 벡터를 분석하여 평균 깊이를 측정하고, 평균 깊이에 대한 각 영역의 상대적 깊이를 구하였다. 실험결과 영역의 상대적인 깊이는 인간이 인식하는 상대적인 깊이와 일치한다는 것을 보였다.

  • PDF

3차 칼라 객체 관계에 의한 내용 기반 영상 검색 (Content-Based Image Retrieval using Third Order Color Object Relation)

  • 권희용;최재우;이인행;조동섭;황희융
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.62-73
    • /
    • 2000
  • 본 논문에서는 기존의 칼라 특성을 이용한 내용 기반 영상 검색 방법을 적용 영역별로 분류 할 수 있는 기준을 제시하고, 그 기준에 의해 영상 내 공간 정보를 충분하게 표현할 수 있어 이동 및 회전 확대/축소 변형에 강한 영상 검색 방법을 제안한다. 일반적으로 칼라 특성을 이용한 내용 기반 영상 검색은 영상 내 공간정보를 충분하게 표현하지 못하여 이동 및 회전, 확대/축소 변형에 약한 단점을 지니고 있다. 이에 기존 연구에서는 인위적으로 영상을 여러 개로 분할하는 방법 등으로 공간 정보를 표현하고자 하였지만 특징 벡터의 수가 급격히 늘어남에 따라 검색 효율이 저하된다는 단점을 가지고있다. 본 논문에서는 기존의 방법을 사용된 칼라 객체의 상호 관계에 따라 1차와 2차 관계에 의한 방법으로 분류하고, 이동, 회전 특히 크기 변화(축소,확대)에 탁월한 성능을 보이는 칼라 객체의 3차 관계를 이용한 방법을 제안한다. 제안된 방법은 주어진 영상으로부터 양자화된 24개의 버킷을 생성해서 각 버킷의 히스토그램의 크기 순서로 세 개 버킷을 선정하고 그들의 평균 칼라 위치를 계산해서 그들 간의 상호 각도를 추출하여 영상의 특징 벡터로 사용하였다. 실험 결과 기존 방법보다 특히 영상의 크기 변화에 대해 좋은 결과를 얻을수 있었으며, 계산량도 적어 효율적임을 보여 주었다.

  • PDF

Affine-Invariant Image normalization for Log-Polar Images using Momentums

  • Son, Young-Ho;You, Bum-Jae;Oh, Sang-Rok;Park, Gwi-Tae
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.1140-1145
    • /
    • 2003
  • Image normalization is one of the important areas in pattern recognition. Also, log-polar images are useful in the sense that their image data size is reduced dramatically comparing with conventional images and it is possible to develop faster pattern recognition algorithms. Especially, the log-polar image is very similar with the structure of human eyes. However, there are almost no researches on pattern recognition using the log-polar images while a number of researches on visual tracking have been executed. We propose an image normalization technique of log-polar images using momentums applicable for affine-invariant pattern recognition. We handle basic distortions of an image including translation, rotation, scaling, and skew of a log-polar image. The algorithm is experimented in a PC-based real-time vision system successfully.

  • PDF

변형된 라돈 변환을 이용한 기하학적 형태 불변 보행인식 (Geometric Transform-Invariant Gait Recognition Using Modified Radon Transform)

  • 장상식;이승원;백준기
    • 대한전자공학회논문지SP
    • /
    • 제48권4호
    • /
    • pp.67-75
    • /
    • 2011
  • 본 논문에서는 라돈 변환(Radon transform)을 변형한 R-변환(R-transform)을 이용하여 객체의 크기 변환과 회전에 불변하는 보행 인식 방법을 제안한다. R-변환은 라돈 변환의 결과를 제곱한 후 투영선에 대해 적분한 것으로서, 평행이동에 불변하고 크기 변환은 변환계수의 진폭과 비례하고, 회전의 경우는 변환계수가 평행으로 이동하는 성질을 갖기 때문에 임의의 위치에서 교정되지 않은 카메라를 이용해서 객체 정보를 추출하는 데 효과적이다. 추출된 정보는 상관도(Correlation)를 이용하여 신원을 파악한다. 제안된 방법은 기하학적 변환에 강인하기 때문에 보행인식 단계에서 기하학적인 정렬 과정이 필요 없고, 객체와 카메라의 거리에 무관하게 인식이 가능하며, 카메라의 비정상적인 회전이 발생한 경우에도 강인한 인식이 가능하다.

영상등록을 위한 Mutual Information 기반의 원형 템플릿 정합 (Mutual Information-based Circular Template Matching for Image Registration)

  • 예철수
    • 대한원격탐사학회지
    • /
    • 제30권5호
    • /
    • pp.547-557
    • /
    • 2014
  • 본 논문에서는 영상 등록을 위한 유사도 계산에 사용되는 원형 템플릿의 설계 방법을 제안한다. 원형 템플릿은 영상의 이동 및 회전 변환에 불변한 성질을 가지고 있어 기준 영상 및 관측 영상 사이에 이동 및 회전 변환이 존재하더라도 영상 등록 제어점을 정확하게 정합하는 장점이 있다. 기준 영상의 제어점을 중심으로 일정한 거리 이내에 다수의 원주를 구성하고 각 원주 위에 일정한 간격으로 위치하는 화소들로 이루어지는 원형 템플릿을 생성하고 이를 이차원 이산 극좌표 행렬(Discrete Polar Coordinate Matrix, DPCM)으로 구성한다. 관측 영상에서도 동일한 형태의 원형 템플릿을 생성하고 탐색 범위 내의 각 위치에서 관측 영상의 원형 템플릿을 0도에서 360도 범위 내에서 일정 각도 간격으로 회전시키면서 극좌표 행렬을 생성하고 기준 영상의 극좌표 행렬과의 유사도를 Mutual Information을 이용해서 계산한다. 탐색 범위 내의 각 위치와 회전 각도에 대한 Mutual Information이 최대가 되는 화소를 정합쌍으로 결정한다. 제안한 알고리즘은 서로 다른 두 시기에 촬영한 KOMPSAT-2 영상에 적용하여 영상의 회전 변화 조건하에서 우수한 정합 성능을 보임을 확인하였다.

개선된 chain code와 HMM을 이용한 내용기반 영상검색 (Content-based Image Retrieval using an Improved Chain Code and Hidden Markov Model)

  • 조완현;이승희;박순영;박종현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.375-378
    • /
    • 2000
  • In this paper, we propose a novo] content-based image retrieval system using both Hidden Markov Model(HMM) and an improved chain code. The Gaussian Mixture Model(GMM) is applied to statistically model a color information of the image, and Deterministic Annealing EM(DAEM) algorithm is employed to estimate the parameters of GMM. This result is used to segment the given image. We use an improved chain code, which is invariant to rotation, translation and scale, to extract the feature vectors of the shape for each image in the database. These are stored together in the database with each HMM whose parameters (A, B, $\pi$) are estimated by Baum-Welch algorithm. With respect to feature vector obtained in the same way from the query image, a occurring probability of each image is computed by using the forward algorithm of HMM. We use these probabilities for the image retrieval and present the highest similarity images based on these probabilities.

  • PDF

JPEG2000기반 검색 알고리즘 개발 (Development to Image Search Algorithm for JPEG2000)

  • 조재훈;김영섭
    • 반도체디스플레이기술학회지
    • /
    • 제6권2호
    • /
    • pp.53-57
    • /
    • 2007
  • In this paper, a new content-based color image retrieval method is proposed, in which both the color content and the spatial relationship of image have been taken into account. In order to represent the spatial distribution information of image, a disorder matrix, which has the invariance to the rotation and translation of the image content, has been designed. This is based on multi-resolution color-spatial information. We present our algorithm in the following section, and then verified the search results with comparison to other methods, such as color histogram, wavelet histogram, correlogram and wavelet correlogram. Experimental results with various types of images show that the proposed method not only achieves a high image retrieval performance but also improve the retrieval precision.

  • PDF

X-색도 공간에서 ROI의 전방향 프로젝션과 백색패치의 평행이동에 의한 본질 영상 획득 (Acquisition of Intrinsic Image by Omnidirectional Projection of ROI and Translation of White Patch on the X-chromaticity Space)

  • 김달현;황동국;이우람;전병민
    • 정보처리학회논문지B
    • /
    • 제18B권2호
    • /
    • pp.51-56
    • /
    • 2011
  • 흑체의 온도 변화에 대한 영상의 색차를 줄이는 본질 영상은 단일 불변 방향을 검출하고 백색 장면 조명체를 기반으로 하기 때문에 실영상에 존재하는 다수의 불변 방향과 유색 장면 조명체에 취약하다. 이러한 문제를 해결하기 위해 본 논문에서는 ${\chi}$-색도 공간에서 ROI의 전방향프로젝션과 백색패치의 평행이동을 통해 불변 방향을 검출하는 본질 영상 획득 기법을 제안한다. 3차원 RGB 공간 분석의 어려움으로 인하여, 본 논문 또한 밝기가 고려되지 않은 ${\chi}$-색도 공간을 사용한다. 이 공간에서 유색 조명체의 효과는 백색패치의 평행이동을 통해 감소시키고, 색차에 따라 가상의 선분으로 나타나는 불변 방향은 ROI의 전방향 프로젝션을 통해 검출한다. 다수의 불변 방향을 고려하여 ROI 선택은 3D 히스토그램에서 빈도수에 의해 결정한다. 검출 후, 본질 영상은 불변 방향의 직교 방향으로의 프로젝션과 RGB영상으로의 역변환 과정을 통해 획득된다. 실험에서 Ebner가 제안한 데이터집합을 실험 영상으로 이용하였고, 불변 방향의 표준편차와 색항등성 측도를 평가 측도로 사용하였다. 제안한 기법의 실험 결과는 엔트로피 기법보다 불변 방향의 표준 편차가 낮았으며, 기존의 기법에 비해 색항등성이 2배 이상 높았다.

임의의 외란에 대한 영상 안정화 (Image Stabilization Scheme for Arbitrary Disturbance)

  • 곽휘권
    • 한국산학기술학회논문지
    • /
    • 제15권9호
    • /
    • pp.5750-5757
    • /
    • 2014
  • 본 논문은 의도하지 않게 카메라에 입력되는 회전, 병진 움직임뿐만 아니라 확대 축소에 의한 움직임을 SIFT 기법을 이용하여 추정하고 제거하는 영상 안정화 기법을 제시한다. 또한 영상 분할 및 통합 방법을 이용하여 움직이는 물체가 영상에 입력되었을 경우에도 이러한 외란을 제거하고 영상 안정화를 수행하도록 한다. 제시된 방법은 다른 방법과 결과를 비교하는 실험을 수행하여 성능이 우수함을 검증한다.

Eyeglass Remover Network based on a Synthetic Image Dataset

  • Kang, Shinjin;Hahn, Teasung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권4호
    • /
    • pp.1486-1501
    • /
    • 2021
  • The removal of accessories from the face is one of the essential pre-processing stages in the field of face recognition. However, despite its importance, a robust solution has not yet been provided. This paper proposes a network and dataset construction methodology to remove only the glasses from facial images effectively. To obtain an image with the glasses removed from an image with glasses by the supervised learning method, a network that converts them and a set of paired data for training is required. To this end, we created a large number of synthetic images of glasses being worn using facial attribute transformation networks. We adopted the conditional GAN (cGAN) frameworks for training. The trained network converts the in-the-wild face image with glasses into an image without glasses and operates stably even in situations wherein the faces are of diverse races and ages and having different styles of glasses.