• Title/Summary/Keyword: 영상 간 변환

Search Result 842, Processing Time 0.028 seconds

Image Reprojection Using GPU (GPU를 이용한 영상 재투영)

  • Kim, Hyo-Won;Ki, Hyun-Woo;Lee, Ho-Hyun;Oh, Kyoung-Su
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02c
    • /
    • pp.170-175
    • /
    • 2007
  • 영상 재투영이란, 깊이 맵을 투영하여 임의의 시점에서 본 이미지를 생성해내는 기법을 말한다. 기존의 CPU를 이용한 영상 재투영 기법들의 가장 큰 단점은 CPU와 GPU 간의 데이터 복사가 일어나고 재투영 연산 자체의 속도가 느리기 때문에 실시간 렌더링이 불가능 하다는 것이다. 따라서 본 논문에서는 GPU를 이용하여 영상 재투영을 구현하고 실시간에 이미지를 렌더링하는 기법을 소개한다. 우리의 기법은 입력으로 참조 이미지와 해당 이미지의 깊이 맵이 주어졌을 때, 임의의 시점에서 보이는 새로운 이미지를 실시간으로 생성한다. 임의의 시점에서 이미지를 생성하기 위해, 각 픽셀에서 참조 이미지에 해당하는 평면을 렌더링하여 시점 반대 방향의 광선을 생성한다. 이 광선을 참조 이미지의 투영 공간으로 변환한 후, 광선과 깊이 맵간의 교차점을 찾는다. 이렇게 찾아낸 깊이 맵의 교차점과 일치하는 참조 이미지의 픽셀 색으로 새로운 시점의 이미지를 만들어 낼 수 있다. 이와 같은 기법은 기하 정보의 복잡도와 관계없이 수십 프레임의 속도로 실시간 렌더링이 가능하다.

  • PDF

A Study Efficient Vanishing Point Detection Method using an Hough Transform (허프변환을 이용한 효율적인 소실점 검출방법에 대한 연구)

  • Jung, Su-Min;Kim, Jae-Seoung;Whang-Bo, Taek-Guaen
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.367-370
    • /
    • 2013
  • 단일 영상에서 3차원 정보를 획득하기 위해 가장 많이 사용되는 단서로는 소실점이 있다. 본 논문에서는 소실점을 추정하기 위해서 허프변환을 사용하여, 단일 영상의 소실점 탐색 시 유효 직선간의 기울기 값 비교 및 근접도를 구하여 교점 생성에 필요 없는 정보를 제거함으로서 소실점 추정 정확도를 높인 보다 정확한 소실점 탐색 기법을 제안하였다.

Conversion Method of 3D Point Cloud to Depth Image and Its Hardware Implementation (3차원 점군데이터의 깊이 영상 변환 방법 및 하드웨어 구현)

  • Jang, Kyounghoon;Jo, Gippeum;Kim, Geun-Jun;Kang, Bongsoon
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.18 no.10
    • /
    • pp.2443-2450
    • /
    • 2014
  • In the motion recognition system using depth image, the depth image is converted to the real world formed 3D point cloud data for efficient algorithm apply. And then, output depth image is converted by the projective world after algorithm apply. However, when coordinate conversion, rounding error and data loss by applied algorithm are occurred. In this paper, when convert 3D point cloud data to depth image, we proposed efficient conversion method and its hardware implementation without rounding error and data loss according image size change. The proposed system make progress using the OpenCV and the window program, and we test a system using the Kinect in real time. In addition, designed using Verilog-HDL and verified through the Zynq-7000 FPGA Board of Xilinx.

Rotated Face Detection Using Polar Coordinate Transform and AdaBoost (극좌표계 변환과 AdaBoost를 이용한 회전 얼굴 검출)

  • Jang, Kyung-Shik
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.25 no.7
    • /
    • pp.896-902
    • /
    • 2021
  • Rotated face detection is required in many applications but still remains as a challenging task, due to the large variations of face appearances. In this paper, a polar coordinate transform that is not affected by rotation is proposed. In addition, a method for effectively detecting rotated faces using the transformed image has been proposed. The proposed polar coordinate transform maintains spatial information between facial components such as eyes, mouth, etc., since the positions of facial components are always maintained regardless of rotation angle, thereby eliminating rotation effects. Polar coordinate transformed images are trained using AdaBoost, which is used for frontal face detection, and rotated faces are detected. We validate the detected faces using LBP that trained the non-face images. Experiments on 3600 face images obtained by rotating images in the BioID database show a rotating face detection rate of 96.17%. Furthermore, we accurately detected rotated faces in images with a background containing multiple rotated faces.

MPEG-2 to MPEG-4 Transcoders in The Spatial Domain and The DCT Domain (공간 영역과 DCT 영역에서 MPEG-2로부터 MPEG-4 로 변환하는 압축기의 구현)

  • 염인선;박현욱
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.41 no.5
    • /
    • pp.117-124
    • /
    • 2004
  • Various multimedia systems have been developed and their application areas widely proliferate. Thus, the interoperability is getting important among various networks and devices. The video transcoding is a technology to solve this interoperability problem among various coding standards. Transcoding can be defined as the conversion of one compressed coded data to another. In this paper, MPEG-2 to MPEG-4 transcoder in the spatial domain is compared with that in the DCT domain. The transcoder is very useful when a video sequence that is originally encoded for digital TV, DVD or satellite broadcasting is served in mobile environment. In order to compare two transcoders, all modules except motion compensation and down sampling are implemented identically. In addition, both transcoders do not search for motion vector. Instead, the decoded information is reused to the encoder. The experimental results show that the transcoder in the spatial domain is usually better than that in the DCT domain with respect to PSNR (Peak Signal-to-Noise Ratio), bitrate and execution time.

A 3d Viewing System for Real-time 3d Display General Monitors (범용 모니터에서 실시간 3d 디스플레이가 가능한 입체 뷰잉 시스템 개발)

  • Lee, Sang-Yong;Chin, Seong-Ah
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.49 no.2
    • /
    • pp.13-19
    • /
    • 2012
  • The techniques of 3d image processing have broadly used in the areas including movies, games, performances, exhibitions. In addition, increasing demands for practical uses have gradually extended to the areas of architecture, medicine, nuclear power plant. However, dominant techniques for 3d image processing seem to depend on multi-camera in which two stereo images are merged into one image. Also the pipeline has limitations to provide real-time 3d viewer in ubiquitous computing. It is not able to be applicable onto most general screens as well. In addition, the techniques can be utilized for the real-time 3d game play without a particular monitor or convertor. Hence, the research presented here is to aim at developing an efficient real-time 3d viewer using only mono camera which do not need post processing for editing as well.

Non-liner brain image registration based on moment and free-form deformation (모멘트 및 free-form 변형기반 비선형 뇌영상 정합)

  • 김민정;최유주;김명희
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.271-274
    • /
    • 2004
  • 영상정합을 통한 의료영상 분석방법들 중 동일환자에 대한 선형적 다중모달리티 정합이 널리 이용되고 있다. 그러나 실제적으로 여러 종류의 환자영상 취득이 어렵거나 해부학적 영상정보가 손실되는 경우가 적지 않다 본 논문에서는 표준 형상을 가지는 정상인 해부학적 뇌영상에 대한 환자 기능적 뇌영상의 정합방법을 제안한다. 먼저 두 영상간 모멘트 정보 매칭 및 초기선형 변환을 수행하고, 3차원 B zier 함수 기반 free-form 변형기법을 이용한 비선형 정합을 수행하여 정합 영상간 형상 차이를 최소화한다 제안방법은 환자 기능영상의 해부학적 분석 뿐 아니라 시술전-시술중 영상정합을 통한 영상유도시술에도 확장 적용될 수 있다.

  • PDF

A Study on 2D/3D image Conversion Method using Optical flow of Level Simplified and Noise Reduction (Optical flow의 레벨 간소화와 잡음제거를 이용한 2D/3D 변환기법 연구)

  • Han, Hyeon-Ho;Lee, Gang-Seong;Eun, Jong-Won;Kim, Jin-Soo;Lee, Sang-Hun
    • Proceedings of the KAIS Fall Conference
    • /
    • 2011.12b
    • /
    • pp.441-444
    • /
    • 2011
  • 본 논문은 2D/3D 영상 처리에서 깊이지도 생성을 위한 Optical flow에서 레벨을 간소화하여 연산량을 감소시키고 객체의 고유벡터를 이용하여 영상의 잡음을 제거하는 연구이다. Optical flow는 움직임추정 알고리즘의 하나로 두 프레임간의 픽셀의 변화 벡터 값을 나타내며 블록 매칭과 같은 알고리즘에 비해 정확도가 높다. 그러나 기존의 Optical flow는 긴 연산 시간과 카메라의 이동이나 조명의 변화에 민감한 문제가 있다. 이를 해결하기 위해 연산 시간의 단축을 위한 레벨 간소화 과정을 거치고 영상에서 고유벡터를 갖는 영역에 한해 Optical flow를 적용하여 잡음을 제거하는 방법을 제안하였다. 제안한 방법으로 2차원 영상을 3차원 입체 영상으로 변환하였고 SSIM(Structural SIMilarity Index)으로 최종 생성된 영상의 오차율을 분석하였다.

  • PDF

Nonlinear Optimization Method for Multiple Image Registration (다수의 영상 특징점 정합을 위한 비선형 최적화 기법)

  • Ahn, Yang-Keun;Hong, Ji-Man
    • Journal of Broadcast Engineering
    • /
    • v.17 no.4
    • /
    • pp.634-639
    • /
    • 2012
  • In this paper, we propose nonlinear optimization method for feature matching from multiple view image. Typical solution of feature matching is by solving linear equation. However this solution has large error due to nonlinearity of image formation model. If typical nonlinear optimization method is used, complexity grows exponentially over the number of features. To make complexity lower, we use sparse Levenberg-Marquardt nonlinear optimization for matching of features over multiple view image.

Optical Image Encryption Based on Characteristics of Square Law Detector (세기검출기를 이용한 광 영상 암호화)

  • Lee, Eung-Dae;Park, Se-Jun;Lee, Ha-Un;Kim, Su-Jung
    • Journal of the Institute of Electronics Engineers of Korea SD
    • /
    • v.39 no.3
    • /
    • pp.34-40
    • /
    • 2002
  • In this paper, a new encryption method for a binary image using Phase modulation and Fourier transform is proposed. For decryption we use the characteristics of square law detector. In encryption process, a key image is obtained by phase modulation of 256 level random pattern and its Fourier transformation, and input image is encrypted by Fourier transforming the multiplication of the phase modulated random pattern and phase modulated input image. The encrypted image and key image have only phase information, so they can not be copied or counterfeited and the original image can not be decrypted without the key image. To reconstruct the original image, each phase mask of the key image and the encrypted image must be placed on each path of the Mach-Zehnder interferometry with Fourier transform lens and the output image is obtained in the form of intensity in the CCD(Charge Coupled Device) camera. The real-time decryption is possible in the proposed system by use of a LCD as a phase modulator and a CCD camera as an intensity detector. The proposed method shows a good performance in the computer simulation and optical experiment as an encryption scheme.