• Title/Summary/Keyword: 3D motion estimation

Search Result 220, Processing Time 0.03 seconds

단안 영상 시퀸스에서 움직임 추정 기반의 3차원 깊이 정보 추출 알고리즘 (3D Depth Information Extraction Algorithm Based on Motion Estimation in Monocular Video Sequence)

  • 박준호;전대성;윤영우
    • 정보처리학회논문지B
    • /
    • 제8B권5호
    • /
    • pp.549-556
    • /
    • 2001
  • 2차원 영상으로 부터 3차원 영상으로 복원하는 일은 일반적으로 카메라의 초점에서 영상 프레임의 각 픽셀까지의 깊이 정보가 필요하고, 3차원 모델의 복원에 관한 일반적인 수작업은 많은 식나과 비용이 소모된다. 본 논문에서는 카메라의 움직임이 포함되어 있는 단안 영상 시퀸스로부터 3차원 영상 제작에 필요한 상대적인 깊이 정보를 실시간으로 추출하는 알고리즘을 제안하고, 하드웨어를 구현하기 위한여 알고리즘을 단순화하였다. 이 알고리즘은 카메라 이동에 의한 영상의 모든 점들의 움직임은 깊이 정보의 종속적이라는 사실에 기반을 두고 있다. 불록매칭 알고리즘에 기반을 둔 전역 움직임 탐색에 의한 움직임 벡터를 추출한 후, 카메라 회전과 확대/축소에 관한 카메라 움직임 보상을 실행하고 깉이 정보 추출 과정이 전개된다. 깊이 정보 추출 과정은 단안 영상에서 객체의 이동처리를 분석하여 움직임 벡터를 구하고 프레임내의 모든 픽셀에 대한 평균 깊이를 계산한 후, 평균 깊이에 대한 각 블록의 상대적 깊이를 산출하였다. 모의 실험 결과 전경과 배경에 속하는 영역의 깊이는 인간 시각 체계가 인식하는 상대적인 깊이와 일치한다는 것을 보였다.

  • PDF

MPEG-4에서 H.264로 트랜스코딩 (MPEG-4 to H.264 Transcoding)

  • 이성선;이영렬
    • 대한전자공학회논문지SP
    • /
    • 제41권5호
    • /
    • pp.275-282
    • /
    • 2004
  • 본 논문에서는 30 Hz 프레임 율의 MPEG-4 simple profile 비디오 비트스트림을 15 Hz 프레임 율을 갖는 H.264 baseline profile 비디오 비트스트림으로 변환하는 트랜스코딩을 제안한다. MPEG긱의 블록 모드(block mode)와 움직임 벡터(Motion Vector) 정보를 H.264에서 이용 가능하도록 블록 모드 변환을 수행하고, MPEG-4의 움직임 벡터 보간을 이용하여 H.264에서 움직임 예측(Motion Estimation) 없이 정수 화소 단위로 움직임 벡터를 찾는 3가지 움직임 벡터 보간 (Motion Vector Interpolation) 방법을 실험한다. 이와 같은 방법을 이용해서 움직임 예측 시 소요되는 계산량을 줄이고 낮은 대역폭에서 심각한 화질 열화가 없는 트랜스코더를 제안한다. 실험 결과 제안된 방법은 직렬 화소영역 트랜스코딩에 비해 신호 대 잡음비(PSNR: peak signal to noise ratio)는 실험 영상에 따라 높은 비트율에서는 0.2dB에서 낮은 비트율에서 0.9dB의 손실이 있으나 전체 수행 시간은 3.2배에서 4배 빨라진다.

복원된 3차원 점들로부터 3차원 객체 모양 구성 (Construction of 3D shapes of objects from reconstructed 3D points)

  • ;김종남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.822-824
    • /
    • 2018
  • Estimation of 3-D objects from 2-D images is inherently performed by either motion or scene features methods as it has been described in different literatures. Structure from motion as a method employed in this study uses calibrated camera and reconstructed 3-D points from the structure of the scene for reliable and precise estimates. In this study we construct 3-D shapes using color pixels and reconstructed 3-D points to determine observable differences for the constructed 3-D images. The estimation using reconstructed 3-D points indicates that the sphere is recovered by the use of scale factor due to its known size while the one obtained by using color pixels has look similar to the former but different in the scales of the axes.

새로운 공간경사를 사용한 시공간 경사법에 의한 운동경계 검출 및 이동벡터 추정 (Motion Boundary Detection and Motion Vector Estimation by spatio-temporal Gradient Method using a New Spatial Gradient)

  • 김이한;김성대
    • 전자공학회논문지B
    • /
    • 제30B권2호
    • /
    • pp.59-68
    • /
    • 1993
  • The motion vector estimation and motion boundary detection have been briskly studied since they are an important clue for analysis of object structure and 3-d motion. The purpose of this researches is more exact estimation, but there are two main causes to make inaccurate. The one is the erroneous measurement of gradients in brightness values and the other is the blurring of motion boundries which is caused by the smoothness constraint. In this paper, we analyze the gradient measurement error of conventional methods and propose new technique based on it. When the proposed method is applied to the motion boundary detection in Schunck and motion vector estimation in Horn & Schunck, it is shown to have much better performance than conventional method is some artificial and real image sequences.

  • PDF

초고화질 영상처리를 위한 HEVC 표준에 적합한 고속 및 저복잡도 움직임 예측기에 대한 연구 (A Fast and Low-complexity Motion Estimation for UHD HEVC)

  • 김성오;박찬식;전형주;김재문
    • 방송공학회논문지
    • /
    • 제18권6호
    • /
    • pp.808-815
    • /
    • 2013
  • 본 논문은 초고화질 영상처리를 위한 HEVC 표준에 적합한 고속 및 저복잡도 움직임 예측기 알고리즘을 제안하였다. 움직임 예측기는 HEVC 내의 연산양의 77~81%를 차지하고 있다. 결국 비디오 코덱 구현의 핵심은 이러한 움직임 예측기의 고속 및 저복잡도 알고리즘을 찾는 것이다. 본 논문에서는 기존의 움직임 예측기 알고리즘을 분석하였고 일반적인 움직임 탐색 점을 줄이는 방식이 아닌 움직임 벡터 예측과 선택적으로 움직임 탐색 점 개수를 조정하는 등의 HEVC 표준에 적합한 3가지 방식을 제안하였다. 이 제안된 알고리즘은 full search 알고리즘에 비교하여 0.36%의 연산양만을 사용하면서도 그 성능 열화는 1.1%에 불과하였다.

Stereo Vision Based 3-D Motion Tracking for Human Animation

  • Han, Seung-Il;Kang, Rae-Won;Lee, Sang-Jun;Ju, Woo-Suk;Lee, Joan-Jae
    • 한국멀티미디어학회논문지
    • /
    • 제10권6호
    • /
    • pp.716-725
    • /
    • 2007
  • In this paper we describe a motion tracking algorithm for 3D human animation using stereo vision system. This allows us to extract the motion data of the end effectors of human body by following the movement through segmentation process in HIS or RGB color model, and then blob analysis is used to detect robust shape. When two hands or two foots are crossed at any position and become disjointed, an adaptive algorithm is presented to recognize whether it is left or right one. And the real motion is the 3-D coordinate motion. A mono image data is a data of 2D coordinate. This data doesn't acquire distance from a camera. By stereo vision like human vision, we can acquire a data of 3D motion such as left, right motion from bottom and distance of objects from camera. This requests a depth value including x axis and y axis coordinate in mono image for transforming 3D coordinate. This depth value(z axis) is calculated by disparity of stereo vision by using only end-effectors of images. The position of the inner joints is calculated and 3D character can be visualized using inverse kinematics.

  • PDF

비트패턴을 기반으로 한 고속의 적응적 가변 블록 움직임 예측 알고리즘 (Fast Variable-size Block Matching Algorithm for Motion Estimation Based on Bit-pattern)

  • 신동식;안재형
    • 한국멀티미디어학회논문지
    • /
    • 제3권4호
    • /
    • pp.372-379
    • /
    • 2000
  • 본 논문에서는 비트패턴을 기반으로 한 고속의 적응적 가변 블록 움직임 예측 알고리즘을 제안한다. 제안된 방법은 블록 내의 평균값을 기준으로 8bit 화소값을 0과 1의 비트패턴으로 변환한 후 블록의 움직임 예측을 수행한다. 비트변환을 통한 영상의 단순화는 움직임 추정의 계산적 부담을 감소시켜 빠른 탐색을 가능하게 한다. 그리고 블록 내의 움직임 정도를 미리 판별하여 이를 기반으로 한 적응적 탐색이 불필요한 탐색을 제거하고 움직임이 큰 블록에서는 정합 과정을 심화시켜 보다 빠르고 정확한 움직임 예측을 수행한다. 본 제안된 방식을 가지고 실험한 결과, 한 프레임 당 적은 수의 블록으로 고정된 크기의 블록을 가진 전역 탐색블록 정합 알고리즘(full search block matching algorithm; FS-BMA)보다 예측 에러를 적게 발생시켜 평균 0.5dB 정도의 PSNR 개선을 가져왔다.

  • PDF

특징기반 주의 모듈을 사용하는 CMOS 디지털 이미지 센서 (A CMOS Digital Image Sensor with a Feature-Driven Attention Module)

  • 박민철;최경주
    • 정보처리학회논문지B
    • /
    • 제15B권3호
    • /
    • pp.189-196
    • /
    • 2008
  • 본 논문에서는 A/D 변환기, 모션 예측 회로와 ROI(Region of Interest) 탐지를 위한 주의 모듈로 구성된 CMOS 디지털 이미지 센서를 소개한다. 현재 논문에서 제시하고 있는 이미지 센서의 A/D 변환기와 모션 예측 기능은 하드웨어인 $0.6{\mu}m$의 CMOS 프로세싱 회로(processing circuit)로 구현되어 있으며, ROI 탐지는 주의 모듈로서 소프트웨어로 구현되어 있다. 현재의 이미지 센서는 명암도의 변화에 반응하며, 모션을 예측하기 위해 시간정보를 사용하기 때문에 이미지 센서의 응용분야는 한정되어 있다. 센서라는 본래의 특징을 가지게 하면서 이의 응용분야를 확장하기 위하여 정지영상 및 동영상을 위한 특징기반 주의 모듈을 사용하여 이미지 센서에 인지기능을 부여하고자 한다. 이러한 접근법을 통해 이미지 센서는 모션이 예측되지 않다거나 명암도 변화가 감지되지 않을 경우에도 부가적인 기능을 할 수 있다. 실험결과를 통해 현재 구현된 이미지 센서의 효율성 및 다양한 분야로의 확장가능성을 확인할 수 있었다.

디지털 프린팅 방식 3차원 프린터의 출력 시간 및 재료 사용량 예측 방법 (Printing Time/Material Usage Estimation of 3-D Printer Using Digital Printing Method)

  • 박재일;조성욱;이겨레;김두수
    • 한국CDE학회논문집
    • /
    • 제22권2호
    • /
    • pp.215-221
    • /
    • 2017
  • This paper describes a method of precise estimation for printing time and material consumption which are directly related to the 3D printing cost. Printing process and head motion of 3D printers using digital printing head, which is analyzed by its digitized steps, is rapidly simulated without slicing to calculate estimated printing results. Using this method, printing time and material usage of 3D printer were estimated quickly and precisely and compared to the real printing result. Applying compensation using the printing parameters, transferred from the 3D printer to the printing estimation system, even more accurate estimation is achieved. This method is used in the 3D Sprint software.

자세 추정을 위한 모션 캡처 데이터 복원 (Restoring Motion Capture Data for Pose Estimation)

  • 윤여수;박현준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.5-7
    • /
    • 2021
  • 자세 추정을 위한 모션 캡처 데이터 파일에는 주변 환경과 움직임의 정도에 따라 부정확한 데이터가 존재할 수 있으므로, 이를 보정하는 작업이 필요하다. 기존에는 직접 후처리 과정을 통해 부정확한 데이터를 복원하였으나, 최근에는 자동화된 방법으로 LSTM, R-CNN 등 다양한 종류의 신경망을 사용한다. 하지만 신경망 기반의 데이터 복원 방법들은 컴퓨터 자원을 많이 요구하므로, 본 논문에서는 신경망 기반의 방법보다 자원 사용량은 낮추면서 데이터 복원율은 유지하는 방법을 제안한다. 제안하는 방법은 자세 측정 데이터(c3d)를 활용하여 부정확한 자세 데이터를 자동으로 복원한다. 실험 결과, 데이터의 부정확한 정도에 따라 89%에서부터 99% 정도의 데이터 복원율을 보였다.

  • PDF