• Title/Summary/Keyword: 피라미드 영상

Search Result 129, Processing Time 0.027 seconds

A Image-based 3-D Shape Reconstruction using Pyramidal Volume Intersection (피라미드 볼륨 교차기법을 이용한 영상기반의 3차원 형상 복원)

  • Lee Sang-Wook
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.10 no.1
    • /
    • pp.127-135
    • /
    • 2006
  • The image-based 3D modeling is the technique of generating a 3D graphic model from images acquired using cameras. It is being researched as an alternative technique for the expensive 3D scanner. In this paper, I propose the image-based 3D modeling system using calibrated camera. The proposed algorithm for rendering 3D model is consisted of three steps, camera calibration, 3D shape reconstruction and 3D surface generation step. In the camera calibration step, I estimate the camera matrix for the image aquisition camera. In the 3D shape reconstruction step, I calculate 3D volume data from silhouette using pyramidal volume intersection. In the 3D surface generation step, the reconstructed volume data is converted to 3D mesh surface. As shown the result, I generated relatively accurate 3D model.

Multi-view Video Coding based on Grid-type Pyramid GOP Structure (격자 피라미드 GOP 구조 기반의 다시점 비디오 부호화 방법)

  • Oh, Kwan-Jung;Oh, Han;Ho, Yo-Sung;Choi, Byeong-Ho
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2005.11a
    • /
    • pp.25-28
    • /
    • 2005
  • 디지틸 멀티미디어 시대를 맞이하여 영상통신 기술이 급속히 발전함에 따라 보다 사실감과 몰입감을 줄 수 있는 3차원 입체 영상처리에 대한 관심이 커지고 있다. 최근 국내외 연구기관에서 다차원 멀티미디어 서비스 개발을 위한 연구가 활발히 진행되고 있으며, MPEG 표준화 그룹에서도 H.264/AVC 압축 방법을 이용한 다시점 비디오 부호화(multi-view video coding, MVC) 방법들이 제안되었다. 본 논문에서는 격자 피라미드 GOP 구조 기반의 다시점 비디오 부호화 방법에 대해 기술하였다. 이 방법은 현재 MPEG 표준화 그룹에서 권고된 ‘Anchor’ 방법에서 고려치 못한 인접 시점간의 공간적인 상관도를 효과적으로 활용하기 위해 격자 GOP구조를 제안했고, 각 시점에 대한 효율적인 부호화를 위해 계층적 피라미드 GOP 구조를 이용하였다. 또한, 공간적인 예측의 경우에 시점간의 전체 변이 (global disparity)를 고려하여 가변적인 탐색 범위를 이용하였다. 본 논문에서 제안한 방법은 현재 MPEG에서 성능 평가의 기준이 되는 ‘Anchor’ 방법에 비해 동일 비트율에서 0.5${\sim}$0.8 dB 정도의 성능 향상을 보였다.

  • PDF

3-D image display by use projection technique (프로젝션 기술을 이용한 3차원 입체영상 표시)

  • Park, Sang-gug
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2012.10a
    • /
    • pp.665-668
    • /
    • 2012
  • This paper describes research results that 2-D contents, which display in smart phone or tablet PC to be able to see the 3-D stereoscopic by use projection technique. For this research, we have construct four brown-glass into pyramid shape, project each of the four LCD monitors that output from the PC screen into of the four inverted pyramid-shaped mirror and display the 3-D image to the center of the mirror system. For the test, We use tablet PC and server PC(desktop PC) connected by wireless network, tablet PC select contents which is displayed in the server PC, and displayed selected contents into the 3-D image to the center of the mirror system. Through the test, we have showed that it is possible to display 3-D stereoscopic to the 2-D contents by use projection technique. Although, display image is depending on the observer's viewing angle.

  • PDF

Frame Rate Up-Conversion Using Pyramid Structure and Quadtree (피라미드 구조와 쿼드트리를 이용한 프레임율 증가 변환)

  • Lee, Jichan;Kim, Jun-Geon;Lee, Junho;Kim, Kisun;Lee, Daeho
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.11a
    • /
    • pp.90-92
    • /
    • 2014
  • 본 논문에서는 피라미드 구조와 쿼드트리를 이용하는 움직임 보상 프레임 보간(motion compensated frame interpolation, MCFI)의 새로운 방법을 제안한다. 일반적인 MCFI 방법에서는 고정된 크기의 프레임과 블록에서 움직임 벡터(motion vector, MV)를 이용하여 두 프레임 사이의 프레임 영상을 추정한다. 그러나 이와 같은 방법은, 큰다양한 방향으로 움직이는 물체들의 MV 나 큰 움직임을 추정하기 어렵다. 이러한 문제점을 해결하기 위해서 본 논문에서는 블록 크기와 정합 영역이 가변적으로 적용될 수 있는 피라미드 구조와 쿼드트리를 이용한 프레임 보간 기법(pyramid structure and quadtree motion compensated frame interpolation, PQ-MCFI)를 제안한다. 제안하는 기법은 물체들이 빠르게 움직이는 장면과 다양한 방향으로 움직이는 장면에서 이전의 기법에 비해서 높은 PSNR 을 보이며, 실제 인간의 시각적인 측면에서는 더욱 정밀한 결과를 보인다.

  • PDF

Deep Learning Image-based Indoor Positioning System using Pyramid Beacon in Smartphone Augmented Reality Environment (스마트폰 증강현실 환경에서 피라미드 비콘을 활용한 딥러닝 영상기반 실내측위 시스템)

  • An, Hyeon Woo;Moon, Namme
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.1094-1097
    • /
    • 2019
  • 디지털화된 현실 환경을 증강현실속에서 투영시키기 위해선 증강현실 디바이스의 측위가 필수적이다. 하지만 대부분의 측위 방식이 측위 대상 디바이스에 대해 별도의 하드웨어나 센서를 요구하는데 이를 스마트폰 환경에서 충족시키기란 매우 힘든 일이다. 이에 본 논문은 스마트폰 환경에서 별도의 하드웨어를 요구하지 않는 딥러닝 영상기반 실내 측위 시스템을 제안한다. 제안하는 시스템은 측위를 위하여 설계된 피라미드형의 비콘을 활용하며 실시간에 가까운 피드백을 구현하기 위해 딥러닝 기법을 활용한 탐지를 진행한다. 본 논문에서는 상기한 두 개의 요소를 포함한 제안 시스템의 구성요소들을 설명하고 학습 방법과 비콘의 자세 측정 방법, 최종 측위 프로세스 등 전반적인 측위 프로세스를 설명한다.

Transformer and Spatial Pyramid Pooling based YOLO network for Object Detection (객체 검출을 위한 트랜스포머와 공간 피라미드 풀링 기반의 YOLO 네트워크)

  • Kwon, Oh-Jun;Jeong, Je-Chang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.113-116
    • /
    • 2021
  • 일반적으로 딥러닝 기반의 객체 검출(Object Detection)기법은 합성곱 신경망(Convolutional Neural Network, CNN)을 통해 입력된 영상의 특징(Feature)을 추출하여 이를 통해 객체 검출을 수행한다. 최근 자연어 처리 분야에서 획기적인 성능을 보인 트랜스포머(Transformer)가 영상 분류, 객체 검출과 같은 컴퓨터 비전 작업을 수행하는데 있어 경쟁력이 있음이 드러나고 있다. 본 논문에서는 YOLOv4-CSP의 CSP 블록을 개선한 one-stage 방식의 객체 검출 네트워크를 제안한다. 개선된 CSP 블록은 트랜스포머(Transformer)의 멀티 헤드 어텐션(Multi-Head Attention)과 CSP 형태의 공간 피라미드 풀링(Spatial Pyramid Pooling, SPP) 연산을 기반으로 네트워크의 Backbone과 Neck에서의 feature 학습을 돕는다. 본 실험은 MSCOCO test-dev2017 데이터 셋으로 평가하였으며 제안하는 네트워크는 YOLOv4-CSP의 경량화 모델인 YOLOv4s-mish에 대하여 평균 정밀도(Average Precision, AP)기준 2.7% 향상된 검출 정확도를 보인다.

  • PDF

Sequence Images Registration by using KLT Feature Detection and Tracking (KLT특징점 검출 및 추적에 의한 비디오영상등록)

  • Ochirbat, Sukhee;Park, Sang-Eon;Shin, Sung-Woong;Yoo, Hwan-Hee
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.16 no.2
    • /
    • pp.49-56
    • /
    • 2008
  • Image registration is one of the critical techniques of image mosaic which has many applications such as generating panoramas, video monitoring, image rendering and reconstruction, etc. The fundamental tasks of image registration are point features extraction and tracking which take much computation time. KLT(Kanade-Lucas-Tomasi) feature tracker has proposed for extracting and tracking features through image sequences. The aim of this study is to demonstrate the usage of effective and robust KLT feature detector and tracker for an image registration using the sequence image frames captured by UAV video camera. In result, by using iterative implementation of the KLT tracker, the features extracted from the first frame of image sequences could be successfully tracked through all frames. The process of feature tracking in the various frames with rotation, translation and small scaling could be improved by a careful choice of the process condition and KLT pyramid implementation.

  • PDF

Pyramid Image Coding Using Edge Information (Edge 정보에 근거한 피라미드 영상부호화)

  • Kim, Hae-Sung;Kim, Nam-Chul
    • Journal of the Korean Institute of Telematics and Electronics
    • /
    • v.25 no.10
    • /
    • pp.1225-1233
    • /
    • 1988
  • In this paper, several simple approaches to Laplacian pyramid coding have been presented for obtaining reasonably acceptable image quality even at low bit rates of 0.3-0.5 bits/pel. For this purpose, the feedback construction of each Lapliacian plane, 3-dimensional prediction and three-level center-clipping quantization are introduced into the coding procedures. For greatly reducing the bit rate of the bottom layer, two new schemes of conditional transmission and edge sharpening without transmission are used. In experiments, our latter sheme has yielded the total bit rate of about 0.3 bits/pel while retaining reasonably acceptable image quality.

  • PDF