• Title/Summary/Keyword: RGB-D 영상

검색결과 138건 처리시간 0.02초

단일 모바일 디바이스를 이용한 3차원 특징점 추출 방법 (3D FEATURE POINT ESTIMATION BASED ON A SINGLE MOBILE DEVICE)

  • 김진겸;서영호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.124-125
    • /
    • 2021
  • 최근 증강현실(AR), 가상현실(VR), 혼합현실(XR) 분야가 각광받고 있으며, 3차원 공간과 사물을 인식하여 다양한 콘텐츠 서비스를 제공하는 기술이 개발되고 있다[1]. 3차원 공간과 사물을 인식하기 위해 가장 널리 사용되는 방법은 RGB 카메라를 이용하는 것이다[2]. RGB 카메라를 이용하여 촬영한 영상을 분석한 후 분석된 결과를 이용하여 카메라와 환경의 관계를 추정한다. 시차는 사용자가 촬영한 복수의 이미지에서 특징점의 차이를 이용하여 계산된다. 실험적으로 구한 깊이에 대해 계산된 디스패리티에 시차 정보와 스케일링 정보를 더하여 3차원 특징점을 생성한다. 제안하는 알고리즘은 단일 모바일 디바이스에서 획득한 영상을 사용한다. 특징점 매칭을 기반으로한 디스패리티 추정과 시차조정 3D 특징점 생성이다. 실제 깊이 값과 비교했을 때, 생성된 3차원 특징점은 실측값의 10% 이내의 오차가 있음을 실험적으로 증명하였다. 따라서 제안하는 방법을 이용하여 유효한 3차원 특징점을 생성할 수 있다.

  • PDF

딥러닝을 이용한 사용자 구분 및 위치추적 알고리즘 (User classification and location tracking algorithm using deep learning)

  • 박정탁;이솔;박병서;서영호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.78-79
    • /
    • 2022
  • 본 논문에서는 RGB-D 카메라를 이용하여 획득한 다수 사용자의 정규화된 스켈레톤의 신체 비율 분석을 통해 각 사용자의 구분 및 위치를 추적하는 기법을 제안한다. 이를 위해 3D 포인트 클라우드로부터 각 사용자의 3D 스켈레톤을 추출한 뒤 신체 비율 정보를 저장한다. 이후 저장된 신체 비율 정보를 전체 프레임에서 출력된 신체 비율 데이터와 유사도를 비교하여 전체 영상에서의 사용자 구분 및 위치추적 알고리즘을 제안한다.

  • PDF

3차원 동영상 정보처리용 영상 입출력 기술 (An Input/Output Technology for 3-Dimensional Moving Image Processing)

  • 손정영;천유식
    • 전자공학회논문지S
    • /
    • 제35S권8호
    • /
    • pp.1-11
    • /
    • 1998
  • 차세대 정보 통신 서비스의 고도화를 위해 추구되는 핵심 기술 중의 하나가 가시화를 통한 실감(Sensation of Reality) 서비스의 구현이다. 정보 통신 서비스의 가시화를 통한 실감화는 3차원 동영상 통신 기술의 개발없이는 구현이 불가능하다. 3차원 동영상 통신의 구현에 있어 가장 큰 문제점은 3차원 동영상에 포함된 많은 정보량을 전송할 수 있는 전송 기술과 3차원 영상을 촬영하고 실시간으로 표시할 수 있는 기술이 아직 확립되어 있지 않다는 것이다. 현재 확립되어 있는 3차원 동영상 기술은 주로 입체 방식(Stereoscopic Type)으로 실감을 얻기가 어렵다. 입체영상 보다 실감을 더해 주는 영상은 눈의 움직임과 함께 입체 영상이 연속적으로 변하게 하는 다시점(Multiview) 3차원 영상이다. 다시점 3차원 영상시스템을 8대의 카메라와 빔 프로젝터 그리고 홀로그래픽 스크린을 이용하는 시분할(Time Multiplexing) 방식에 의해 구현했다. 이 시스템에서 다시점 영상은 8대의 카메라에 의해 촬영되며, 이 촬영된 영상은 신호변환기에 의해 색상별로 한 개의 채널로 합성되어 초당 480 프레임 주파수로 빔 프로젝터에 의해 홀로그래픽 스크린에 투사된다. 빔 프로젝터의 영상은 띠형(Strip Type) 액정 셔터를 통해 홀로그래픽 스크린에 투사되게 되며, 이 띠형 액정 셔터는 홀로그래픽 스크린상에 투사된 영상을 볼 수 있게 시역을 형성한다. 각 카메라는 대응하는 띠형 액정 셔터들과 동기되어 움직이므로, 각 카메라의 영상은 대응하는 액정 셔터를 통해 투사하게 되어 시역에서는 다시점 3차원 영상의 시청이 가능해진다.

  • PDF

RGB 비디오 압축 부호화의 효율 개선을 위한 적응적 기저 색평면 필터링 기법 (Base plane adaptive filtering for inter plane prediction in RGB video coding)

  • 최장원;정진우;김양수;최윤식
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.294-296
    • /
    • 2010
  • 일반적으로, RGB 영상의 높은 주파수 영역은 잡음으로 인해 색평면 간 서로 낮은 상관도를 가지고 있기 때문에 이러한 고주파수 성분은 색평면 간 예측의 효율을 저하시키는 원인이 된다. 본 논문에서는 RGB 비디오 코딩에서 색평면 간 예측의 효율을 높이기 위해 기저 색평면을 적응적으로 필터링 하는 방법을 제안한다. 색평면 간 상관도에 따라 적응적으로 기저 색평면을 필터링함으로써 색평면 간 예측 성능을 높일 수 있었다. 본 논문에서 제안하는 알고리즘을 통해 우리는 H.264/AVC High 4:4:4 Intra Profile에 비해 평균 14.71%의 비트율 감소와 0.93dB의 PSNR 향상 결과를 얻을 수 있었다.

  • PDF

컬러 영상의 RGB 화소 최대차분 기반 보간법을 이용한 정보은닉 기법 (Information Hiding Method based on Interpolation using Max Difference of RGB Pixel for Color Images)

  • 이준호;김평한;정기현;유기영
    • 한국멀티미디어학회논문지
    • /
    • 제20권4호
    • /
    • pp.629-639
    • /
    • 2017
  • Interpolation based information hiding methods are widely used to get information security. Conventional interpolation methods use the neighboring pixel value and simple calculation like average to embed secret bit stream into the image. But these information hiding methods are not appropriate to color images like military images because the characteristics of military images are not considered and these methods are restricted in grayscale images. In this paper, the new information hiding method based on interpolation using RGB pixel values of color image is proposed and the effectiveness is analyzed through experiments.

스테레오 CCD 카메라를 이용한 이동체의 실시간 3차원 위치추적 (3D Position Tracking for Moving objects using Stereo CCD Cameras)

  • 권혁종;배상근;김병국
    • Spatial Information Research
    • /
    • 제13권2호
    • /
    • pp.129-138
    • /
    • 2005
  • 본 논문에서는 스테레오 CCD 카메라를 이용하여 이동체의 3차원 위치좌표를 추출하는 알고리즘을 제안하였다. 이 알고리즘을 통해 효율적으로 이동체의 3차원 위치좌표를 추출하는 방법을 도출하고자 하였다 스테레오 CCD 카메라의 상호표정을 수행하고, 획득된 영상에서 이동체를 배경과 분리한 뒤, 좌$\cdot$우 영상에서 이동체의 영상좌표를 추출한다. 추출된 좌$\cdot$우 영상에서의 영상좌표를 이용하여 이동체의 3차원 위치를 결정하게 된다. 스테레오 CCD 카메라간의 상호 위치 및 자세를 결정하기 위한 표정 모듈은 독립적 상호표정(independent relative orientation)을 사용하였고, 획득된 영상에서 이동체 추출 알고리즘은 칼라영상의 RGB(Red, Green, Blue) 화소값을 이용하여 구현하였다. 좌$\cdot$우 CCD 카메라로부터 들어오는 영상좌표를 이용하여 공간전방교회 법을 통해 이동체의 위치를 계산하였다. 그리고 전체 시스템의 실험을 수행하였고, 그 결과의 정확도를 비교하였다.

  • PDF

적응적 2차원 FIR 필터를 이용한 부화소 렌더링 기법 (Sub-Pixel Rendering Algorithm Using Adaptive 2D FIR Filters)

  • 남연오;최익현;송병철
    • 전자공학회논문지
    • /
    • 제50권3호
    • /
    • pp.113-121
    • /
    • 2013
  • 본 논문은 학습 기반의 2D-FIR필터를 이용한 부화소 렌더링 기법을 제안한다. 제안 기법은 크게 학습 단계와 합성 단계로 나뉜다. 학습 단계에서는 충분히 많은 수의 저해상도/고해상도의 영상 블록 쌍들을 이용하여 고해상도/저해상도 블록의 관계에 따른 합성 정보를 계산하고, 그 합성 정보를 담은 소위 사전을 생성한다. 합성 단계에서는 각 입력 영상에 대응하는 후보 블록을 상기 학습된 사전에서 찾는다. 탐색된 사전 내 합성 정보를 이용하여 부화소 레벨의 축소된 블록을 합성함으로써 최종 축소 영상을 얻는다. 한편, 영상 합성 시 디스플레이 장치의 RGB 패턴을 고려한 필터링을 통해 선명도를 향상시킨다. 모의 실험을 통해 제안 기법이 일반적인 영상축소 기법에 비해 흐림 효과, 엘리어싱 등의 화질 열화없이 고화질의 축소 영상을 생성함을 확인하였다.

RGB-D 영상을 이용한 Fusion RetinaNet 기반 얼굴 검출 방법 (Face Detection Method based Fusion RetinaNet using RGB-D Image)

  • 남은정;남충현;장경식
    • 한국정보통신학회논문지
    • /
    • 제26권4호
    • /
    • pp.519-525
    • /
    • 2022
  • 영상 내 사람의 얼굴을 검출하는 얼굴 검출 작업은 다양한 영상 처리 어플리케이션 내 전처리 또는 핵심 과정으로 사용되고 있다. 최근 딥러닝 기술의 발달로 높은 성능을 내고 있는 신경망 모델은 2차원 영상에 의존적이며, 카메라 품질이 떨어지거나, 얼굴의 초점을 제대로 잡지 못하는 등의 영상 내 노이즈가 발생할 경우, 제대로 얼굴을 검출하지 못할 수 있다. 본 논문에서는 2차원 영상의 의존성을 낮추기 위해 깊이 정보를 함께 사용하는 얼굴 검출 방법에 대해 제안한다. 제안하는 모델은 기존 공개된 얼굴 검출 데이터 셋을 이용하여 깊이 정보를 사전에 생성 및 전처리 과정을 거친 후 학습하였으며, 그 결과, 평균 정밀도 기준 FRN 모델은 89.16%로 87.95%의 성능을 보인 RetinaNet 모델보다 약 1.2% 정도의 성능이 향상되었음을 확인하였다.

색상정보와 깊이정보 가중치를 이용한 깊이영상 업샘플러 (Depth Upsampler Using Color and Depth Weight)

  • 신수연;김동명;서재원
    • 한국콘텐츠학회논문지
    • /
    • 제16권7호
    • /
    • pp.431-438
    • /
    • 2016
  • 본 논문은 색상정보와 깊이정보 가중치를 이용한 깊이영상 업샘플링 방법을 제안한다. 제안하는 알고리즘은 먼저 양선형 보간법을 통해 높은 해상도의 깊이영상을 생성한다. 그 후 RGB 색상영상, HSV 색상영상, 깊이영상 등을 이용하여 공통경계 영역을 추정한다. 만일 보간 된 화소가 공통경계 영역에 속한다면 해당화소를 포함하는 $3{\times}3$ 영역의 화소들에 대한 색상정보와 깊이정보의 가중치를 구하고 경계 화소값 결정을 위한 비용계산을 수행한다. 그 후 가장 작은 경계 화소값 결정 비용을 가지는 화소 값을 결과영상의 화소값으로 정한다. 제안하는 알고리즘은 PSNR 및 주관적 화질 비교에서 우수한 성능을 보였다.

DTW(Dynamic Time Warping)를 이용한 영상 정보 검색 (Image Information Retrieval Using DTW(Dynamic Time Warping))

  • 하정요;이나영;김계영;최형일
    • 디지털콘텐츠학회 논문지
    • /
    • 제10권3호
    • /
    • pp.423-431
    • /
    • 2009
  • 영상을 검색하는 데에는 형태, 색상, 질감 등 여러 가지 특징을 사용 할 수 있다. 그 중 가장 활발한 연구가 이루어지고 있는 분야가 형태 정보와 색상 정보를 이용하는 분야이다. 형태 정보를 이용하는 검색 방법에는 2D 모멘트와 푸리에변환 등의 방법이 유명하다. 또 다른 방법으로는 CSS(Curvature Scale Space)가 있는데, 이는 윤곽선 정보를 이용하여 윤곽선의 굴곡을 2D 그래프로 표현하여 그 그래프의 극대점을 특징 값으로 사용하여 영상을 비교 검색하는 방법이다. 기존 CSS 방법에는 몇 가지 문제점이 있어서 본 논문에서는 기존 방법을 향상시킨 ICSS 방법을 사용하여 영상을 검색한다. 색상 정보를 이용하는 방법에는 RGB 색상정보를 이용하는 방법과 HSI 색상정보를 이용하는 방법 등이 있는데 본 논문에서는 HSI 색상정보를 이용하여 색상 히스토그램으로 표현한 후 영상의 비교 척도로 사용하였다. 영상의 유사도를 측정하는 방법으로는 유클리디언 디스턴스를 주로 사용하는데, 본 논문에서는 정확도와 검색 시간을 단축시키고자 DTW를 사용하여 영상의 유사도를 측정하였고, 유클리디언 디스턴스를 사용했을 때와 비교하여 성능 향상 결과를 보인다.

  • PDF