• 제목/요약/키워드: RGB-D 영상

검색결과 138건 처리시간 0.028초

색상 보정을 통한 3DTV의 입체영상 화질 개선 방법 (3D Quality Improvement Method for 3DTV using Color Compensation)

  • 정길수;강민성;김동현;손광훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.220-223
    • /
    • 2010
  • 최근 연이은 3D 영화의 성공에 힘입어 영화 산업계를 중심으로 3D 콘텐츠 생성이 늘고 있으며, 이를 가정 내에서도 즐길 수 있도록 다양한 3DTV가 출시되고 있다. 그러나 3DTV의 특성 상 3D 재생 시 밝기 저하에 따른 색 재현 문제로 인하여 입체감과 공간감을 느끼는 대신 2D에서의 화려한 색감을 만끽할 수 없게 되었다. 이에 본 논문은 3D 시청 시에도 2D에서와 같은 색감을 최대한 제공하기 위한 방법에 대해 연구하였다. 이를 위하여 3DTV를 활용하여 입력 RGB 영상에 대하여 2D와 3D 재생 시 재현되는 RGB intensity를 측정한 후 입출력에 따른 관계 모델링을 실시하였고, 모델링에 근거하여 3D 재생 시 2D 대비 보정되어야 할 색상 요소에 대한 매핑 테이블(mapping table)을 생성하였다. 생성된 매핑 테이블은 기존 3DTV 시스템의 출력부에 3D 색상 보정 모듈로써 추가하도록 하여 일반 2D 재생 시에는 입력영상이 바이패스(bypass)되도록 하고, 3D 재생 시에는 본 논문에 의한 3D 색상 보정용 매핑 테이블을 통해 색상 보정 과정을 수행하도록 하여 3D 재생 시에도 2D에서 느낄 수 있는 색감을 재현할 수 있도록 하였다.

  • PDF

RGB-Depth 카메라를 이용한 현실-가상 융합 홀로그램 생성 시스템 (Real-Virtual Fusion Hologram Generation System using RGB-Depth Camera)

  • 송중석;박정식;박한훈;박종일
    • 방송공학회논문지
    • /
    • 제19권6호
    • /
    • pp.866-876
    • /
    • 2014
  • 컴퓨터 그래픽스(CG)가 포함된 영상 컨텐츠를 홀로그램으로 만들기 위해서는 가상 객체와 현실 공간의 자연스러운 3차원 정보 융합이 필요하다. 본 논문에서는 RGB-Depth 카메라를 이용하여 현실-가상 공간의 3차원 정보를 자연스럽게 융합하고, 융합된 결과를 다중 GPU 기반의 컴퓨터 생성 홀로그램(CGH) 연산부를 사용하여 디지털 홀로그램을 고속 생성하는 시스템을 제안한다. RGB-Depth 카메라를 이용하여 카메라 투영 행렬을 계산하고, 이를 이용하여 가상 객체의 3차원 정보를 계산한다. 계산된 가상 객체의 깊이 정보와 RGB-Depth 카메라로 입력받은 현실 공간의 깊이 영상을 Z 버퍼에 입력하여 자연스럽게 융합한 후, 그 결과를 다중 GPU 기반의 CGH 연산부로 전송하여 고속으로 디지털 홀로그램을 생성한다. 실험 결과, 제안하는 시스템을 통해 만들어진 가상 객체의 3차원 정보는 현실 공간의 3차원 정보와 약 0.5138%의 평균 상대 오차를 나타내어, 약 99%의 정밀도를 갖고 있는 것을 확인할 수 있었고, 현실-가상 융합 깊이 영상을 생성함과 동시에 다중 GPU를 이용하여 고속으로 디지털 홀로그램을 생성할 수 있음을 확인할 수 있었다.

다른 화각을 가진 라이다와 칼라 영상 정보의 정합 및 깊이맵 생성 (Depthmap Generation with Registration of LIDAR and Color Images with Different Field-of-View)

  • 최재훈;이덕우
    • 한국산학기술학회논문지
    • /
    • 제21권6호
    • /
    • pp.28-34
    • /
    • 2020
  • 본 논문에서는 라이다(LIDAR) 센서와 일반 카메라 (RGB 센서)가 획득한 영상들을 정합하고, 일반 카메라가 획득한 컬러 영상에 해당하는 깊이맵을 생성하는 방법을 제시한다. 본 연구에서는 Slamtec사의 RPLIDAR A3 와 일반 디지털 카메라를 활용하고, 두 종류의 센서가 획득 및 제공하는 정보의 특징 및 형태는 서로 다르다. 라이다 센서가 제공하는 정보는 라이다부터 객체 또는 주변 물체들까지의 거리이고, 디지털 카메라가 제공하는 정보는 2차원 영상의 Red, Green, Blue 값이다. 두 개의 서로 다른 종류의 센서를 활용하여 정보를 정합할 경우 객체 검출 및 추적에서 더 좋은 성능을 보일 수 있는 가능성이 있고, 자율주행 자동차, 로봇 등 시각정보처리 기술이 필요한 영역에서 활용도가 높은 것으로 기대한다. 두 종류의 센서가 제공하는 정보들을 정합하기 위해서는 각 센서가 획득한 정보를 가공하고, 정합에 적합하도록 처리하는 과정이 필요하다. 본 논문에서는 두 센서가 획득하는 정보들을 정합한 결과를 제공할 수 있는 전처리 방법을 실험 결과와 함께 제시한다.

RGB-D 정보를 이용한 2차원 키포인트 탐지 기반 3차원 인간 자세 추정 방법 (A Method for 3D Human Pose Estimation based on 2D Keypoint Detection using RGB-D information)

  • 박서희;지명근;전준철
    • 인터넷정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.41-51
    • /
    • 2018
  • 최근 영상 감시 분야에서는 지능형 영상 감시 시스템에 딥 러닝 기반 학습 방법이 적용되어 범죄, 화재, 이상 현상과 같은 다양한 이벤트들을 강건하게 탐지 할 수 있게 되었다. 그러나 3차원 실세계를 2차원 영상으로 투영시키면서 발생하는 3차원 정보의 손실로 인하여 폐색 문제가 발생하기 때문에 올바르게 객체를 탐지하고, 자세를 추정하기 위해서는 폐색 문제를 고려하는 것이 필요하다. 따라서 본 연구에서는 기존 RGB 정보에 깊이 정보를 추가하여 객체 탐지 과정에서 나타나는 폐색 문제를 해결하여 움직이는 객체를 탐지하고, 탐지된 영역에서 컨볼루션 신경망을 이용하여 인간의 관절 부위인 14개의 키포인트의 위치를 예측한다. 그 다음 자세 추정 과정에서 발생하는 자가 폐색 문제를 해결하기 위하여 2차원 키포인트 예측 결과와 심층 신경망을 이용하여 자세 추정의 범위를 3차원 공간상으로 확장함으로써 3차원 인간 자세 추정 방법을 설명한다. 향후, 본 연구의 2차원 및 3차원 자세 추정 결과는 인간 행위 인식을 위한 용이한 데이터로 사용되어 산업 기술 발달에 기여 할 수 있다.

X-색도 공간에서 ROI의 전방향 프로젝션과 백색패치의 평행이동에 의한 본질 영상 획득 (Acquisition of Intrinsic Image by Omnidirectional Projection of ROI and Translation of White Patch on the X-chromaticity Space)

  • 김달현;황동국;이우람;전병민
    • 정보처리학회논문지B
    • /
    • 제18B권2호
    • /
    • pp.51-56
    • /
    • 2011
  • 흑체의 온도 변화에 대한 영상의 색차를 줄이는 본질 영상은 단일 불변 방향을 검출하고 백색 장면 조명체를 기반으로 하기 때문에 실영상에 존재하는 다수의 불변 방향과 유색 장면 조명체에 취약하다. 이러한 문제를 해결하기 위해 본 논문에서는 ${\chi}$-색도 공간에서 ROI의 전방향프로젝션과 백색패치의 평행이동을 통해 불변 방향을 검출하는 본질 영상 획득 기법을 제안한다. 3차원 RGB 공간 분석의 어려움으로 인하여, 본 논문 또한 밝기가 고려되지 않은 ${\chi}$-색도 공간을 사용한다. 이 공간에서 유색 조명체의 효과는 백색패치의 평행이동을 통해 감소시키고, 색차에 따라 가상의 선분으로 나타나는 불변 방향은 ROI의 전방향 프로젝션을 통해 검출한다. 다수의 불변 방향을 고려하여 ROI 선택은 3D 히스토그램에서 빈도수에 의해 결정한다. 검출 후, 본질 영상은 불변 방향의 직교 방향으로의 프로젝션과 RGB영상으로의 역변환 과정을 통해 획득된다. 실험에서 Ebner가 제안한 데이터집합을 실험 영상으로 이용하였고, 불변 방향의 표준편차와 색항등성 측도를 평가 측도로 사용하였다. 제안한 기법의 실험 결과는 엔트로피 기법보다 불변 방향의 표준 편차가 낮았으며, 기존의 기법에 비해 색항등성이 2배 이상 높았다.

멀티-뷰 영상들을 활용하는 3차원 의미적 분할을 위한 효과적인 멀티-모달 특징 융합 (Effective Multi-Modal Feature Fusion for 3D Semantic Segmentation with Multi-View Images)

  • 배혜림;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권12호
    • /
    • pp.505-518
    • /
    • 2023
  • 3차원 포인트 클라우드 의미적 분할은 각 포인트별로 해당 포인트가 속한 물체나 영역의 분류 레이블을 예측함으로써, 포인트 클라우드를 서로 다른 물체들이나 영역들로 나누는 컴퓨터 비전 작업이다. 기존의 3차원 의미적 분할 모델들은 RGB 영상들에서 추출하는 2차원 시각적 특징과 포인트 클라우드에서 추출하는 3차원 기하학적 특징의 특성을 충분히 고려한 특징 융합을 수행하지 못한다는 한계가 있다. 따라서, 본 논문에서는 2차원-3차원 멀티-모달 특징을 이용하는 새로운 3차원 의미적 분할 모델 MMCA-Net을 제안한다. 제안 모델은 중기 융합 전략과 멀티-모달 교차 주의집중 기반의 융합 연산을 적용함으로써, 이질적인 2차원 시각적 특징과 3차원 기하학적 특징을 효과적으로 융합한다. 또한 3차원 기하학적 인코더로 PTv2를 채용함으로써, 포인트들이 비-정규적으로 분포한 입력 포인트 클라우드로부터 맥락정보가 풍부한 3차원 기하학적 특징을 추출해낸다. 본 논문에서는 제안 모델의 성능을 분석하기 위해 벤치마크 데이터 집합인 ScanNetv2을 이용한 다양한 정량 및 정성 실험들을 진행하였다. 성능 척도 mIoU 측면에서 제안 모델은 3차원 기하학적 특징만을 이용하는 PTv2 모델에 비해 9.2%의 성능 향상을, 2차원-3차원 멀티-모달 특징을 사용하는 MVPNet 모델에 비해 12.12%의 성능 향상을 보였다. 이를 통해 본 논문에서 제안한 모델의 효과와 유용성을 입증하였다.

RGB-D 영상 포맷을 위한 결합형 무작위 Fern을 이용한 객체 검출 (Object Detection Using Combined Random Fern for RGB-D Image Format)

  • 임승욱;김유선;이시웅
    • 한국콘텐츠학회논문지
    • /
    • 제16권9호
    • /
    • pp.451-459
    • /
    • 2016
  • 객체 검출은 다양한 컴퓨터 비전 응용 분야의 핵심 기술이지만 조명 변화와 기하학적 왜곡에 강인성을 갖기 위해서는 막대한 계산이 필요한 기술이다. 최근에 이 문제를 분류기의 토대로 체계화함으로써 효과적으로 해결하기 위한 접근법들이 소개되고 있다. 그 중 무작위 fern 알고리즘은 단순한 구조와 높은 인식 성능으로 많은 관심을 받고 있다. 그러나 기존의 무작위 fern 알고리즘은 화소간의 밝기 차이만으로 특징을 추출하고 있어 대조, 조명 변화와 같은 밝기 변화나 잡음에 대해 취약점을 갖는다. 본 논문에서는 기존의 무작위 fern의 단점을 개선하기 위해 패치의 기하학적 구조를 반영할 수 있는 깊이 정보를 결합시킨 결합형 무작위 fern을 새로이 제안하고 이를 이용한 객체 검출기의 성능 개선 방안을 제시한다. 모의실험을 통해 결합형 무작위 fern이 기존 방식보다 조명의 영향이나 잡음에 강인함을 보인다.

얼굴 포즈 추정을 이용한 다중 RGB-D 카메라 기반의 2D - 3D 얼굴 인증을 위한 시스템 (2D - 3D Human Face Verification System based on Multiple RGB-D Camera using Head Pose Estimation)

  • 김정민;이성철;김학일
    • 정보보호학회논문지
    • /
    • 제24권4호
    • /
    • pp.607-616
    • /
    • 2014
  • 현재 영상감시 시스템에서 얼굴 인식을 통한 사람의 신원 확인은 정면 얼굴이 아닌 관계로 매우 어려운 기술에 속한다. 일반적인 사람들의 얼굴 영상과 입력된 얼굴 영상을 비교하여 유사도를 파악하고 신원을 확인 하는 기술은 각도의 차이에 따라 정확도의 오차가 심해진다. 이런 문제를 해결하기 위해 본 논문에서는 POSIT을 사용하여 얼굴 포즈 측정을 하고, 추정된 각도를 이용하여 3D 얼굴 영상을 제작 후 매칭 하여 일반적인 정면 영상끼리의 매칭이 아닌 rotated face를 이용한 매칭을 해보기로 한다. 얼굴을 매칭 하는 데는 상용화된 얼굴인식 알고리즘을 사용하였다. 얼굴 포즈 추정은 $10^{\circ}$이내의 오차를 보였고, 얼굴인증 성능은 약 95% 정도임을 확인하였다.

입체영상의 3D 증강을 위한 입체영상 변환 (Transformation of Stereoscopic Images for 3D Perception Improvement)

  • 길종인;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.325-327
    • /
    • 2012
  • 최근 국내외 디지털 가전 업체들은 다양한 3D 기술을 앞세워 가정 내에서도 편하게 즐길 수 잇도록 다양한 3DTV를 출시하고 있다. 이러한 3DTV에서 입체영상을 시청하기 위해서는 입체콘텐츠가 제작되어 전송되어야 한다[1]. 이러한 입체 콘텐츠는 RGB 영상과 깊이맵을 이용하여 생성할 수 있는데, 이때 깊이맵은 사용자의 용도에 따라 다양한 형태로 변환될 수 있다. 최근엔 이러한 깊이맵과 3D 영상의 컬러를 변환하여 지각 깊이감을 개선하는 영상처리 기술에 대한 관심이 높아지고 있다. 이에 따라, 본 논문에서는 기존의 컬러 변환을 통한 2D 영상의 지각 깊이감 개선을 입체영상에 적용하여, 3D 지각 입체감을 동시에 향상시키는 방법을 제안한다. 이를 위해 대조 변환 및 배경 다크닝 방법을 제안하고, 실험을 통해 제안 방법이 상기 목적을 얻을 수 있는 것을 검증하였다.

  • PDF

컬러 및 깊이 데이터 변환을 이용하는 입체감 향상 (Stereoscopic Perception Improvement Using Color and Depth Transformation)

  • 길종인;장성은;서주하;김만배
    • 방송공학회논문지
    • /
    • 제16권4호
    • /
    • pp.584-595
    • /
    • 2011
  • 최근 RGB 영상과 깊이맵이 동시에 제작되어 공급되고 있다. 깊이맵은 사용자의 용도에 따라 다양한 형태로 변환되어 입체영상 제작에 사용된다. 깊이맵을 활용하는 기법이 새로이 소개되고 있는데, 한 예로 의료 분야에서 2D 영상의 컬러를 변환하여 지각 깊이감을 개선하는 영상처리 기술에 대한 관심이 높아지고 있다. 본 논문에서는 기존의 컬러 변환을 통한 2D 영상의 지각 깊이감 개선을 입체영상에 적용하여, 3D 지각 깊이감을 동시에 향상시키는 방법을 제안한다. 이를 위해 대조 변환 및 배경 다크닝 방법을 제안하고, 실험을 통해 제안 방법이 상기 목적을 얻을 수 있는 것을 검증하였다. 주관적 실험에서는 입체감 향상 및 피로도 측정을 통해 제안 방법의 성능 및 단점을 제시하였다.