• 제목/요약/키워드: RGB-D Images

검색결과 107건 처리시간 0.025초

랜덤 무향 칼만 필터를 이용한 RGB+D 카메라 센서의 잡음 보정 기법 (Noise Reduction Method Using Randomized Unscented Kalman Filter for RGB+D Camera Sensors)

  • 권오설
    • 방송공학회논문지
    • /
    • 제25권5호
    • /
    • pp.808-811
    • /
    • 2020
  • 본 논문은 랜덤 무향 칼만 필터를 이용하여 키넥트 카메라 센서의 오차를 최소화하는 방법을 제안한다. RGB 값과 깊이(Depth) 정보를 제공하는 RGB+D 카메라는 센서의 오차로 인해 뻐대 검출 과정에서 성능 저하의 원인을 제공한다. 기존에는 다양한 필터링 기법을 이용하여 오차를 제거하였으나 비선형 잡음을 효과적으로 제거하는데 한계가 있었다. 이에 본 논문에서는 비선형 잡음 특성을 예측하고 업데이트하기 위해 랜덤 무향 칼만 필터를 적용하였으며 이를 바탕으로 뻐대 검출 성능을 높이고자 하였다. 실험 결과 제안한 방법은 기존의 방법에 비해 정량적 오차를 줄였으며 뼈대의 3D 검출 시 우수한 결과를 확인할 수 있었다.

RGB 이미지에서 트랜스포머 기반 고밀도 3D 재구성 (Transformer-based dense 3D reconstruction from RGB images)

  • 서가가;고서;문명운;조경은
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.646-647
    • /
    • 2022
  • Multiview stereo (MVS) 3D reconstruction of a scene from images is a fundamental computer vision problem that has been thoroughly researched in recent times. Traditionally, MVS approaches create dense correspondences by constructing regularizations and hand-crafted similarity metrics. Although these techniques have achieved excellent results in the best Lambertian conditions, traditional MVS algorithms still contain a lot of artifacts. Therefore, in this study, we suggest using a transformer network to accelerate the MVS reconstruction. The network is based on a transformer model and can extract dense features with 3D consistency and global context, which are necessary to provide accurate matching for MVS.

RGB 이미지를 이용한 관절 추정 네트워크와 결합된 FBX 형식 애니메이션 생성 시스템 (FBX Format Animation Generation System Combined with Joint Estimation Network using RGB Images)

  • 이유진;김상준;박구만
    • 방송공학회논문지
    • /
    • 제26권5호
    • /
    • pp.519-532
    • /
    • 2021
  • 최근 게임, 영화, 애니메이션 다양한 분야에서 모션 캡처를 이용하여 신체 모델을 구축하고 캐릭터를 생성하여 3차원 공간에 표출하는 콘텐츠가 증가하고 있다. 마커를 부착하여 관절의 위치를 측정하는 방법에서 촬영 장비에 대한 비용과 같은 문제를 보완하기 위해 RGB-D 카메라를 이용하여 애니메이션을 생성하는 연구가 진행되고 있지만, 관절 추정 정확도나 장비 비용의 문제가 여전히 존재한다. 이에 본 논문에서는 애니메이션 생성에 필요한 장비 비용을 줄이고 관절 추정 정확도를 높이기 위해 RGB 이미지를 관절 추정 네트워크에 입력하고, 그 결과를 3차원 데이터로 변환하여 FBX 형식 애니메이션으로 생성하는 시스템을 제안한다. 먼저 RGB 이미지에 대한 2차원 관절을 추정하고, 이 값을 이용하여 관절의 3차원 좌표를 추정한다. 그 결과를 쿼터니언으로 변환하여 회전한 후, FBX 형식의 애니메이션을 생성한다. 제안한 방법의 정확도 측정을 위해 신체에 마커를 부착하여 마커의 3차원 위치를 바탕으로 생성한 애니메이션과 제안된 시스템으로 생성한 애니메이션의 오차를 비교하여 시스템 동작을 입증하였다.

RGB-D 영상으로부터 형판 정합을 이용한 3차원 물체의 속성 인식 (Recognizing 3D Object's Attribute with Template Matching from RGB-D Images)

  • 김동하;김주희;엄태권;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.766-769
    • /
    • 2015
  • 본 논문에서는 컬러 영상과 깊이 영상으로부터 영상 전체의 정보를 활용하는 형판 정합 방법으로 특징을 추출하여, 사물의 속성을 인식하는 시스템을 제안한다. 본 시스템은 입력 영상으로부터 더 많은 정보를 얻기 위해 컬러 영상과 깊이 영상을 함께 사용하였다. 그리고 영상의 부분적인 정보가 아닌 전체 정보를 활용하는 형판 정합 방법을 사용하여 속성 인식률을 향상 시켰다. 본 시스템의 성능을 확인하기 위해 워싱턴 대학에서 제공하는 RGB-D 데이터 집합을 이용하여 다른 특징들 및 분류기와 비교실험을 진행하였고, 본 논문에서 제안하는 시스템의 높은 성능을 확인할 수 있었다.

단일 자연 영상에서 그림자 검출 및 제거를 위한 선형 회귀 기반의 1D 불변 영상 (Linear Regression-based 1D Invariant Image for Shadow Detection and Removal in Single Natural Image)

  • 박기홍
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권9호
    • /
    • pp.1787-1793
    • /
    • 2018
  • 그림자는 자연 경관에서 관찰되는 일반적인 현상이지만 물체 인식, 특징 검출 및 장면 분석등과 같은 영상 분석에 부정적인 영향을 미치는 요소이므로 디지털 영상에 포함된 그림자 처리는 디지털 영상 분석 과정에서 필수적으로 고려되어야 한다. 본 논문에서는 단일 자연 영상에 포함된 그림자를 검출하고 제거하기 위한 특징 요소 중의 하나인 1D 불변 영상의 획득을 위한 기존 방법들에 대해 기술하고, 선형 회귀 기반의 1D 불변 영상 획득 방법을 제안하였다. 제안하는 방법은 RGB 칼라 영상의 각 채널 간의 밴드 비의 로그를 계산한 후 선형 회귀를 통해 그레이스케일 영상 라인을 획득하고, 최종 1D 불변 영상은 밴드 비의 로그 영상들을 추정된 그레이스케일 영상 라인으로 투영시켜 획득하였다. 실험 결과, 제안하는 방법이 기존의 엔트로피 최소화 기반의 투영 각도를 계산하는 방법보다 계산 복잡도가 낮았으며, 1D 불변 영상을 이용한 그림자가 검출 및 제거가 효과적으로 수행됨을 보였다.

멀티-뷰 영상들을 활용하는 3차원 의미적 분할을 위한 효과적인 멀티-모달 특징 융합 (Effective Multi-Modal Feature Fusion for 3D Semantic Segmentation with Multi-View Images)

  • 배혜림;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권12호
    • /
    • pp.505-518
    • /
    • 2023
  • 3차원 포인트 클라우드 의미적 분할은 각 포인트별로 해당 포인트가 속한 물체나 영역의 분류 레이블을 예측함으로써, 포인트 클라우드를 서로 다른 물체들이나 영역들로 나누는 컴퓨터 비전 작업이다. 기존의 3차원 의미적 분할 모델들은 RGB 영상들에서 추출하는 2차원 시각적 특징과 포인트 클라우드에서 추출하는 3차원 기하학적 특징의 특성을 충분히 고려한 특징 융합을 수행하지 못한다는 한계가 있다. 따라서, 본 논문에서는 2차원-3차원 멀티-모달 특징을 이용하는 새로운 3차원 의미적 분할 모델 MMCA-Net을 제안한다. 제안 모델은 중기 융합 전략과 멀티-모달 교차 주의집중 기반의 융합 연산을 적용함으로써, 이질적인 2차원 시각적 특징과 3차원 기하학적 특징을 효과적으로 융합한다. 또한 3차원 기하학적 인코더로 PTv2를 채용함으로써, 포인트들이 비-정규적으로 분포한 입력 포인트 클라우드로부터 맥락정보가 풍부한 3차원 기하학적 특징을 추출해낸다. 본 논문에서는 제안 모델의 성능을 분석하기 위해 벤치마크 데이터 집합인 ScanNetv2을 이용한 다양한 정량 및 정성 실험들을 진행하였다. 성능 척도 mIoU 측면에서 제안 모델은 3차원 기하학적 특징만을 이용하는 PTv2 모델에 비해 9.2%의 성능 향상을, 2차원-3차원 멀티-모달 특징을 사용하는 MVPNet 모델에 비해 12.12%의 성능 향상을 보였다. 이를 통해 본 논문에서 제안한 모델의 효과와 유용성을 입증하였다.

실감미디어 기반의 콘텐츠를 위한 카메라 시스템의 구현 (A New Camera System Implementation for Realistic Media-based Contents)

  • 서영호;이윤혁;구자명;김우열;김보라;김문석;김동욱
    • 디지털산업정보학회논문지
    • /
    • 제9권2호
    • /
    • pp.99-109
    • /
    • 2013
  • In this paper, we propose a new system which captures real depth and color information from natural scene and implemented it. Based on it, we produced stereo and multiview images for 3-dimensional stereoscopic contents and introduced the production of a digital hologram which is considered to the next-generation image. The system consists of both a camera system for capturing images which correspond to RGB and depth images and softwares (SWs) for various image processings which consist of pre-processing such as rectification and calibration, 3D warping, and computer generated hologram (CGH). The camera system use a vertical rig with two paris of depth and RGB camera and a specially manufactured cold mirror which has the different transmittance according to wavelength for obtaining images with the same view point. The wavelength of our mirror is about 850nm. Each algorithm was implemented using C and C++ and the implemented system can be operated in real-time.

색상 보정을 통한 3차원 TV의 입체영상 화질 개선 (3D Video Quality Improvement for 3D TV using Color Compensation)

  • 정길수;강민성;김동현;손광훈
    • 방송공학회논문지
    • /
    • 제15권6호
    • /
    • pp.757-767
    • /
    • 2010
  • 본 논문은 3차원 TV 시청에 있어서, 2차원에서와 같은 색감을 최대한 제공하기 위한 방법을 연구하였다. 이를 위하여 입력 RGB 색상 막대(color bar) 영상을 기준으로 2차원과 3차원 재생시 재현되는 RGB 강도의 입출력 관계를 모델링하였으며, 이를 근거로 2차원 대비 보정되어야 할 3차원 색상 사상표(mapping table)를 생성하였다. 생성된 사상표를 기존 3차원 TV 시스템의 출력부에 추가하여, 일반 2차원 재생시에는 입력 영상을 우회(bypass)하도록 하고, 3차원 재생시 색상 보정 과정을 수행하도록 하여 3차원 재생시에도 2차원에서 느낄 수 있는 색감을 재현할 수 있도록 하였다.

A New Method for Color Feature Representation of Color Image in Content-Based Image Retrieval Projection Maps

  • 김원일
    • 정보통신설비학회논문지
    • /
    • 제9권2호
    • /
    • pp.73-79
    • /
    • 2010
  • The most popular technique for image retrieval in a heterogeneous collection of color images is the comparison of images based on their color histogram. The color histogram describes the distribution of colors in the color space of a color image. In the most image retrieval systems, the color histogram is used to compute similarities between the query image and all the images in a database. But, small changes in the resolution, scaling, and illumination may cause important modifications of the color histogram, and so two color images may be considered to be very different from each other even though they have completely related semantics. A new method of color feature representation based on the 3-dimensional RGB color map is proposed to improve the defects of the color histogram. The proposed method is based on the three 2-dimensional projection map evaluated by projecting the RGB color space on the RG, GB, and BR surfaces. The experimental results reveal that the proposed is less sensitive to small changes in the scene and that achieve higher retrieval performances than the traditional color histogram.

  • PDF

RGB-D 영상을 이용한 강건한 실시간 시각 주행 거리 측정 (Robust Real-Time Visual Odometry Estimation from RGB-D Images)

  • 김주희;김혜숙;김동하;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.825-828
    • /
    • 2014
  • 본 논문에서는 3차원 공간에서 6자유도로 움직이는 카메라의 실시간 포즈를 추적하기 위해, RGB-D 입력 영상들로부터 카메라의 실시간 주행 거리를 효과적으로 계산할 수 있는 시각 주행 거리 측정기를 제안한다. 본 논문에서 제안하는 시각 주행 거리 측정기에서는 컬러 영상과 깊이 영상의 풍부한 정보를 충분히 활용하면서도 실시간 계산량을 줄이기 위해, 특징점 위주의 저밀도 주행 거리 계산 방법을 사용한다. 또한, 본 시스템에서는 정확도 향상을 위해, 정합된 특징점들에 대한 추가적인 정상 집합정제 과정과 이들을 이용한 주행 거리 정제 작업을 반복하도록 설계하였다. TUM 대학의 벤치마크 데이터 집합을 이용하여 다양한 성능 분석 실험을 수행하였고, 이를 통해 본 논문에서 제안하는 시각 주행 거리 측정기의 높은 성능을 확인할 수 있었다.