• 제목/요약/키워드: RGB-D 영상

검색결과 138건 처리시간 0.027초

소수의 협소화각 RGBD 영상으로부터 360 RGBD 영상 합성 (360 RGBD Image Synthesis from a Sparse Set of Images with Narrow Field-of-View)

  • 김수지;박인규
    • 방송공학회논문지
    • /
    • 제27권4호
    • /
    • pp.487-498
    • /
    • 2022
  • 깊이 영상은 3차원 공간상의 거리 정보를 2차원 평면에 나타낸 영상이며 다양한 3D 비전 연구에서 유용하게 사용된다. 기존의 많은 깊이 추정 연구는 주로 좁은 FoV (Field of View) 영상을 사용하여 전체 장면 중 상당 부분이 소실된 영상에 대한 깊이 정보를 추정한다. 본 논문에서는 소수의 좁은 FoV 영상으로부터 360° 전 방향 RGBD 영상을 동시에 생성하는 기법을 제안한다. 오버랩 되지 않는 4장의 소수 영상으로부터 전체 파노라마 영상에 대해서 상대적인 FoV를 추정하고 360° 컬러 영상과 깊이 영상을 동시에 생성하는 적대적 생성 신경망 기반의 영상 생성 모델을 제안하였으며, 두 모달리티의 특징을 공유하여 상호 보완된 결과를 확인한다. 또한 360° 영상의 구면 특성을 반영한 네트워크를 구성하여 개선된 성능을 보인다.

RGB 채널 표준 편차의 최적화를 통한 광원 색도 추정 (Illuminant Chromaticity Estimation via Optimization of RGB Channel Standard Deviation)

  • 시부다스 수브하스다스 카타카릴;유지훈;하영호
    • 전자공학회논문지
    • /
    • 제53권6호
    • /
    • pp.110-121
    • /
    • 2016
  • 색 항상성 알고리즘의 주된 목적은 광원의 색도를 추정하는 것으로, 최근 통계 기반과 학습 기반 및 통계와 학습의 조합 기반의 색 항상성 알고리즘들이 다양하게 연구되고 있다. 통계 기반 알고리즘은 특정 가정을 만족하는 영상들에 대해서만 수행이 가능하고, 학습 기반 알고리즘은 정확한 전처리와 학습 데이터가 요구되는 복잡한 방법이다. 그리고 통계와 학습의 조합 기반 알고리즘은 사전에 결정되거나 동적으로 변하는 가중치에 따라 결과가 의존적이기 때문에, 이를 정의하기 어려울 뿐만 아니라 에러에도 민감하다. 따라서 본 논문은 복잡한 전처리를 요구하지 않으며, 다양한 환경 조건 하에서 광원 추정이 가능한 새로운 최적화 방법을 제안한다. 영상 내에서 광원의 영향이 강하게 미치는 부분은 한 채널의 표준 편차가 나머지 두 채널에 비해 큰 차이를 가진다. 이 가정을 기반으로, 광원 정도(DIT, degree of illumiinant tinge)라고 불리는 비용 함수는 광원이 보정된 영상의 질을 결정하기 위해 제안된다. 표준 광원(d65) 하의 영상이 다른 광원 하의 영상에 비해 더 작은 DIT 값을 가진다. 본 논문에서 군집단 최적화(PSO, particle swarm optimization) 기반의 집단지성(swarm intelligence)은 DIT를 최소화하기 위해, 주어진 영상의 최적 광원을 찾는데 사용된다. 제안한 방법은 실세계 데이터셋을 통해 평가하였고, 실험 결과는 제안된 방법의 효율성을 입증하였다.

RGB-D 환경인식 시각 지능, 목표 사물 경로 탐색 및 심층 강화학습에 기반한 사람형 로봇손의 목표 사물 파지 (Grasping a Target Object in Clutter with an Anthropomorphic Robot Hand via RGB-D Vision Intelligence, Target Path Planning and Deep Reinforcement Learning)

  • 류가현;오지헌;정진균;정환석;이진혁;;김태성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권9호
    • /
    • pp.363-370
    • /
    • 2022
  • 다중 사물 환경에서 목표 사물만의 정밀한 파지를 위해서는 장애물과의 충돌 회피 지능과 정교한 파지 지능이 필요하다. 이 작업을 위해선 다중 사물 환경 인지, 목표 사물 인식, 경로 설정, 로봇손의 사물 파지 지능이 필요하다. 본 연구에서는 RGB-D 영상 센서를 이용하여 다중 사물 환경과 사물을 인지하고 3D 공간을 매핑한 후, 충돌 회피 경로 탐색 알고리즘을 활용하여 목표 사물까지의 경로를 탐색 및 설정하고, 강화학습을 통해 학습된 사람형 로봇손의 목표 사물 파지 지능을 활용해 최종적으로 시뮬레이션 및 하드웨어 사물 파지 시스템을 구현하고 검증하였다. 사람형 로봇손을 구현한 시뮬레이션 환경에서 5개의 사물 중 목표 사물을 지정하고 파지한 결과 경로 탐색 없는 파지 시스템이 평균 78.8%의 성공률과 34%의 충돌률을 보일 때, 경로 탐색 지능과 결합된 시스템은 평균 94%의 성공률과 평균 20%의 충돌률을 보였다. UR3와 QB-Soft Hand를 사용한 하드웨어 환경에서는 3개의 사물 중 목표 사물을 지정하고 파지한 결과 경로 탐색 없는 파지 시스템이 평균 30%의 성공률과 97%의 충돌률을 보일 때, 경로 탐색 지능과 결합된 시스템은 평균 90%의 성공률과 평균 23%의 충돌률을 보였다. 본 연구에서는 RGB-D 시각 지능, 충돌 회피 경로 탐색, 사물 파지 심층 강화학습 지능의 결합을 통하여, 사람형 로봇손의 목표 사물 파지가 가능함을 제시하였다.

토마토 위치 및 자세 추정을 위한 데이터 증대기법 (Data Augmentation for Tomato Detection and Pose Estimation)

  • 장민호;황영배
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.44-55
    • /
    • 2022
  • 농업 관련 방송 콘텐츠에서 과일에 대한 자동적인 정보 제공을 위해서 대상 과일의 인스턴스 영상 분할이 요구된다. 또한, 해당 과일에 대한 3차원 자세에 대한 정보 제공도 의미있게 사용될 수 있다. 본 논문에서는 영상 콘텐츠에서 토마토에 대한 정보를 제공하는 연구를 다룬다. 인스턴스 영상 분할 기법을 학습하기 위해서는 다량의 데이터가 필요하지만 충분한 토마토 학습데이터를 얻기는 힘들다. 따라서 적은 양의 실사 영상을 바탕으로 데이터 증대기법을 통해 학습 데이터를 생성하였다. 실사 영상만을 통한 학습 결과 정확도에 비해서, 전경과 배경을 분리해서 만들어진 합성 영상을 통해 학습한 결과, 기존 대비 성능이 향상되는 것을 확인하였다. 영상 전처리 기법들을 활용해서 만들어진 영상을 사용한 데이터 증대 영상의 학습 결과, 전경과 배경을 분리한 합성 영상보다 높은 성능을 얻는 것을 확인하였다. 객체 검출 후 자세 추정을 하기 위해 RGB-D 카메라를 이용하여 포인트 클라우드를 획득하였고 최소제곱법을 이용한 실린더 피팅을 진행하였고, 실린더의 축 방향을 통해 토마토 자세를 추정하였다. 우리는 다양한 실험을 통해서 대상 객체에 대한 검출, 인스턴스 영상 분할, 실린더 피팅의 결과가 의미있게 나타난다는 것을 보였다.

모바일 디바이스를 이용한 3차원 특징점 추출 기법 (3D feature point extraction technique using a mobile device)

  • 김진겸;서영호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.256-257
    • /
    • 2022
  • 본 논문에서는 단일 모바일 디바이스의 움직임을 통해 3차원 특징점을 추출하는 방법에 대해 소개한다. 단안 카메라를 이용해 카메라 움직임에 따라 2D 영상을 획득하고 Baseline을 추정한다. 특징점 기반의 스테레오 매칭을 진행한다. 특징점과 디스크립터를 획득하고 특징점을 매칭한다. 매칭된 특징점을 이용해 디스패리티를 계산하고 깊이값을 생성한다. 3차원 특징점은 카메라 움직임에 따라 업데이트 된다. 마지막으로 장면 전환 검출을 이용하여 장면 전환시 특징점을 리셋한다. 위 과정을 통해 특징점 데이터베이스에 평균 73.5%의 저장공간 추가 확보를 할 수 있다. TUM Dataset의 Depth Ground truth 값과 RGB 영상으로 제안한 알고리즘을 적용하여 3차원 특징점 결과와 비교하여 평균 26.88mm의 거리 차이가 나는것을 확인하였다.

  • PDF

칼라 코드의 영역 분할을 위한 성분 영상들의 최적 조합 (Optimal Combination of Component Images for Segmentation of Color Codes)

  • 권병훈;유현중;김태우;김기두
    • 대한전자공학회논문지SP
    • /
    • 제42권1호
    • /
    • pp.33-42
    • /
    • 2005
  • 칼라 화소 성분들은 인쇄에서부터 획득하기까지의 전 과정에 거쳐 심하게 왜곡되기 때문에, 획득된 영상에서 정확한 칼라 정보를 필요로 하는 칼라 코트 식별 작업은 매우 어렵다. 정확한 칼라 식별을 달성하기 위해서는 서로 다른 칼라 영역들을 정화하게 분리해냄으로써 어떤 칼라 영역의 부분이 아닌 전체 화소들에 대한 통계적 처리를 가능하게 하는 영역 분할 기술이 필요하다. 칼라 영역 분한은 성분 영상(들)에 대한 경계선 검출을 수행하여 달성할 수 있다. 이 논문에서는 RGB, HSI, YIQ의 세 칼라 모델로부터의 성분 영상들에 대해 독립적으로 경계선을 검출하고, 결합에 의해 가장 완전한 경계선 영상을 제공하는 한쌍의 성분을 찾아내기 위한 수학적 분석과 실험을 수행하였다. 실험 결과, Y-와 R-성분 경계선 영상들을 결합했을 때 가장 좋은 결과를 얻을 수 있었다.

RGB 공간상의 국부 영역 블럭을 이용한 칼라 영상 양자화 (Color Image Quantization Using Local Region Block in RGB Space)

  • 박양우;이응주;김기석;정인갑;하영호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1995년도 학술대회
    • /
    • pp.83-86
    • /
    • 1995
  • Many image display devices allow only a limited number of colors to be simultaneously displayed. In displaying of natural color image using color palette, it is necessary to construct an optimal color palette and map each pixel of the original image to a color palette with fast. In this paper, we proposed the clustering algorithm using local region block centered one color cluster in the prequantized 3-D histogram. Cluster pairs which have the least distortion error are merged by considering distortion measure. The clustering process is continued until to obtain the desired number of colors. Same as the clustering process, original color image is mapped to palette color via a local region block centering around prequantized original color value. The proposed algorithm incorporated with a spatial activity weighting value which is smoothing region. The method produces high quality display images and considerably reduces computation time.

RGB 공간상의 국부 영역 블록의 왜곡척도를 고려한 칼라 영상 양자화 (Color image quantization considering distortion measure of local region block on RGB space)

  • 박양우;이응주;김경만;엄태억;하영호
    • 한국통신학회논문지
    • /
    • 제21권4호
    • /
    • pp.848-854
    • /
    • 1996
  • Many image display devices allow only a limited number of colors to be simultaneously displayed. in disphaying of natural color image using color palette, it is necessary to construct an optimal color palette and the optimal mapping of each pixed of the original image to a color from the palette. In this paper, we proposed the clustering algorithm using local region block centered one color cluster in the prequantized 3-D histogram. Cluster pairs which have the least distortion error are merged by considering distortion measure. The clustering process is continued until to obtain the desired number of colors. The same as the clustering process, original color value. The proposed algorithm incroporated with a spatial activity weighting value which is reflected sensitivity of HVS quantization errors in smoothing region. This method produces high quality display images and considerably reduces computation time.

  • PDF

UAV 기반 열적외선 카메라를 이용한 태양광 모듈 고장진단 실험 (Test of Fault Detection to Solar-Light Module Using UAV Based Thermal Infrared Camera)

  • 이근상;이종조
    • 한국지리정보학회지
    • /
    • 제19권4호
    • /
    • pp.106-117
    • /
    • 2016
  • 최근 환경보호와 신재생에너지 확보 일환으로 태양광발전소가 널리 보급되고 있으며, 태양광 모듈의 효율적인 관리를 위해서는 정기적인 점검이 필요하다. 본 연구에서는 UAV 기반 열적외선 카메라와 GIS 공간분석을 통해 태양광 모듈에 대한 고장여부를 진단할 수 있는 실험을 실시하였다. 먼저 고정익 UAV와 RGB 카메라를 이용하여 영상을 촬영한 후 Pix4D SW를 통해 정사영상을 생성하였으며, 정사영상 자료를 이용하여 태양광 모듈 레이어를 구축한 후 코드를 입력하였다. 또한 태양광 모듈 고장여부를 진단하기 위해 고무덮개를 태양광 모듈에 설치하였으며, 열적외선 카메라로부터 얻어진 온도 정보와 태양광 모듈 레이어를 기반으로 Zonalmean 함수를 통해 태양광 모듈별 평균온도를 계산할 수 있었다. 마지막으로 GIS 공간분석을 통해 이상 발열이 확인된 $37^{\circ}C$ 이상의 모듈을 자동으로 추출하고 각 모듈별 고유식별 코드를 식별함으로써 고무 덮개를 설치한 모듈의 위치를 정확하게 분석할 수 있었다.

칼라 영상 객체 분할을 이용한 게임 콘텐츠 분류 서비스 방안에 관한 연구 (A Study on Game Contents Classification Service Method using Image Region Segmentation)

  • 박창민
    • 서비스연구
    • /
    • 제5권2호
    • /
    • pp.103-110
    • /
    • 2015
  • 최근, 3D FPS 게임에서 캐릭터의 분류는 매우 중요한 문제로 떠오르고 있다. 본 연구에서는 간단한 조작으로 의미객체의 화상 영역 분할을 이용한 게임 콘텐츠 분류 방법을 제안한다. 이 방법에서는, 우선 비선형 RGB 컬러 모델과 컬러양자화 방식을 사용했다. 입력 화상은 20개 미만 양자화 된 색을 표현하고 의미 있는 적은 수의 컬러 히스토그램을 사용한다. 그리고, 적은 블록으로 분할 된 이미지는 블록 단위 컬러 히스토그램 교차로 인접 블록과의 유사도를 계산한다. 왜냐하면, 질감 및 대상 블록의 경계에 있어서, 추출 블록 경계를 제외한 나머지를 사용하기 때문이다. 게임 오브젝트는 이들 방법에 에 의해 블록 경계 영역을 설정하고 FPS 게임 플레이에 사용될 수 있다. 실험을 통해, 우리는 각각의 기능을 사용하여 분류 방법에 대해 80% 이상의 정확도를 얻을 수 있었다. 따라서, 이 특성을 이용하여 게임콘텐츠를 효율적으로 분류 할 수 있고, 이는 게임 속도와 전략적 행동에 보다 나은 결과를 초래할 것으로 예상한다.