• 제목/요약/키워드: RGB-D

검색결과 336건 처리시간 0.027초

RGB 비디오 압축 부호화의 효율 개선을 위한 적응적 기저 색평면 필터링 기법 (Base plane adaptive filtering for inter plane prediction in RGB video coding)

  • 최장원;정진우;김양수;최윤식
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.294-296
    • /
    • 2010
  • 일반적으로, RGB 영상의 높은 주파수 영역은 잡음으로 인해 색평면 간 서로 낮은 상관도를 가지고 있기 때문에 이러한 고주파수 성분은 색평면 간 예측의 효율을 저하시키는 원인이 된다. 본 논문에서는 RGB 비디오 코딩에서 색평면 간 예측의 효율을 높이기 위해 기저 색평면을 적응적으로 필터링 하는 방법을 제안한다. 색평면 간 상관도에 따라 적응적으로 기저 색평면을 필터링함으로써 색평면 간 예측 성능을 높일 수 있었다. 본 논문에서 제안하는 알고리즘을 통해 우리는 H.264/AVC High 4:4:4 Intra Profile에 비해 평균 14.71%의 비트율 감소와 0.93dB의 PSNR 향상 결과를 얻을 수 있었다.

  • PDF

컬러 영상의 RGB 화소 최대차분 기반 보간법을 이용한 정보은닉 기법 (Information Hiding Method based on Interpolation using Max Difference of RGB Pixel for Color Images)

  • 이준호;김평한;정기현;유기영
    • 한국멀티미디어학회논문지
    • /
    • 제20권4호
    • /
    • pp.629-639
    • /
    • 2017
  • Interpolation based information hiding methods are widely used to get information security. Conventional interpolation methods use the neighboring pixel value and simple calculation like average to embed secret bit stream into the image. But these information hiding methods are not appropriate to color images like military images because the characteristics of military images are not considered and these methods are restricted in grayscale images. In this paper, the new information hiding method based on interpolation using RGB pixel values of color image is proposed and the effectiveness is analyzed through experiments.

모바일 환경에서 점 구름 데이터에 대한 효과적인 광선 추적 기반 렌더링 기법 (Effective Ray-tracing based Rendering Methods for Point Cloud Data in Mobile Environments)

  • 서웅;김영욱;박기서;김예린;임인성
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권3호
    • /
    • pp.93-103
    • /
    • 2023
  • 컴퓨터 그래픽스 분야에서 저가의 RGB-D 카메라로 촬영된 색상 및 깊이 영상을 이용한 사람 및 사물을 3차원 모델로 복원하는 문제는 오랫동안 이를 해결하기 위하여 다양한 연구들이 진행되어왔다. 저가의 RGB-D 카메라로 촬영된 색상 및 깊이 영상은 3차원 공간에서 점 구름 형태로 다루어지며, 이는 연속적인 3차원 공간상에 이산적인 값을 대응시키기 때문에 다면체 모델을 이용한 렌더링에 비해 추가적인 표면 재구성 과정이 필요하다. 본 논문에서는 다면체 모델이 아닌 점 구름을 시각화하기 위한 효과적인 광선 추적 기반 렌더링 기법을 제안한다. 특히 프로세서의 발열과 배터리 문제로 인한 모바일 환경에서의 제한적인 성능에서도 효과적인 렌더링 기법으로서의 가능성을 보인다.

컬러맵의 생성과 컬러맵간의 결합 방법 (Colormap Construction and Combination Method between Colormaps)

  • 김진홍;조철효;김두영
    • 한국정보처리학회논문지
    • /
    • 제1권4호
    • /
    • pp.541-550
    • /
    • 1994
  • True Color 영상은 전송 및 저장에 많은 데이터 량이 필요하지만, 적은 데이터를 가지고 컬러 모니터에 나타낼 때 인간 시각에 별무리없이 나타내고자 한다. 본 논문 에서는 RGB, YIQ/YUV 공간에서 256개의 컬러맵 생성 방법과 서로 다른 컬러맵을 한 화면에 동시에 표시하면 원 컬러 영상과 다르게 나타나므로 컬러맵간을 결합하여 공 통되는 컬러맵 표현 방법을 제시한다. RGB, YIQ/YUV 공간상에서 처리된 결과를 비교하 기 위해 PSNR, 표준편차, Sobel연산자를 이용한 에지보존율로서 측정하였다. 처리시간 은 새로운 컬러맵 생성은 3초, 컬러맵간의 결합은 2초 소요되었다. PSNR 값은 RGB 공 간이 YIQ 공간과 YUV 공간보다 평균적으로 0.15, 0.34[dB] 정도 높고, 표준편차는 평균적으로 0.15, 0.41정도 낮았다. 그러나 데이타 압축 면에서 YIQ/YUV공간은 색상 부분에서 8비트중 4비트만을 사용하였기 때문에, RGB 공간보다 1/3정도 압축 효율을 나타낸다.

  • PDF

RGB-D 환경인식 시각 지능, 목표 사물 경로 탐색 및 심층 강화학습에 기반한 사람형 로봇손의 목표 사물 파지 (Grasping a Target Object in Clutter with an Anthropomorphic Robot Hand via RGB-D Vision Intelligence, Target Path Planning and Deep Reinforcement Learning)

  • 류가현;오지헌;정진균;정환석;이진혁;;김태성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권9호
    • /
    • pp.363-370
    • /
    • 2022
  • 다중 사물 환경에서 목표 사물만의 정밀한 파지를 위해서는 장애물과의 충돌 회피 지능과 정교한 파지 지능이 필요하다. 이 작업을 위해선 다중 사물 환경 인지, 목표 사물 인식, 경로 설정, 로봇손의 사물 파지 지능이 필요하다. 본 연구에서는 RGB-D 영상 센서를 이용하여 다중 사물 환경과 사물을 인지하고 3D 공간을 매핑한 후, 충돌 회피 경로 탐색 알고리즘을 활용하여 목표 사물까지의 경로를 탐색 및 설정하고, 강화학습을 통해 학습된 사람형 로봇손의 목표 사물 파지 지능을 활용해 최종적으로 시뮬레이션 및 하드웨어 사물 파지 시스템을 구현하고 검증하였다. 사람형 로봇손을 구현한 시뮬레이션 환경에서 5개의 사물 중 목표 사물을 지정하고 파지한 결과 경로 탐색 없는 파지 시스템이 평균 78.8%의 성공률과 34%의 충돌률을 보일 때, 경로 탐색 지능과 결합된 시스템은 평균 94%의 성공률과 평균 20%의 충돌률을 보였다. UR3와 QB-Soft Hand를 사용한 하드웨어 환경에서는 3개의 사물 중 목표 사물을 지정하고 파지한 결과 경로 탐색 없는 파지 시스템이 평균 30%의 성공률과 97%의 충돌률을 보일 때, 경로 탐색 지능과 결합된 시스템은 평균 90%의 성공률과 평균 23%의 충돌률을 보였다. 본 연구에서는 RGB-D 시각 지능, 충돌 회피 경로 탐색, 사물 파지 심층 강화학습 지능의 결합을 통하여, 사람형 로봇손의 목표 사물 파지가 가능함을 제시하였다.

RGB-D 이미지에서 인체 영역 검출을 위한 프레임워크 (A Framework for Human Body Parts Detection in RGB-D Image)

  • 홍성진;김명규
    • 한국멀티미디어학회논문지
    • /
    • 제19권12호
    • /
    • pp.1927-1935
    • /
    • 2016
  • This paper propose a framework for human body parts in RGB-D image. We conduct tasks of obtaining person area, finding candidate areas and local detection in order to detect hand, foot and head which have features of long accumulative geodesic distance. A person area is obtained with background subtraction and noise removal by using depth image which is robust to illumination change. Finding candidate areas performs construction of graph model which allows us to measure accumulative geodesic distance for the candidates. Instead of raw depth map, our approach constructs graph model with segmented regions by quadtree structure to improve searching time for the candidates. Local detection uses HOG based SVM for each parts, and head is detected for the first time. To minimize false detections for hand and foot parts, the candidates are classified with upper or lower body using the head position and properties of geodesic distance. Then, detect hand and foot with the local detectors. We evaluate our algorithm with datasets collected Kinect v2 sensor, and our approach shows good performance for head, hand and foot detection.

색상 보정을 통한 3DTV의 입체영상 화질 개선 방법 (3D Quality Improvement Method for 3DTV using Color Compensation)

  • 정길수;강민성;김동현;손광훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.220-223
    • /
    • 2010
  • 최근 연이은 3D 영화의 성공에 힘입어 영화 산업계를 중심으로 3D 콘텐츠 생성이 늘고 있으며, 이를 가정 내에서도 즐길 수 있도록 다양한 3DTV가 출시되고 있다. 그러나 3DTV의 특성 상 3D 재생 시 밝기 저하에 따른 색 재현 문제로 인하여 입체감과 공간감을 느끼는 대신 2D에서의 화려한 색감을 만끽할 수 없게 되었다. 이에 본 논문은 3D 시청 시에도 2D에서와 같은 색감을 최대한 제공하기 위한 방법에 대해 연구하였다. 이를 위하여 3DTV를 활용하여 입력 RGB 영상에 대하여 2D와 3D 재생 시 재현되는 RGB intensity를 측정한 후 입출력에 따른 관계 모델링을 실시하였고, 모델링에 근거하여 3D 재생 시 2D 대비 보정되어야 할 색상 요소에 대한 매핑 테이블(mapping table)을 생성하였다. 생성된 매핑 테이블은 기존 3DTV 시스템의 출력부에 3D 색상 보정 모듈로써 추가하도록 하여 일반 2D 재생 시에는 입력영상이 바이패스(bypass)되도록 하고, 3D 재생 시에는 본 논문에 의한 3D 색상 보정용 매핑 테이블을 통해 색상 보정 과정을 수행하도록 하여 3D 재생 시에도 2D에서 느낄 수 있는 색감을 재현할 수 있도록 하였다.

  • PDF

사용후핵연료집합체 영상에서 핵연료봉 영상 추출방법과 색상정보의 가시화에 관한 연구 (Study on an Extraction Method for a Fuel Rod Image and a Visualization of the Color Information in a Sectional Image of a Spent Fuel Assembly)

  • 장지운;신희성;윤청;김호동
    • 비파괴검사학회지
    • /
    • 제27권5호
    • /
    • pp.432-441
    • /
    • 2007
  • 사용후핵연료집합체 이미지 영상에서 핵연료봉 영상을 추출할 수 있는 영상처리기법과 RGB 색상 데이터를 추출하여 가시화하는 방안에 대해 연구하였다. 핵연료봉 영상 추출방법으로서 히스토그램 분석, 경계선 검출 및 RGB 색상정보를 이용하였다. 그 결과 히스토그램 분석을 통해 사용후핵연료집합체의 크기를 파악할 수 있었고 경계선 검출을 통해 사용후핵연료봉의 형상을 관측할 수 있었다. 그리고 최종적으로 color 값을 이용한 3d 입체영상을 구현함으로써 핵연료집합체 상태에 대한 다양한 분석이 이루어졌다.

Human Action Recognition Via Multi-modality Information

  • Gao, Zan;Song, Jian-Ming;Zhang, Hua;Liu, An-An;Xue, Yan-Bing;Xu, Guang-Ping
    • Journal of Electrical Engineering and Technology
    • /
    • 제9권2호
    • /
    • pp.739-748
    • /
    • 2014
  • In this paper, we propose pyramid appearance and global structure action descriptors on both RGB and depth motion history images and a model-free method for human action recognition. In proposed algorithm, we firstly construct motion history image for both RGB and depth channels, at the same time, depth information is employed to filter RGB information, after that, different action descriptors are extracted from depth and RGB MHIs to represent these actions, and then multimodality information collaborative representation and recognition model, in which multi-modality information are put into object function naturally, and information fusion and action recognition also be done together, is proposed to classify human actions. To demonstrate the superiority of the proposed method, we evaluate it on MSR Action3D and DHA datasets, the well-known dataset for human action recognition. Large scale experiment shows our descriptors are robust, stable and efficient, when comparing with the-state-of-the-art algorithms, the performances of our descriptors are better than that of them, further, the performance of combined descriptors is much better than just using sole descriptor. What is more, our proposed model outperforms the state-of-the-art methods on both MSR Action3D and DHA datasets.

RGB-D 정보를 이용한 2차원 키포인트 탐지 기반 3차원 인간 자세 추정 방법 (A Method for 3D Human Pose Estimation based on 2D Keypoint Detection using RGB-D information)

  • 박서희;지명근;전준철
    • 인터넷정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.41-51
    • /
    • 2018
  • 최근 영상 감시 분야에서는 지능형 영상 감시 시스템에 딥 러닝 기반 학습 방법이 적용되어 범죄, 화재, 이상 현상과 같은 다양한 이벤트들을 강건하게 탐지 할 수 있게 되었다. 그러나 3차원 실세계를 2차원 영상으로 투영시키면서 발생하는 3차원 정보의 손실로 인하여 폐색 문제가 발생하기 때문에 올바르게 객체를 탐지하고, 자세를 추정하기 위해서는 폐색 문제를 고려하는 것이 필요하다. 따라서 본 연구에서는 기존 RGB 정보에 깊이 정보를 추가하여 객체 탐지 과정에서 나타나는 폐색 문제를 해결하여 움직이는 객체를 탐지하고, 탐지된 영역에서 컨볼루션 신경망을 이용하여 인간의 관절 부위인 14개의 키포인트의 위치를 예측한다. 그 다음 자세 추정 과정에서 발생하는 자가 폐색 문제를 해결하기 위하여 2차원 키포인트 예측 결과와 심층 신경망을 이용하여 자세 추정의 범위를 3차원 공간상으로 확장함으로써 3차원 인간 자세 추정 방법을 설명한다. 향후, 본 연구의 2차원 및 3차원 자세 추정 결과는 인간 행위 인식을 위한 용이한 데이터로 사용되어 산업 기술 발달에 기여 할 수 있다.