• 제목/요약/키워드: RGB coordinate

검색결과 41건 처리시간 0.022초

Stereo Vision Based 3-D Motion Tracking for Human Animation

  • Han, Seung-Il;Kang, Rae-Won;Lee, Sang-Jun;Ju, Woo-Suk;Lee, Joan-Jae
    • 한국멀티미디어학회논문지
    • /
    • 제10권6호
    • /
    • pp.716-725
    • /
    • 2007
  • In this paper we describe a motion tracking algorithm for 3D human animation using stereo vision system. This allows us to extract the motion data of the end effectors of human body by following the movement through segmentation process in HIS or RGB color model, and then blob analysis is used to detect robust shape. When two hands or two foots are crossed at any position and become disjointed, an adaptive algorithm is presented to recognize whether it is left or right one. And the real motion is the 3-D coordinate motion. A mono image data is a data of 2D coordinate. This data doesn't acquire distance from a camera. By stereo vision like human vision, we can acquire a data of 3D motion such as left, right motion from bottom and distance of objects from camera. This requests a depth value including x axis and y axis coordinate in mono image for transforming 3D coordinate. This depth value(z axis) is calculated by disparity of stereo vision by using only end-effectors of images. The position of the inner joints is calculated and 3D character can be visualized using inverse kinematics.

  • PDF

Design of Mobile Display Color Control Algorithm Using Red and Blue Color Emphasis with Skin Color Protection

  • Ha Joo-Young;Kim Joo-Hyun;Yang Hoon-Gee;Kang Bong-Soon
    • 한국통신학회논문지
    • /
    • 제31권3C
    • /
    • pp.264-270
    • /
    • 2006
  • In this paper, we propose the modified display color control system using white point line, boundary lines and S-shaped curves to emphasize blue and red tone colors on CIE1931 diagram. The proposed system divides RGB gamut into movable area and non-movable area by using boundary lines. The colors in movable area are moved into right side or left side along quadratic curve to change the bluish (or reddish) color to more bluish (or more reddish), while those in non-movable area are excepted from color control to prevent skin color from changing. The loci of the quadratic curves are very similar to the arc of the white-point line which connects all points that represent the chromaticities of a black body radiator at different temperatures and is also called the black body locus. The RGB gamut extension by movement of chromaticity coordinate can improve color reproducibility. Therefore in the case of application to LCD, the display shows excellent performance because the LCD's color reproducibility is comparatively lower than that of other display systems. The proposed system is also experimentally demonstrated with Xilinx Virtex FPGA XCV2000E- 6BG560 and the TV set.

피부색소 흡수 스펙트럼을 이용한 카메라 RGB 신호의 피부색 성분 분석 (Analysis of Skin Color Pigments from Camera RGB Signal Using Skin Pigment Absorption Spectrum)

  • 김정엽
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권1호
    • /
    • pp.41-50
    • /
    • 2022
  • 본 논문에서는 멜라닌과 헤모글로빈 등의 피부 색상을 구성하는 주요한 요소들을 카메라의 RGB 신호로부터 직접 계산하는 방법을 제안한다. 피부 색상의 주요한 요소들은 통상적으로 특정한 장비를 이용하여 분광 반사도를 측정하고, 측정된 빛의 일부 파장에서의 값들을 중심으로 재구성하는 방법을 사용한다. 이와 같은 방법으로 산출된 값들은 멜라닌 지수, 홍반 지수와 같은 것들이 있으며, 분광반사도 측정 장치나 다중스펙트럼 카메라 등의 특수한 장비를 필요로 한다. 일반적인 디지털 카메라로부터 이와 같은 성분요소들에 대한 직접적인 계산방법은 찾아보기 어려우며, 독립성분 분석(Independent Component Analysis)을 이용하여 멜라닌과 헤모글로빈의 농도를 간접적으로 계산하는 방법은 제안되어 있다. 이 방법은 일정한 RGB 영상의 영역을 대상으로 하여, 주성분 분석(Principal Component Analysis)과 유사한 방식으로 멜라닌과 헤모글로빈의 특성벡터를 추출하고, 농도를 계산할 수 있다. 이 방법의 단점은 일정한 영역의 화소 그룹을 입력으로 이용하기 때문에 화소단위의 직접적인 계산이 어렵고, 추출된 특성벡터는 최적화 방식으로 구현하기 때문에 실행할 때마다 다른 값으로 계산되는 경향이 있다. 최종적인 계산은 특성벡터 자체를 활용하지 않고, RGB 좌표계로 다시 변환하여 멜라닌과 헤모글로빈의 성분을 나타내는 영상 형태로 결정된다. 이 방법의 단점을 개선하기 위하여 제안하는 방법은 특성벡터를 활용하여 RGB 좌표계가 아닌 특징 공간에서 멜라닌과 헤모글로빈의 성분 값을 계산하는 것과, 일반적인 디지털 카메라를 이용하여 피부색에 해당하는 분광 반사도를 계산하는 방법, 분광 반사도를 이용하여 멜라닌과 옥시헤모글로빈, 디옥시헤모글로빈, 카로티노이드 등의 피부색소를 구성하는 세부 성분들의 계산방법 등이다. 제안한 방법은 분광 반사도 측정 장치나 다중 스펙트럼 카메라 등의 특수한 장비를 필요로 하지 않으며, 기존 방법과는 달리 화소단위의 직접적인 계산이 가능하고, 반복 실행에도 동일한 특성을 얻을 수 있다. 제안한 방법은 기존에 비하여 성능의 안정성을 나타내는 표준편차가 15% 수준으로 낮게 나타나 6배 정도의 안정적인 성능을 가진 것으로 추정된다.

사전 지식을 이용한 축구 경기장면 분석 및 좌표 변환 (Soccer Scene Analysis and Coordinate Transformation using a priori Knowledge)

  • 윤호섭;소정;민병우;양영규
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.1085-1088
    • /
    • 1999
  • This paper presents a method for soccer scene analysis and coordinate transformation from scene to ground model using a priori knowledge. First, the ground and spectator regions are separated, and various objects are extracted from the separated ground region. Second, an affine model is used for mapping the object positions on the soccer image into the position on the ground model. Problems regarding holes arising from mapping processing are solved using inverse mapping instead of a usual interpolation method. Experiments are performed on a PC using about 100 RGB images acquired at 240*640 resolution and 3∼5 frames per second.

  • PDF

색역 압축과 특징치 투영을 이용한 입술영역 분할 (Segmentation of the Lip Region by Color Gamut Compression and Feature Projection)

  • 김정엽
    • 한국멀티미디어학회논문지
    • /
    • 제21권11호
    • /
    • pp.1279-1287
    • /
    • 2018
  • In this paper, a new type of color coordinate conversion is proposed as modified CIEXYZ from RGB to compress the color gamut. The proposed segmentation includes principal component analysis for the optimal projection of a feature vector into a one-dimensional feature. The final step adopted for lip segmentation is Otsu's threshold for a two-class problem. The performance of the proposed method was better than that of conventional methods, especially for the chromatic feature.

Software development for the visualization of brain fiber tract by using 24-bit color coding in diffusion tensor image

  • Oh, Jung-Su;Song, In-Chan;Ik hwan Cho;Kim, Jong-Hyo;Chang, Kee-Hyun;Park, Kwang-Suk
    • 대한자기공명의과학회:학술대회논문집
    • /
    • 대한자기공명의과학회 2002년도 제7차 학술대회 초록집
    • /
    • pp.133-133
    • /
    • 2002
  • Purpose: The purpose of paper is to implement software to visualize brain fiber tract using a 24-bit color coding scheme and to test its feasibility. Materials and Methods: MR imaging was performed on GE 1.5 T Signa scanner. For diffusion tensor image, we used a single shot spin-echo EPI sequence with 7 non-colinear pulsed-field gradient directions: (x, y, z):(1,1,0),(-1,1,0),(1,0,1),(-1,0,1),(0,1,1),(0,1,-1) and without diffusion gradient. B-factor was 500 sec/$\textrm{mm}^2$. Acquisition parameters are as follows: TUTE=10000ms/99ms, FOV=240mm, matrix=128${\times}$128, slice thickness/gap=6mm/0mm, total slice number=30. Subjects consisted of 10 normal young volunteers (age:21∼26 yrs, 5 men, 5 women). All DTI images were smoothed with Gaussian kernel with the FWHM of 2 pixels. Color coding schemes for visualization of directional information was as follows. HSV(Hue, Saturation, Value) color system is appropriate for assigning RGB(Red, Green, and Blue) value for every different directions because of its volumetric directional expression. Each of HSV are assigned due to (r,$\theta$,${\Phi}$) in spherical coordinate. HSV calculated by this way can be transformed into RGB color system by general HSV to RGB conversion formula. Symmetry schemes: It is natural to code the antipodal direction to be same color(antipodal symmetry). So even with no symmetry scheme, the antipodal symmetry must be included. With no symmetry scheme, we can assign every different colors for every different orientation.(H =${\Phi}$, S=2$\theta$/$\pi$, V=λw, where λw is anisotropy). But that may assign very discontinuous color even between adjacent yokels. On the other hand, Full symmetry or absolute value scheme includes symmetry for 180$^{\circ}$ rotation about xy-plane of color coordinate (rotational symmetry) and for both hemisphere (mirror symmetry). In absolute value scheme, each of RGB value can be expressed as follows. R=λw|Vx|, G=λw|Vy|, B=λw|Vz|, where (Vx, Vy, Vz) is eigenvector corresponding to the largest eigenvalue of diffusion tensor. With applying full symmetry or absolute value scheme, we can get more continuous color coding at the expense of coding same color for symmetric direction. For better visualization of fiber tract directions, Gamma and brightness correction had done. All of these implementations were done on the IDL 5.4 platform.

  • PDF

2D Human Pose Estimation based on Object Detection using RGB-D information

  • Park, Seohee;Ji, Myunggeun;Chun, Junchul
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권2호
    • /
    • pp.800-816
    • /
    • 2018
  • In recent years, video surveillance research has been able to recognize various behaviors of pedestrians and analyze the overall situation of objects by combining image analysis technology and deep learning method. Human Activity Recognition (HAR), which is important issue in video surveillance research, is a field to detect abnormal behavior of pedestrians in CCTV environment. In order to recognize human behavior, it is necessary to detect the human in the image and to estimate the pose from the detected human. In this paper, we propose a novel approach for 2D Human Pose Estimation based on object detection using RGB-D information. By adding depth information to the RGB information that has some limitation in detecting object due to lack of topological information, we can improve the detecting accuracy. Subsequently, the rescaled region of the detected object is applied to ConVol.utional Pose Machines (CPM) which is a sequential prediction structure based on ConVol.utional Neural Network. We utilize CPM to generate belief maps to predict the positions of keypoint representing human body parts and to estimate human pose by detecting 14 key body points. From the experimental results, we can prove that the proposed method detects target objects robustly in occlusion. It is also possible to perform 2D human pose estimation by providing an accurately detected region as an input of the CPM. As for the future work, we will estimate the 3D human pose by mapping the 2D coordinate information on the body part onto the 3D space. Consequently, we can provide useful human behavior information in the research of HAR.

Kinect(RGB-Depth Camera)를 활용한 실내 공간 정보 모델(BIM) 획득 (Microsoft Kinect-based Indoor Building Information Model Acquisition)

  • 김준희;유세웅;민경원
    • 한국전산구조공학회논문집
    • /
    • 제31권4호
    • /
    • pp.207-213
    • /
    • 2018
  • 본 연구에서는 건물 실내 공간 정보 획득을 위해 Microsoft사의 $Kinect^{(R)}$ v2를 활용한 point cloud 기법을 도입하였다. 카메라로 취득한 2차원의 투영 공간 이미지 픽셀 좌표를 각 카메라의 보정을 거쳐 3차원 이미지 변환하며 이를 토대로 공간 정보를 구현하였다. 기준점을 중심으로 $360^{\circ}$ 회전하여 취득한 3차원 이미지를 통해 거리 측정이 불가한 기존의 2차원 이미지의 한계를 개선하였으며, 이 과정을 통해 얻은 point cloud를 통해 3차원 map을 형성하였다. 형성된 3차원 map은 기존의 공간정보 융 복합을 위한 센서와 비슷한 수준의 측정 효율을 가지면서 동시에 렌즈 왜곡 현상에 대한 후처리 과정을 통해 공간 정보를 정확하게 측정할 수 있도록 하였다. 측정한 결과를 2D 도면과 실제 공간 및 구조부재의 길이 및 위치 등과 비교하여 검증하였다.

Efficient Mobile Writing System with Korean Input Interface Based on Face Recognition

  • Kim, Jong-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.49-56
    • /
    • 2020
  • 가상 키보드방식의 문자 입력 시스템은 고정된 버튼 위치를 터치하여 입력하는 방식으로 손가락의 움직임이 불편한 사람들이나 노인들은 입력하기가 매우 불편하다. 이러한 문제를 완화시키고자, 본 논문에서는 모바일 디바이스의 RGB 카메라를 통해 얻은 영상과 사용자의 움직임을 통해 자판 입력과 필기 기능이 가능한 효율적인 프레임워크를 제안한다. 이 시스템을 개발하기 위해 얼굴인식을 활용하여 입력 영상으로부터 컨트롤 좌표를 계산하고, 이 좌표 값을 이용하여 한글을 입력하고 조합할 수 있는 인터페이스 개발한다. 얼굴인식을 기반으로 계산된 컨트롤 위치는 자판의 글자를 선택하고 전달하는 포인터 역할을 하며, 마지막으로 전달된 글자들을 조합하여 한글 자판 기능을 수행할 수 있도록 통합한다. 본 연구의 결과는 얼굴인식 기술을 활용한 효율적인 필기 시스템이며, 이 시스템을 사용하면 일반인 뿐 만 아니라 신체가 불편한 지체장애인의 의사소통 및 특수교육 환경도 개선시킬 수 있을 거라 기대한다.

시점 불변인 특징과 확률 그래프 모델을 이용한 인간 행위 인식 (Human Activity Recognition using View-Invariant Features and Probabilistic Graphical Models)

  • 김혜숙;김인철
    • 정보과학회 논문지
    • /
    • 제41권11호
    • /
    • pp.927-934
    • /
    • 2014
  • 본 논문에서는 Kinect와 같은 RGB-D 센서를 이용하여 사람의 3차원 신체 포즈 스트림 데이터를 생성하고, 이로부터 사람의 일상 행위를 효과적으로 인식하는 방법을 제안한다. Kinect SDK나 OpenNI에서 제공하는 실시간 신체 포즈 데이터는 Kinect 중심의 3차원 데카르트 좌표계로 표현되기 때문에, 시점 변화 문제와 크기 변화 문제를 겪을 가능성이 높다. 이러한 문제를 해결하고 시점 및 크기 불변인 특징을 얻기 위해, 본 논문에서는 신체 포즈 데이터를 실험자의 골반을 원점으로 하는 구면 좌표계로 변환하고 실험자의 팔 길이를 이용한 크기 정규화를 수행한다. 또한, 본 논문에서는 확률 그래프 모델 중 하나인 은닉 조건부 랜덤 필드를 이용하여, 고수준의 일상 행위들이 내포하는 다양한 내부 구조를 효과적으로 표현한다. 두 가지 데이터 집합 KAD-70과 CAD-60을 이용한 실험을 통해, 본 논문에서 제안한 행위 인식 방법과 구현 시스템의 높은 인식 성능을 확인하였다.