• 제목/요약/키워드: human pose

검색결과 345건 처리시간 0.025초

가려진 사람의 자세추정을 위한 의미론적 폐색현상 증강기법 (Semantic Occlusion Augmentation for Effective Human Pose Estimation)

  • 배현재;김진평;이지형
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권12호
    • /
    • pp.517-524
    • /
    • 2022
  • 사람의 자세추정(Human pose estimation)은 사람의 관절 키포인트를 추출하여 자세를 추정하는 방법이다. 폐색현상(Occlusion)이 발생하면, 사람의 관절이 가려지므로 관절 키포인트 추출 성능이 낮아진다. 폐색현상은 총 3가지로 행동할 때 스스로 가려짐, 다른 사물에 의해 가려짐과 배경에 의해 가려짐으로 크게 나뉜다. 본 논문에서는 폐색현상 증강기법을 활용하여 효과적인 자세추정방법을 제안한다. 자세추정방법이 지속적으로 연구되어왔지만, 자세추정방법의 가려짐 현상에 관한 연구는 상대적으로 부족한 상태이다. 이를 해결하기 위해 저자는 사람의 관절을 타겟팅하여 의도적으로 가리는 데이터 증강기법을 제안한다. 본 논문에서의 실험 결과는 의도적으로 폐색현상 증강기법을 활용하면 폐색현상에 강인하며 성능이 올라간 것을 보여준다.

An Improved Approach for 3D Hand Pose Estimation Based on a Single Depth Image and Haar Random Forest

  • Kim, Wonggi;Chun, Junchul
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권8호
    • /
    • pp.3136-3150
    • /
    • 2015
  • A vision-based 3D tracking of articulated human hand is one of the major issues in the applications of human computer interactions and understanding the control of robot hand. This paper presents an improved approach for tracking and recovering the 3D position and orientation of a human hand using the Kinect sensor. The basic idea of the proposed method is to solve an optimization problem that minimizes the discrepancy in 3D shape between an actual hand observed by Kinect and a hypothesized 3D hand model. Since each of the 3D hand pose has 23 degrees of freedom, the hand articulation tracking needs computational excessive burden in minimizing the 3D shape discrepancy between an observed hand and a 3D hand model. For this, we first created a 3D hand model which represents the hand with 17 different parts. Secondly, Random Forest classifier was trained on the synthetic depth images generated by animating the developed 3D hand model, which was then used for Haar-like feature-based classification rather than performing per-pixel classification. Classification results were used for estimating the joint positions for the hand skeleton. Through the experiment, we were able to prove that the proposed method showed improvement rates in hand part recognition and a performance of 20-30 fps. The results confirmed its practical use in classifying hand area and successfully tracked and recovered the 3D hand pose in a real time fashion.

렌치 스페이스를 이용한 물체 들기 자세 최적화 (Carrying pose optimization by using wrench space)

  • 최명걸
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제21권4호
    • /
    • pp.19-26
    • /
    • 2015
  • 본 논문에서는 양팔을 이용한 물체 들기 자세를 최적화 하는 기술을 소개한다. 입력 값은 인체 모델과 임의의 모양의 물체이다. 물체는 크기가 크고 무거워서 두 팔을 사용해서만이 들 수 있다고 가정한다. 작은 물체와 달리 큰 물체는 물리적 안정성을 유지하면서 들고 있는 것이 쉽지 않다. 물체의 방향 그리고 손, 팔, 몸통 등 상체의 자세가 적절한 경우에만 물리적 안정성이 보장될 수 있고, 그러한 자세의 범위는 매우 제한적이다. 본 논문에서는 먼저 렌치스페이스 개념을 사용하여 주어진 인체 자세에 대해 안정성을 평가하는 알고리즘을 제시한다. 다음 전체 형태 공간을 정의 하고 형태 공간 내에서 안정성 평가 점수가 가장 높은 자세를 찾아내는 방법을 소개한다. 여러 가지 모양의 물체와 사용자 요구 조건이 주어졌을 때 최적화 된 들기 자세를 찾아내는 실험을 통해 유용성을 증명한다.

슬랙스 설계를 위한 하지동작에 따른 체표선 변화 1 (Changes in Body Surface Lines Caused By Lower Limb Movements in Designing Slacks (I))

  • 조성희
    • 한국가정과학회지
    • /
    • 제7권3호
    • /
    • pp.15-33
    • /
    • 2004
  • A precise understanding of the human form in static pose serves as the basis of designing clothing. When the human body is in motion, however, even an article of clothing designed to fit the human form in static pose can pull and change, thus restricting the body. In order to increase the fit of the clothing, which may be termed the second skin, its form and measurements therefore must be determined in correlation not only with the formal characteristics of the human body, in static pose but also with its functional characteristics in motion, as caused by the movements of the human body. In this study, the motion factor was selected as the primary basis for designing slacks with good fit in both static and moving states. By indentifying the areas in which lower limb movement cause significant changes in body surface lines, we suggest several application methods for designing slacks. Using unmarried female university students aged 18 - 24 as subjects, a total of 32 body surface categories (15 body surface lines and 17 body surface segment lines) were measured in one static and 9 movement poses. In particular, expansion and contraction levels and rates were measured and used in the analysis. The analysis first involved the calculation of the average measurement per body part in body surface line in static pose as well as of the average expansion and contraction levels and rates in 9 lower limb movements. Two-way MANOVA and multiple comparison analysis (Tukey) were conducted on movements and individual somatotypes regarding measurement per body part and expansion and contraction rates. Body parts whose measurements of body surface lines differed significantly in body surface line in static pose versus in movement were then identified. The results of this study are as follows. First, changes in body surface lines caused by lower limb movements were significant in all body surface lines of the lower trunk, both horizontal and vertical, with the exception of abdomen girth, midway thigh girth, ankle girth, hip length, and posterior knee girth. Second, significantly expanded 10 body surface lines in moving pose were detected and illustrated in table 4. These body parts should be studied in designing or pattern designing, especially for close-fitting pants, in using stretch fabric, and in sensory evaluation of good fit during movement.

  • PDF

Head Pose Estimation by using Morphological Property of Disparity Map

  • Jun, Se-Woong;Park, Sung-Kee;Lee, Moon-Key
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.735-739
    • /
    • 2005
  • This paper presents a new system to estimate the head pose of human in interactive indoor environment that has dynamic illumination change and large working space. The main idea of this system is to suggest a new morphological feature for estimating head angle from stereo disparity map. When a disparity map is obtained from stereo camera, the matching confidence value can be derived by measurements of correlation of the stereo images. Applying a threshold to the confidence value, we also obtain the specific morphology of the disparity map. Therefore, we can obtain the morphological shape of disparity map. Through the analysis of this morphological property, the head pose can be estimated. It is simple and fast algorithm in comparison with other algorithm which apply facial template, 2D, 3D models and optical flow method. Our system can automatically segment and estimate head pose in a wide range of head motion without manual initialization like other optical flow system. As the result of experiments, we obtained the reliable head orientation data under the real-time performance.

  • PDF

Fast Convergence GRU Model for Sign Language Recognition

  • Subramanian, Barathi;Olimov, Bekhzod;Kim, Jeonghong
    • 한국멀티미디어학회논문지
    • /
    • 제25권9호
    • /
    • pp.1257-1265
    • /
    • 2022
  • Recognition of sign language is challenging due to the occlusion of hands, accuracy of hand gestures, and high computational costs. In recent years, deep learning techniques have made significant advances in this field. Although these methods are larger and more complex, they cannot manage long-term sequential data and lack the ability to capture useful information through efficient information processing with faster convergence. In order to overcome these challenges, we propose a word-level sign language recognition (SLR) system that combines a real-time human pose detection library with the minimized version of the gated recurrent unit (GRU) model. Each gate unit is optimized by discarding the depth-weighted reset gate in GRU cells and considering only current input. Furthermore, we use sigmoid rather than hyperbolic tangent activation in standard GRUs due to performance loss associated with the former in deeper networks. Experimental results demonstrate that our pose-based optimized GRU (Pose-OGRU) outperforms the standard GRU model in terms of prediction accuracy, convergency, and information processing capability.

비디오 영상에서 2차원 자세 추정과 LSTM 기반의 행동 패턴 예측 알고리즘 (Behavior Pattern Prediction Algorithm Based on 2D Pose Estimation and LSTM from Videos)

  • 최지호;황규태;이상준
    • 대한임베디드공학회논문지
    • /
    • 제17권4호
    • /
    • pp.191-197
    • /
    • 2022
  • This study proposes an image-based Pose Intention Network (PIN) algorithm for rehabilitation via patients' intentions. The purpose of the PIN algorithm is for enabling an active rehabilitation exercise, which is implemented by estimating the patient's motion and classifying the intention. Existing rehabilitation involves the inconvenience of attaching a sensor directly to the patient's skin. In addition, the rehabilitation device moves the patient, which is a passive rehabilitation method. Our algorithm consists of two steps. First, we estimate the user's joint position through the OpenPose algorithm, which is efficient in estimating 2D human pose in an image. Second, an intention classifier is constructed for classifying the motions into three categories, and a sequence of images including joint information is used as input. The intention network also learns correlations between joints and changes in joints over a short period of time, which can be easily used to determine the intention of the motion. To implement the proposed algorithm and conduct real-world experiments, we collected our own dataset, which is composed of videos of three classes. The network is trained using short segment clips of the video. Experimental results demonstrate that the proposed algorithm is effective for classifying intentions based on a short video clip.

머신러닝 기반 낙상 인식 알고리즘 (Fall Detection Algorithm Based on Machine Learning)

  • 정준현;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.226-228
    • /
    • 2021
  • 구글사에서 출시된 ML Kit API의 Pose detection를 사용한 영상기반 낙상 알고리즘을 제안한다. Pose detection 알고리듬을 사용하여 추출된 신체의 33개의 3차원 특징점을 활용하여 낙상을 인식한다. 추출된 특징점을 분석하여 낙상을 인식하는 알고리듬은 k-NN을 사용한다. 영상의 크기와 영상내의 인체의 크기에 영향을 받지 않도록 정규화과정을 거치며 특징점들의 상대적인 움직임을 분석하여 낙상을 인식한다. 본 실험을 위해 사용한 13개의 테스트 영상중 13개의 영상에서 낙상을 인식하여 100%의 성공률을 보였다.

  • PDF

RGB-D 정보를 이용한 2차원 키포인트 탐지 기반 3차원 인간 자세 추정 방법 (A Method for 3D Human Pose Estimation based on 2D Keypoint Detection using RGB-D information)

  • 박서희;지명근;전준철
    • 인터넷정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.41-51
    • /
    • 2018
  • 최근 영상 감시 분야에서는 지능형 영상 감시 시스템에 딥 러닝 기반 학습 방법이 적용되어 범죄, 화재, 이상 현상과 같은 다양한 이벤트들을 강건하게 탐지 할 수 있게 되었다. 그러나 3차원 실세계를 2차원 영상으로 투영시키면서 발생하는 3차원 정보의 손실로 인하여 폐색 문제가 발생하기 때문에 올바르게 객체를 탐지하고, 자세를 추정하기 위해서는 폐색 문제를 고려하는 것이 필요하다. 따라서 본 연구에서는 기존 RGB 정보에 깊이 정보를 추가하여 객체 탐지 과정에서 나타나는 폐색 문제를 해결하여 움직이는 객체를 탐지하고, 탐지된 영역에서 컨볼루션 신경망을 이용하여 인간의 관절 부위인 14개의 키포인트의 위치를 예측한다. 그 다음 자세 추정 과정에서 발생하는 자가 폐색 문제를 해결하기 위하여 2차원 키포인트 예측 결과와 심층 신경망을 이용하여 자세 추정의 범위를 3차원 공간상으로 확장함으로써 3차원 인간 자세 추정 방법을 설명한다. 향후, 본 연구의 2차원 및 3차원 자세 추정 결과는 인간 행위 인식을 위한 용이한 데이터로 사용되어 산업 기술 발달에 기여 할 수 있다.

방향성 2차원 타원형 필터를 이용한 스테레오 기반 포즈에 강인한 사람 검출 (Stereo-based Robust Human Detection on Pose Variation Using Multiple Oriented 2D Elliptical Filters)

  • 조상호;김태완;김대진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권10호
    • /
    • pp.600-607
    • /
    • 2008
  • 이 논문은 방향성 2차원 타원형 필터(Multiple Oriented 2D Elliptical Filters;MO2DEFs)를 사용하여 스테레오 영상으로부터 포즈에 강인한 사람 검출을 제안한다. 기존의 물체 지향 크기 적응 필터(Object Oriented Scale Adaptive Filter;OOSAF)는 정면을 보고 있는 사람만을 검출하는 단점을 지니고 있는데 반해 제안한 방향성 2차원 타원형 필터는 사람의 크기나 포즈에 관계없이 사람을 검출하고 추적한다. 2D 공간-깊이 히스토그램에 특정 각도로 향하는 4개의 2차원 타원형 필터들을 적용하고, 필터링 된 히스토그램에서 임계값을 통해서 사람을 검출한 다음, MO2D2EFs 중 승적 결과가 가장 큰 2차원 타원형 필터의 방향을 사람의 방향으로 판단한다. 사람 후보들은 얼굴을 검출하거나 검출된 사람의 선택된 방향의 머리-어께 형태를 정합함으로서 검증한다. 실험 결과는 (1) 포즈 각도 예측의 정확도는 약 88%이고, (2) 제안한 MO2DEFs를 사용한 사람 검출의 성능이 OOSAF를 사용한 사람 검출의 성능보다 $15{\sim}20%$만큼 향상되었으며, 특히 정면이 아닌 사람의 경우에 더 향상이 있었다.