• 제목/요약/키워드: Model-based pose estimation

검색결과 96건 처리시간 0.026초

딥러닝 모델과 Kinect 카메라를 이용한 실시간 관절 애니메이션 제작 및 표출 시스템 구축에 관한 연구 (Real-Time Joint Animation Production and Expression System using Deep Learning Model and Kinect Camera)

  • 김상준;이유진;박구만
    • 방송공학회논문지
    • /
    • 제26권3호
    • /
    • pp.269-282
    • /
    • 2021
  • 증강현실과 가상현실 같은 3차원 콘텐츠 보급이 증가함에 따라 실시간 컴퓨터 애니메이션 기술의 중요성이 높아지고 있다. 하지만 컴퓨터 애니메이션 제작 과정은 대부분 수작업 혹은 마커를 부착하는 모션캡쳐 방식으로 이루어져 있다. 때문에 사실적인 영상을 얻기 위해서는 숙련된 전문가에게도 매우 오랜 시간이 필요하다. 이러한 문제점을 해결하기 위해 최근에는 딥러닝 모델과 센서를 기반으로 하는 애니메이션 제작 시스템과 알고리즘이 나오고 있다. 이에 본 논문에서는 딥러닝과 Kinect 카메라 기반 FBX 형식의 애니메이션 제작 시스템에서 자연스러운 인체 움직임을 구현하는 4가지 방법에 대해 연구했다. 각 방법은 환경적 특성과 정확도를 고려하여 선택된다. 첫 번째 방법은 Kinect 카메라를 사용한다. 두 번째 방법은 Kinect 카메라와 보정 알고리즘을 사용한다. 세 번째 방법은 딥러닝 모델을 사용한다. 네 번째 방법은 딥러닝 모델과 Kinect를 사용한다. 제안 방법을 오차와 처리 속도를 실험한 결과, 네 번째 딥러닝 모델과 Kinect를 동시에 사용하는 방법이 다른 방법에 비해 가장 좋은 결과를 보였다.

증강현실 환경에서의 강건한 카메라 추적을 위한 실시간 입자 필터링 기법 (A Real-time Particle Filtering Framework for Robust Camera Tracking in An AR Environment)

  • 이석한
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권4호
    • /
    • pp.597-606
    • /
    • 2010
  • 본 논문에서는 증강현실 환경에서 보다 강건한 카메라 정보 추정을 위한 입자필터 기반의 카메라 추적 기법에 대해서 설명한다. 실시간 카메라 추적을 위해서는 일반적으로 칼만 필터, 또는 확장 칼만 필터 등이 많이 이용되지만, 카메라의 급격한 흔들림 및 장면의 가려짐 등과 같은 불안정한 조건에서는 정상적인 카메라 추적이 매우 힘들다는 단점이 있다. 본 논문에서 제안하는 입자필터링 기법은 시스템 상태에 대한 측정 표본입자의 가중치를 별도의 가중치 계산과정을 이용하지 않고 가우스 분포를 기반으로 계산하였으며, 카메라 입자를 수렴시키기 위한 별도의 처리과정을 거치지 않고 시스템의 실제 불확실도에 근사화되도록 재표본화된 표본입자 집합을 이용하여 카메라 상태의 추정을 수행하였다. 또한 제안된 방법은 보다 많은 수의 표본 입자를 이용하는 환경에서도 실시간 처리가 가능한 장점이 있다. 실험을 통하여 다양한 환경 하에서 제안된 방법의 효율성과 정확성을 확인하였다.

로봇활용 공동 주의 훈련자극에 대한 사용자 반응상태를 추정하는 프로세스 (The process of estimating user response to training stimuli of joint attention using a robot)

  • 김다영;윤상석
    • 한국정보통신학회논문지
    • /
    • 제25권10호
    • /
    • pp.1427-1434
    • /
    • 2021
  • 본 연구는 사회성 상호작용 훈련자극에 반응하는 아동의 행동 및 정서적 긴장상태를 연산하는 심리반응 상태 추정 프로세스를 제안한다. 행동 중재에 필요한 훈련자극으로는 공동 주의(Joint attention) 사회성 훈련을 채택하고, 훈련프로토콜은 불연속 개별시도 훈련(DTT: Discrete trial training)기법이 적용된다. 공동 주의 훈련에서 사용자의 집중과 긴장 정도를 확인하기 위해 3가지 훈련자극용 콘텐츠를 구성한 후, 캐릭터 형태의 탁상 로봇을 이용하여 사용자에게 훈련자극을 수행하게 된다. 그런 다음, 비전 기반 헤드 포즈 인식기와 기하학 연산모델로 사용자 응시반응을 추정하고, PPG와 GSR의 생체신호를 심박변이도와 히스토그램 기법으로 신경계 반응을 분석한다. 로봇을 활용한 실험에서 공동 주의에 대한 각 콘텐츠 별 훈련에 사용자의 심리반응을 정량화 할 수 있음을 확인하였다.

표면분할을 이용한 시차공간상에서의 모델 기반 평면검출 (Model-Based Plane Detection in Disparity Space Using Surface Partitioning)

  • 하홍준;이창훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권10호
    • /
    • pp.465-472
    • /
    • 2015
  • 본 논문에서는 시차공간상의 평면검출 방법을 제안하고 그 성능을 평가한다. 다양한 표면을 평면으로 근사하고 검출함으로써 시차공간에 나타난 장면을 간소화하고 수식화하여 다루기 쉽도록 한다. 또한 시차공간에서 근사적으로 구한 평면은 3차원 공간상에서 실측 크기로 표현 가능하고 장애물 검출 및 카메라 위치 추정에 활용할 수 있다. 먼저 스테레오 매칭 기술을 이용해 두 개의 영상으로부터 2차원 공간상에 좌표쌍마다 시차값을 가지는 시차공간을 생성한다. x 또는 y축의 전체적인 추이를 반영하도록 돕는 선 단순화 기법을 이용하여 시차값의 접선 기울기를 추정한다. 기울기 쌍의 조합에 따라 10개의 라벨을 시차공간의 좌표쌍에 부여한다. 상하좌우 방향으로 인접하고 동일한 라벨을 가지는 좌표쌍을 연결하여 군집을 생성하고 최소자승법을 이용해 각 군집에 대한 평면식을 추정한다. 시차공간 내에서 평면식을 만족하는 점들이 가장 많은 평면을 검출하고 이를 시차공간을 가장 잘 간소화한 N개의 평면으로 선택한다. 평면검출의 성능을 정량적으로 평가하였고 그 결과는 3차원 원뿔과 원통에서 각각 97.9%, 86.6% 품질을 보였다. 스테레오 비전 알고리즘의 성능을 평가하기 위해 대표적으로 이용되는 Middlebury와 KITTI 실험데이터로부터 제안된 평면검출 방법은 훌륭하게 평면을 검출하였다.

기계학습을 이용한 광학 위성 영상 기반의 도시 내 수목 피복률 추정 (Estimation of Fractional Urban Tree Canopy Cover through Machine Learning Using Optical Satellite Images)

  • 배세정;손보경;성태준;이연수;임정호;강유진
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.1009-1029
    • /
    • 2023
  • 도시 수목은 탄소를 저장하고 불투수면적을 감소시키는 도시 생태계의 중요 요소이며, 탄소 저장량 및 순환량 산정 시 주요 정보로 활용될 수 있다. 많은 선행 연구에서 항공 라이다 자료 및 인공지능 기법을 활용하여 고해상도 수목 정보를 산출하고 있으나, 항공 라이다 영상은 제공하는 플랫폼이 제한되어 있으며 비용적인 면에서도 한계가 다수 존재한다. 따라서 본 연구에서는 수원시를 대상으로 자료 취득이 용이한 고해상도 위성 영상인 Sentinel-2를 활용하여 기계학습 기반의 도시 내 수목 피복률(fractional tree canopy cover, FTC)을 추정하고자 하였다. Sentinel-2 시계열 영상으로부터 중앙값 합성을 수행하여 수원시 전역에 대한 단일 영상을 제작하여 활용하였다. 도시 내 토지 피복의 이질성을 반영하기 위하여, 30 m 격자내 10 m 해상도의 광학 지수의 평균 및 표준편차 값과 환경부 세분류 토지 피복 지도 기반 항목별 피복률을 계산하여 기계학습 모델의 입력 변수로 활용하였다. 총 4가지의 입력 변수 조합을 설정하여, 입력 변수 구성에 따른 FTC 추정 정확도를 비교 및 평가하였다. 광학 영상의 평균 정보만을 활용(Scheme 1)했을 때 보다 도시 내 이질적인 특성을 반영할 수 있는 표준 편차 및 피복률 정보를 모두 함께 고려(Scheme 4, S4)했을 때 향상된 성능을 나타낼 수 있었다. 검증용 자료에 대해 S4의 Random Forest (RF) 모델이 0.8196의 R2, 0.0749의 mean absolute error (MAE), 및 0.1022의 root mean squared error (RMSE)로 전체 기계학습 모델 중에서 성능이 가장 높게 나타났다. 변수 기여도 분석 결과 광학 지수의 표준 편차 정보는 도시 내 복잡한 토지 피복 지역에 대해 높은 기여도를 나타내었다. 훈련된 S4 구성의 RF 모델을 수원시 전역에 대해 확장 적용하였을 때, 참조 FTC 자료에 대해 0.8702의 R2, 0.0873의 MAE, 및 0.1335의 RMSE의 우수한 성능을 나타냈다. 본 연구의 FTC 추정 기법은 향후 다른 지역에 대한 적용성이 우수할 것으로 판단되며, 도시 생태계 탄소순환 파악의 기초자료로 활용될 수 있을 것으로 기대된다.

합성곱 신경망의 비지니스 응용: 런웨이 이미지를 사용한 의류 분류를 중심으로 (Business Application of Convolutional Neural Networks for Apparel Classification Using Runway Image)

  • 서이안;신경식
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.1-19
    • /
    • 2018
  • 최근 딥러닝은 오디오, 텍스트 및 이미지 데이터와 같은 비 체계적인 데이터를 대상으로 다양한 추정, 분류 및 예측 문제에 사용 및 적용되고 있다. 특히, 의류산업에 적용될 경우 딥러닝 기법을 활용한 의류 인식, 의류 검색, 자동 제품 추천 등의 심층 학습을 기반으로 한 응용이 가능하다. 이 때의 핵심모형은 합성곱 신경망을 사용한 이미지 분류이다. 합성곱 신경망은 입력이 전달되고 출력에 도달하는 과정에서 가중치와 같은 매개 변수를 학습하는 뉴런으로 구성되고, 영상 분류에 가장 적합한 방법론으로 사용된다. 기존의 의류 이미지 분류 작업에서 대부분의 분류 모형은 의류 이미지 자체 또는 전문모델 착용 의류와 같이 통제된 상황에서 촬영되는 온라인 제품 이미지를 사용하여 학습을 수행한다. 하지만 본 연구에서는 통제되지 않은 상황에서 촬영되고 사람들의 움직임과 다양한 포즈가 포함된 스트릿 패션 이미지 또는 런웨이 이미지를 분류하려는 상황을 고려하여 분류 모형을 훈련시키는 효과적인 방법을 제안한다. 이동성을 포착하는 런웨이 의류 이미지로 모형을 학습시킴으로써 분류 모형의 다양한 쿼리 이미지에 대한 적응력을 높일 수 있다. 모형 학습 시 먼저 ImageNet 데이터셋을 사용하여 pre-training 과정을 거치고 본 연구를 위해 수집된 32 개 주요 패션 브랜드의 2426개 런웨이 이미지로 구성된 데이터셋을 사용하여 fine-tuning을 수행한다. 학습 과정의 일반화를 고려해 10번의 실험을 수행하고 제안된 모형은 최종 테스트에서 67.2 %의 정확도를 기록했다. 본 연구 모형은 쿼리 이미지가 런웨이 이미지, 제품 이미지 또는 스트릿 패션 이미지가 될 수 있는 다양한 분류 환경에 적용될 수 있다. 구체적으로는 패션 위크에서 모바일 어플리케이션 서비스를 통해 브랜드 검색을 용이하게 하는 서비스를 제공하거나, 패션 잡지사의 편집 작업에 사용되어 브랜드나 스타일을 분류하고 라벨을 붙일 수 있으며, 온라인 쇼핑몰에서 아이템 정보를 제공하거나 유사한 아이템을 추천하는 등의 다양한 목적에 적용될 수 있다.