• 제목/요약/키워드: 포즈 예측

검색결과 17건 처리시간 0.02초

단안 카메라와 저정밀 GPS-IMU 신호를 융합한 맵매칭 방법 (High accuracy map matching method using monocular cameras and low-end GPS-IMU systems)

  • 김용균;구형일;강석원;김준원;김재관
    • 한국산학기술학회논문지
    • /
    • 제19권4호
    • /
    • pp.34-40
    • /
    • 2018
  • 본 논문에서는 단안 카메라와 비교적 오차가 큰 GPS-IMU 센서를 이용하여 이동체의 정확한 포즈를 예측하는 고정밀 맵매칭 방법을 제안한다. 제안하는 방법은 카메라로부터 입력 받은 영상을 딥뉴럴 네트워크를 이용하여 의미상으로 분할한 결과와 시맨틱 지도 정보를 비교함으로써 달성된다. 카메라로부터 입력 받은 주행 영상은 시맨틱 분할 알고리즘을 통해서 두 개의 클래스로 분할되며, 시맨틱 지도 정보와 가능한 레이블 페어에 대해 설정된 가중치에 따라 비교 정렬함으로써 현재 이동체의 정확한 포즈를 예측할 수 있도록 한다. 이 과정에서 비교적 오차가 큰 GPS-IMU 센서의 신호는 해 공간의 범위를 효과적으로 줄여준다. 본 논문은 비교적 저렴한 센서를 이용하여 증강현실 및 자율주행 등에 필요한 고정밀 맵매칭이 가능함을 보여준다. 보정 전후의 차량 경로를 지도에 비교 도시하고 시맨틱 지도를 현재 입력 영상에 오버레이 하여 제안한 방법의 효과를 입증하였다. 또한 non-open-sky 환경과 같은 GPS-IMU 수신이 어려운 환경에서도 성능 개선이 있음을 확인하였다.

HMM을 이용한 제스처 인식 기반 한자 학습 콘텐츠 (The Chinese Characters Learning Contents Based on Gesture Recognition Using HMM Algorithm)

  • 송대현;김동민;이칠우
    • 한국멀티미디어학회논문지
    • /
    • 제15권8호
    • /
    • pp.1067-1074
    • /
    • 2012
  • 본 논문에서는 HMM을 이용한 제스처 인식을 입력 인터페이스로 사용한 한자 학습 콘텐츠에 대해 제안한다. 제안한 시스템의 입력정보는 TOF 카메라 영상으로부터 3차원 정보를 받으며, 제스처 인식 방법은 사용자의 포즈를 예측하는 부분과 연속된 포즈들로부터 제스처를 인식하는 부분으로 구성되어 있다. 사용자와 컴퓨터사이의 의사소통에서, 별도의 추가 장비를 사용하지 않고 사용자의 행동에 의한 조작을 통해 사용자가 쉽게 조작할 수 있도록 편리함을 제공하였다. 또한 대형 디스플레이와 다양한 멀티미디어 요소를 이용하여 몰입과 흥미를 유발시킬 수 있기 때문에 정보 전달을 극대화할 수 있다. 본 논문에서 제안한 에듀테인먼트 한자 학습 콘텐츠는 교육적 내용를 제공하고 사용자가 흥미를 느끼도록 하여 자연스레 한자를 습득할 수 있고, 제스처 인식을 기반으로 하므로 사용자에게 콘텐츠 체험을 통한 시너지 효과를 기대할 수 있다.

새로운 Boosted 3-D PCA 기반 Head Pose Estimation 방법 (A New Head Pose Estimation Method based on Boosted 3-D PCA)

  • 이경민;인치호
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.105-109
    • /
    • 2021
  • 본 논문에서는 Boosted 3-D PCA 방법을 데이터 세트로 평가하고 성능을 평가한다. 그런 다음 네트워크의 특징과 성능을 분석하겠습니다. 본 논문에서는 Boosted 3-D PCA 학습방법을 사용하여 300W-LP 데이터 학습을 수행했으며 AFLW2000 데이터 세트를 사용하여 평가를 평가했다. 결과는 이 성능 결과는 기존 랜드마크 대 포즈 방법보다 자유롭게 얼굴 이미지의 데이터 세트를 사용하여 학습할 수 있으므로 실제 상황에서 포즈를 정확하게 예측할 수 있다. 키포인트 세트의 최적화는 독립적이지 않기 때문에, 우리는 계산 시간을 줄일 방법을 확인했다. 이 방법은 Boosted 3-D PCA 성능을 향상시키거나 다양한 애플리케이션 도메인에 적용하는 데 매우 중요한 자원이 될 것으로 예상한다

2 단계 포즈 예측 기반 교정된 입체 영상 생성 (Rectified Stereoscopic Image Generation Using Two-Step Pose Estimation)

  • 문현정;정다운;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.250-251
    • /
    • 2010
  • 디지털 카메라의 보급으로 이미지처리 분야에서 정지영상을 이용한 다양한 기술 개발이 화두가 되고 있다. 스테레오 영상은 정지영상보다 소비자의 시각적 욕구를 충족시킬 수 있는 영상을 표현하기 때문에 스테레오 영상기술에 대한 관심이 높아지고 있다. 본 논문에서는 하나의 카메라로 같은 객체를 다른 위치에서 찍은 2장의 정지영상을 통해 스테레오 영상을 제작하는 방법을 제안한다. 실험 영상으로 디지털카메라로 찍은 좌측 영상과 우측영상을 사용한다. 두 영상의 제어점이 될 코너를 검출한 후, 유클리드의 좌표로 바꿔준다. 이 좌표들을 통해 각 제어점에 인접해 있는 좌표 4개를 추출한다. 이 인접 좌표들이 우측 정지 영상의 인접 좌표에 매칭 되는 횟수를 계산하여, 가장 많은 매칭 좌표를 갖는 스케일 요소로 좌측 정지영상을 회전과 이동시켜 목적 영상인 우측 영상에 매칭시킴으로써 스테레오 영상을 구현한다.

  • PDF

포즈 예측을 이용하는 자동 파노라마 영상 생성 (Automatic Panorama Image Generation Using Pose Estimation)

  • 정다운;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.312-314
    • /
    • 2010
  • 본 논문에서는 하나의 카메라로 일정 영역에서 랜덤하게 촬영되어 얻어진 영상으로 파노라마 영상을 제작하는 방법을 제안한다. 실험 영상으로는 디지털카메라로 일정 영역을 랜덤하게 촬영한 여러 장의 영상을 사용한다. 여러 장의 영상에서 제어점이 될 특징 점들을 검출한 후, 유클리드의 좌표로 바꿔준다. 이 좌표들을 통해 각각의 제어 점에 가장 인접해 있는 좌표 4개를 추출한다. 이 인접 좌표들이 서로 다른 각각의 영상에서 매칭 되는 확률을 계산하여, 가장 높은 매칭 확률을 갖는 영상과 매칭 되는 pose값을 이용하여 각각의 영상을 회전 및 이동하여 매칭시킴으로써 촬영된 영상들의 파노라마 영상을 구현한다.

  • PDF

무게중심을 활용한 모션 생성 기술 (Motion generation using Center of Mass)

  • 박근태;손채준;이윤상
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제26권2호
    • /
    • pp.11-19
    • /
    • 2020
  • 캐릭터의 자세가 변할 때 마다 캐릭터의 무게 중심(COM) 위치도 변하게 된다. 이 때 무게 중심의 위치 변화는 걷기, 뛰기, 쭈그려 앉기 등 다양한 동작 각각에 대응되는 독자적인 패턴을 가지므로 이를 이용하면 원래 동작의 정보를 알아낼 수 있다. 본 논문에서는 캐릭터의 무게 중심의 위치 변화를 토대로 동작을 예측하는 모션 생성 기법을 제안한다. 이 방법을 이용하면 무게 중심 정보를 통해 원래 동작의 유형에 대한 별도의 라벨 없이도 다양한 동작을 생성할 수 있다. 그러므로 네트워크의 학습 및 실행을 위한 데이터셋을 만들 때 사람의 손을 거칠 필요 없이 전처리를 비롯한 모든 과정을 자동으로 진행할 수 있다. 본 논문에서 제안하는 신경망 모델은 캐릭터의 모션 이력(history) 정보와 무게 중심 정보들을 입력 받아 현재 프레임에서의 포즈 정보를 출력하며, 연속적인 시계열 모션 데이터를 다루기 위해 1차원 Convolution을 수행하는 간단한 형태의 Convolutional Neural Network(CNN)를 사용하여 학습되었다.

합성곱 신경망의 비지니스 응용: 런웨이 이미지를 사용한 의류 분류를 중심으로 (Business Application of Convolutional Neural Networks for Apparel Classification Using Runway Image)

  • 서이안;신경식
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.1-19
    • /
    • 2018
  • 최근 딥러닝은 오디오, 텍스트 및 이미지 데이터와 같은 비 체계적인 데이터를 대상으로 다양한 추정, 분류 및 예측 문제에 사용 및 적용되고 있다. 특히, 의류산업에 적용될 경우 딥러닝 기법을 활용한 의류 인식, 의류 검색, 자동 제품 추천 등의 심층 학습을 기반으로 한 응용이 가능하다. 이 때의 핵심모형은 합성곱 신경망을 사용한 이미지 분류이다. 합성곱 신경망은 입력이 전달되고 출력에 도달하는 과정에서 가중치와 같은 매개 변수를 학습하는 뉴런으로 구성되고, 영상 분류에 가장 적합한 방법론으로 사용된다. 기존의 의류 이미지 분류 작업에서 대부분의 분류 모형은 의류 이미지 자체 또는 전문모델 착용 의류와 같이 통제된 상황에서 촬영되는 온라인 제품 이미지를 사용하여 학습을 수행한다. 하지만 본 연구에서는 통제되지 않은 상황에서 촬영되고 사람들의 움직임과 다양한 포즈가 포함된 스트릿 패션 이미지 또는 런웨이 이미지를 분류하려는 상황을 고려하여 분류 모형을 훈련시키는 효과적인 방법을 제안한다. 이동성을 포착하는 런웨이 의류 이미지로 모형을 학습시킴으로써 분류 모형의 다양한 쿼리 이미지에 대한 적응력을 높일 수 있다. 모형 학습 시 먼저 ImageNet 데이터셋을 사용하여 pre-training 과정을 거치고 본 연구를 위해 수집된 32 개 주요 패션 브랜드의 2426개 런웨이 이미지로 구성된 데이터셋을 사용하여 fine-tuning을 수행한다. 학습 과정의 일반화를 고려해 10번의 실험을 수행하고 제안된 모형은 최종 테스트에서 67.2 %의 정확도를 기록했다. 본 연구 모형은 쿼리 이미지가 런웨이 이미지, 제품 이미지 또는 스트릿 패션 이미지가 될 수 있는 다양한 분류 환경에 적용될 수 있다. 구체적으로는 패션 위크에서 모바일 어플리케이션 서비스를 통해 브랜드 검색을 용이하게 하는 서비스를 제공하거나, 패션 잡지사의 편집 작업에 사용되어 브랜드나 스타일을 분류하고 라벨을 붙일 수 있으며, 온라인 쇼핑몰에서 아이템 정보를 제공하거나 유사한 아이템을 추천하는 등의 다양한 목적에 적용될 수 있다.