• 제목/요약/키워드: 2D-3D pose estimation

검색결과 86건 처리시간 0.024초

Golf Green Slope Estimation Using a Cross Laser Structured Light System and an Accelerometer

  • Pham, Duy Duong;Dang, Quoc Khanh;Suh, Young Soo
    • Journal of Electrical Engineering and Technology
    • /
    • 제11권2호
    • /
    • pp.508-518
    • /
    • 2016
  • In this paper, we propose a method combining an accelerometer with a cross structured light system to estimate the golf green slope. The cross-line laser provides two laser planes whose functions are computed with respect to the camera coordinate frame using a least square optimization. By capturing the projections of the cross-line laser on the golf slope in a static pose using a camera, two 3D curves’ functions are approximated as high order polynomials corresponding to the camera coordinate frame. Curves’ functions are then expressed in the world coordinate frame utilizing a rotation matrix that is estimated based on the accelerometer’s output. The curves provide some important information of the green such as the height and the slope’s angle. The curves estimation accuracy is verified via some experiments which use OptiTrack camera system as a ground-truth reference.

ICP 계산속도 향상을 위한 빠른 Correspondence 매칭 방법 (A Fast Correspondence Matching for Iterative Closest Point Algorithm)

  • 신건희;최재희;김광기
    • 로봇학회논문지
    • /
    • 제17권3호
    • /
    • pp.373-380
    • /
    • 2022
  • This paper considers a method of fast correspondence matching for iterative closest point (ICP) algorithm. In robotics, the ICP algorithm and its variants have been widely used for pose estimation by finding the translation and rotation that best align two point clouds. In computational perspectives, the main difficulty is to find the correspondence point on the reference point cloud to each observed point. Jump-table-based correspondence matching is one of the methods for reducing computation time. This paper proposes a method that corrects errors in an existing jump-table-based correspondence matching algorithm. The criterion activating the use of jump-table is modified so that the correspondence matching can be applied to the situations, such as point-cloud registration problems with highly curved surfaces, for which the existing correspondence-matching method is non-applicable. For demonstration, both hardware and simulation experiments are performed. In a hardware experiment using Hokuyo-10LX LiDAR sensor, our new algorithm shows 100% correspondence matching accuracy and 88% decrease in computation time. Using the F1TENTH simulator, the proposed algorithm is tested for an autonomous driving scenario with 2D range-bearing point cloud data and also shows 100% correspondence matching accuracy.

Projection mapping onto multiple objects using a projector robot

  • Yamazoe, Hirotake;Kasetani, Misaki;Noguchi, Tomonobu;Lee, Joo-Ho
    • Advances in robotics research
    • /
    • 제2권1호
    • /
    • pp.45-57
    • /
    • 2018
  • Even though the popularity of projection mapping continues to increase and it is being implemented in more and more settings, most current projection mapping systems are limited to special purposes, such as outdoor events, live theater and musical performances. This lack of versatility arises from the large number of projectors needed and their proper calibration. Furthermore, we cannot change the positions and poses of projectors, or their projection targets, after the projectors have been calibrated. To overcome these problems, we propose a projection mapping method using a projector robot that can perform projection mapping in more general or ubiquitous situations, such as shopping malls. We can estimate a projector's position and pose with the robot's self-localization sensors, but the accuracy of this approach remains inadequate for projection mapping. Consequently, the proposed method solves this problem by combining self-localization by robot sensors with position and pose estimation of projection targets based on a 3D model. We first obtain the projection target's 3D model and then use it to accurately estimate the target's position and pose and thus achieve accurate projection mapping with a projector robot. In addition, our proposed method performs accurate projection mapping even after a projection target has been moved, which often occur in shopping malls. In this paper, we employ Ubiquitous Display (UD), which we are researching as a projector robot, to experimentally evaluate the effectiveness of the proposed method.

Visual Positioning System based on Voxel Labeling using Object Simultaneous Localization And Mapping

  • Jung, Tae-Won;Kim, In-Seon;Jung, Kye-Dong
    • International Journal of Advanced Culture Technology
    • /
    • 제9권4호
    • /
    • pp.302-306
    • /
    • 2021
  • Indoor localization is one of the basic elements of Location-Based Service, such as indoor navigation, location-based precision marketing, spatial recognition of robotics, augmented reality, and mixed reality. We propose a Voxel Labeling-based visual positioning system using object simultaneous localization and mapping (SLAM). Our method is a method of determining a location through single image 3D cuboid object detection and object SLAM for indoor navigation, then mapping to create an indoor map, addressing it with voxels, and matching with a defined space. First, high-quality cuboids are created from sampling 2D bounding boxes and vanishing points for single image object detection. And after jointly optimizing the poses of cameras, objects, and points, it is a Visual Positioning System (VPS) through matching with the pose information of the object in the voxel database. Our method provided the spatial information needed to the user with improved location accuracy and direction estimation.

2단계 샘플링을 이용한 카메라 움직임 및 장면 구조 복원 (Camera Motion and Structure Recovery Using Two-step Sampling)

  • 서정국;조청운;홍현기
    • 대한전자공학회논문지SP
    • /
    • 제40권5호
    • /
    • pp.347-356
    • /
    • 2003
  • 비디오 영상으로부터 카메라의 움직임과 3차인 구조를 복원하는 기술은 다양한 분야에 응용되고 있다. 특히 비교정(un calibrated) 동영상을 해석하기 위해서는 대상 영상의 정보만을 이용하는 카메라의 자동 보정(auto-calibration)기술이 필수적이다. 그러나 비디오 상의 많은 프레임에 안정적으로 이를 적용하려면 기존의 자동 보정기술은 무기조정(bundle adjustment) 또는 비선형 최적화 등의 매우 복잡한 과정이 요구된다. 본 논문에서는 최적화 과정 없이도 정확하게 대상 카메라의 궤적과 3차원 구조를 복원하는 새로운 방법이 제안된다. 첫 번째 단계에서 대상 시퀀스에서 카메라 궤적의 해석에 적절한 키프레임(key-frame)을 선택하여 전체 연산 시간을 줄이며, 두 번째 과정에서 보다 정확한 카메라 자동 보정을 하기 위해 이미 추출된 키프레임 가운데 적대 2차 원추곡면(absolute quadric)의 추정을 통해 오차가 많이 포함된 키프레임을 제거한다. 가상 및 실사영상에 대한 실험결과로부터 제안된 방법의 성능을 확인하였으며, 다양한 실사 영상을 대상으로 가상의 3차원 모델을 합성한 결과도 제시하였다.

GAN 기반 이미지 합성을 통한 3차원 증강 자세 추정 (3D Augmented pose estimation through GAN based image synthesis)

  • 박찬;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.667-669
    • /
    • 2022
  • 2차원 이미지를 통한 자세 추정의 경우 관절이 겹치거나 가려져 있는 등의 인식 저해 요소로 인하여 자세 추정 정확도가 감소하는 한계가 있다. 본 논문에서는 GAN을 통해 2차원 이미지를 3차원으로 증강한 뒤 자세를 추정하는 기법을 제안한다. 제안하는 방법은 2차원 이미지의 평면좌표 값에서 GAN을 통해 노이즈 벡터 z축 값과 피사체에 투영되는 빛의 방향 값을 반영한 3차원 이미지를 만든다. 이러한 이미지 합성 과정을 거친 후 DeepLabCut을 사용해 관절 좌표를 추출하고 자세 추정 및 분류를 진행한다. 이를 통해 2차원에서의 자세 추정 정확도 향상을 기대할 수 있으며, 향후 이를 기반한 이상행동 탐지 분야에서 적용할 수 있다.

NeRF 기반 3차원 모델링을 통한 자세 추정 (Pose Estimation through 3D modeling based on NeRF)

  • 박찬;김형주;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.600-602
    • /
    • 2022
  • 2차원 이미지 또는 영상을 통한 자세 추정의 경우, 영상 내에서 발생할 수 있는 탐지 오류, 피사체 잘림, 폐색(Occlusion) 등으로 인해 자세 추정 정확도가 감소할 수 있다. 본 논문에서는 4장 이상의 다양한 각도로 촬영한 이미지를 NeRF(Neural Radiance Fields)를 통해 이미지 합성(Image synthesis)을 진행하여 3차원 모델을 생성한다. 이후 DeepLabCut을 사용하여 관절 좌표와 골격(Skeleton)을 구축한다. 구축한 골격을 인공지능에 학습시킨 뒤 2차원 영상에서의 관절 좌표 인식, 골격 구축, 자세 추정을 진행한다. 2차원 영상 테스트 데이터를 통해, 3차원 모델을 사전 학습한 인공지능 모델과 기존 2차원 이미지를 사용하여 학습한 인공지능 모델의 자세 추정 정확도를 비교한다.

개선된 직교분해기법을 사용한 빠른 구조 복원 및 융합 (Fast Structure Recovery and Integration using Improved Scaled Orthographic Factorization)

  • 박종승;윤종현
    • 한국멀티미디어학회논문지
    • /
    • 제10권3호
    • /
    • pp.303-315
    • /
    • 2007
  • 본 논문에서는 비디오에서의 특징점 추적을 통해 얻은 2차원 좌표를 이용하여 3차원 구조를 계산하고 부분적으로 복원된 형상들을 점진적으로 융합하여 전체 형상을 생성하는 기법을 제안한다. 영상의 각 프레임에서 공통적으로 추적된 특징점들을 이용하여 형상을 추정한다. 3차원 좌표 추정 방법으로 개선된 직교분해기법을 사용하였다. 개선된 직교분해기법에서는 3차원 좌표를 복원함과 동시에 카메라의 위치와 방향을 계산할 수 있다. 복원된 부분 형상의 융합을 통해 입체적인 전체 형상을 만든다. 복원된 부분 데이터들의 서로 다른 좌표계를 기준 좌표계로 변환하여 하나의 전체 형상으로 융합한다. 형상 추정 과정과 융합 과정이 통합적으로 수행되며 반복적 최적화 작업을 수행하지 않고 선형적으로 이루어진다. 이는 기존 융합 방법인 ICP(Iterative Closest Point) 방법보다 융합 속도를 향상시켜 빠른 형상 복원이 가능하다. 융합 시간은 평균 0.01초 이내의 수행 속도를 보이며 융합의 오차는 평균 1.0mm 이하의 오차를 보였다.

  • PDF

실시간 손동작 인식을 위한 동작 평면 추정 (Motion Plane Estimation for Real-Time Hand Motion Recognition)

  • 정승대;장경호;정순기
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.347-358
    • /
    • 2009
  • 손동작을 인식하는 연구가 오랫동안 이뤄져 왔지만 대개의 시스템들이 값비싼 깊이 카메라를 사용하거나 여러 개의 카메라를 사용해 분석하는 등 그 비용이 크며 작동이 가능한 작업 공간이 지극히 제한적이었다. 본 논문에서는 가전제품을 원격 제어하기 위한 목적으로 두 개의 회전 모터를 사용해 작업 공간을 확대하고 저렴한 일반 카메라를 사용해서 효율적으로 손동작을 인식하기 위한 시스템을 제안한다. 이 시스템은 입력된 카메라의 자세 정보와 이미지상의 2차원적 손가락 위치 정보를 이용하여 3차원 궤적을 추정하고 이를 동작 평면으로 투영시켜 의미 있는 선형 동작 패턴으로 복원한다. 또한 본 논문에서는 개발된 시스템을 테스트하여 주어진 목적에 맞는 정확도를 가지는 작업 영역을 정의한다.

Visual Servoing을 위한 3차원 물체의 인식 및 자세 추정 (Recognition and Pose Estimation of 3-D Objects for Visual Servoing)

  • 양재호;정문호;박민용
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 제37회 하계학술대회 논문집 D
    • /
    • pp.1931-1932
    • /
    • 2006
  • 로봇이 어떤 물체를 인지하고 그 물체에 대해 어떤 작업을 하고자 할 때 특정 물체의 인식 문제, 3차원 정보를 획득하는 문제, 자세를 추정하는 문제 등 해결해야 될 문제들이 있다. 물체를 인식하는 과정에서는 주위 배경과 물체의 크기의 변화, 회전, 가려짐 등으로 인해 물체 인식을 어렵게 만드는 요소들이 있다. 2차원 이미지를 통해 3차원 정보를 추출하는 과정은 일반적으로 두 대의 카메라를 이용하여 스테레오 이미지를 통해 얻는다. 이 때 좌우 영상간의 매칭의 과정이 필요하다. 자세 추정의 문제는 카메라 좌표와 물체의 좌표간의 관계를 알아야 한다. Visual Servoing을 어렵게 만드는 많은 요인들이 있으며 본 논문에서는 물체의 크기, 회전, 이동에 불변인 디스크립터(descriptor)를 사용하는 SIFT(Scale Invariant Feature Transform)를 통해 3차원 물체의 인식과 자세를 추정하는 방법을 제시한다. 또한 자세 추정을 위해 2차원 Keypoint들의 매칭을 3차원 정보를 통해 검증하는 방법을 제시한다. (SIFT에 의해 추출된 point를 Keypoint라 명한다.)

  • PDF