• 제목/요약/키워드: 3D 객체

검색결과 889건 처리시간 0.026초

UV-map 기반의 신경망 학습을 이용한 조립 설명서에서의 부품의 자세 추정 (UV Mapping Based Pose Estimation of Furniture Parts in Assembly Manuals)

  • 강이삭;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.667-670
    • /
    • 2020
  • 최근에는 증강현실, 로봇공학 등의 분야에서 객체의 위치 검출 이외에도, 객체의 자세에 대한 추정이 요구되고 있다. 객체의 자세 정보가 포함된 데이터셋은 위치 정보만 포함된 데이터셋에 비하여 상대적으로 매우 적기 때문에 인공 신경망 구조를 활용하기 어려운 측면이 있으나, 최근에 들어서는 기계학습 기반의 자세 추정 알고리즘들이 여럿 등장하고 있다. 본 논문에서는 이 가운데 Dense 6d Pose Object detector (DPOD) [11]의 구조를 기반으로 하여 가구의 조립 설명서에 그려진 가구 부품들의 자세를 추정하고자 한다. DPOD [11]는 입력으로 RGB 영상을 받으며, 해당 영상에서 자세를 추정하고자 하는 객체의 영역에 해당하는 픽셀들을 추정하고, 객체의 영역에 해당되는 각 픽셀에서 해당 객체의 3D 모델의 UV map 값을 추정한다. 이렇게 픽셀 개수만큼의 2D - 3D 대응이 생성된 이후에는, RANSAC과 PnP 알고리즘을 통해 RGB 영상에서의 객체와 객체의 3D 모델 간의 변환 관계 행렬이 구해지게 된다. 본 논문에서는 사전에 정해진 24개의 자세 후보들을 기반으로 가구 부품의 3D 모델을 2D에 투영한 RGB 영상들로 인공 신경망을 학습하였으며, 평가 시에는 실제 조립 설명서에서의 가구 부품의 자세를 추정하였다. 실험 결과 IKEA의 Stefan 의자 조립 설명서에 대하여 100%의 ADD score를 얻었으며, 추정 자세가 자세 후보군 중 정답 자세에 가장 근접한 경우를 정답으로 평가했을 때 100%의 정답률을 얻었다. 제안하는 신경망을 사용하였을 때, 가구 조립 설명서에서 가구 부품의 위치를 찾는 객체 검출기(object detection network)와, 각 개체의 종류를 구분하는 객체 리트리벌 네트워크(retrieval network)를 함께 사용하여 최종적으로 가구 부품의 자세를 추정할 수 있다.

  • PDF

객체인식과 분석을 위한 3D 체인코드의 적용 (Application of 3D Chain Code for Object Recognition and Analysis)

  • 박소영;이동천
    • 한국측량학회지
    • /
    • 제29권5호
    • /
    • pp.459-469
    • /
    • 2011
  • 객체의 형상을 결정할 수 있는 요소는 크기, 경사도와 경사방향, 곡률, 기복변화, 요소간의 특성관계, 선 또는 면이 이루는 각, 특징점의 분포형태 등 매우 다양하다. 객체가 존재하는 공간은 3차원이지만 대부분의 경우 2차원 공간상에서 객체를 표현하고 이를 기반으로 객체인식을 수행하고 있다. 본 연구에서는 3차원 공간에서 객체의 형태를 판단하기 위한 방법을 제안하기 위하여 기존의 체인코드를 3차원으로 확장시켜 큐브형태의 연산자의 적용을 수행하였다. 일련의 코드로 생성되는 3D 체인코드를 분석하여 객체를 정형화하여 하향식 방법에 의한 객체 모델링의 기반이 될 수 있음을 보여 주었다. 또한 점 데이터 분할에 적용할 수 있으며 이는 라이다 데이터에 의한 모델링에 사용될 수 있다.

LOD(Level-of-detail)이용한 3D객체의 동적 계층의 충돌 검사 성능 향상 (LOD(Level-of-Detail) using Dynamic-Hierarchies of collision detection efficiency improvement in 3D object)

  • 이춘호;김태용
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.963-968
    • /
    • 2007
  • 본 논문에서는 현재 3D 그래픽뿐만 아니라 게임에서 정확한 충돌감지(collision-detection)나 컬링(culling)등은 3D공간에서 이러한 표준객체를 중심으로 많은 연구가 이루어지고 있다. 3D그래픽 분야에서 H/W의 놀라운 발달과 3D게임을 즐기는 게이머들이 좀 더 사실적인 표현에 깊은 관심을 가지고 있다. 90년대 중반 이후로 많이 연구되어진 3D 게임 엔진과 알고리즘 중에서 표준 3D 객체의 다양한 충돌 알고리즘을 분석하고, 기존의 3D 객체의 단순한 Hierarchies 구조에서 탈피하여 3D공간상에서 LOD(Level-of-Detail) 알고리즘을 이용하여, 3D객체가 3D 공간상에서 충돌검사의 성능을 향상시켜서 3D 게임의 필수 요소인 3차원 공간상의 효율적인 렌더링과 사실적인 표현의 알고리즘을 제안하여 실시간을 중요시 하는 3D 게임에서 사실감과 효율성을 높일 수 있게 제안한다.

  • PDF

2D CAD 이미지 분석 기반 3D 객체 자동 생성 방법 설계

  • 서민재;이유진;최희조;임현규;최영규;전지혜
    • 방송과미디어
    • /
    • 제27권3호
    • /
    • pp.67-78
    • /
    • 2022
  • 제조업과 같은 산업체에서는 현장을 이해하고 문서를 확인하는 과정에서 시간, 비용이 많이 소요되기 때문에 해석하기 용이한 3차원 형태의 데이터로 미리 제작하고 온라인으로 모델을 공유하고 수정하는 것은 작업 효율을 향상시킬 수 있다. 작업물을 3D 객체 형태로 분석하거나 수정 보완을 위한 가상 목업(mock-up)으로 활용할 경우, 3D 모델링을 빠르고 정확하게 생성하는 기술에 대한 연구가 필요하다. 본 논문에서는 2D CAD 이미지를 분석하여 도형 형태와 수치 정보를 각각 인식하고 3D 객체를 자동 생성하는 방법의 설계를 제안한다. 제안한 방식을 통해서 2D 이미지 파일의 별도 변환 없이 3D 객체로 자동 생성할 수 있다. 빠르게 자동 생성된 3D 객체는 XR 등의 다양한 플랫폼에서 정확하고 세밀한 형태를 가상 공간에서 공유할 수 있어 작업자 간 협업 효율성을 높일 수 있다.

웨어러블 증강현실 환경에서 In-situ 증강현실 저작을 위한 ARWand 기반 상호작용 방법 (ARWand based Interaction Method for In-situ Augmented Reality Authoring in Wearable Computing Environment)

  • 하태진;우운택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.433-435
    • /
    • 2012
  • 웨어러블 증강현실 환경은 동적으로 움직이는 HMD와 ARWand로 인한 시스템 오차와 사용자 오차가 발생하기 때문에, 3차원 공간 상에 다양한 위치에 존재하는 3D 객체를 효과적으로 선택하고 6 DOF 조작하는 것이 어렵다. 이러한 문제점을 해결하기 위해서, HMD, ARWand, 3D 객체간의 기하정보를 기반으로 3D 객체의 선택 확률을 모델링하고, 통합적으로 해석하여 최고의 선택 확률을 가지는 3D 객체를 선택할 수 있도록 한다. 그리고 근/원거리에 위치한 3D 객체를 효율적으로 조작하기 위해서 ARWand의 조작-디스플레이 맵핑 방법을 제안한다. 이는 3D 객체의 자연스러운 6 DOF 직접-간접 조작을 가능하게 한다.

3차원 객체 인식을 위한 RGB-D 영상 특징점 추출 및 특징 기술자 생성 방법 (RGB-D Image Feature Point Extraction and Description Method for 3D Object Recognition)

  • 박노영;장영균;우운택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.448-450
    • /
    • 2012
  • 본 논문에서는 Kinect 방식의 RGB-D 영상센서를 사용하여, 깊이(Depth) 영상으로부터 3차원 객체의 기하정보를 표현하는 표면 정규 벡터(Surface Normal Vector)를 추출하고, 그 결과를 영상화하는 방법을 제안하며, 제안된 방법으로 생성된 영상으로부터 깊이 영상의 특징점 및 특징 기술자를 추출하여 3차원 객체 인식 성능을 향상시키는 방법을 제안한다. 또한 생성된 RGB-D 특징 기술자들을 객체 단위로 구분 가능한 코드북(CodeBook) 학습을 통한 인식방법을 제안하여 객체의 인식 성능을 높이는 방법을 제안한다. 제안하는 RGB-D 기반의 특징 추출 및 학습 방법은 텍스쳐 유무, 카메라 회전 및 이동 변화 등의 환경변화에 강건함을 실험적으로 증명하였으며, 이 방법은 Kinect 방식의 RGB-D 영상을 사용하는 3차원 객체/공간 인식 및 추적, 혹은 이를 응용하는 증강현실 시스템에 적용하여 사용될 수 있다.

POSIT을 이용한 3D 객체의 비디오 삽입 (Inserting Virtual Object into Video using POSIT Algorithm)

  • 이범종;김형목;박종승;노성렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.688-690
    • /
    • 2005
  • 본 논문에서는 비디오 프레임에서의 특징점 추출과 3D 객체의 점들간의 상대적인 좌표만을 사용하여 비디오에 가상객 체를 삽입 하는 방법 을 제안한다. 가상객체의 삽입 위치는 사용자가 대응관계를 지정하여 결정한다. 3D 객체의 비디오 삽입을 위한 투사행렬은 POSIT 알고리즘을 사용하여 계산한다. 가상 객체를 삽입 함에 있어 실객체가 가상객체를 가리는 현상을 해결하였다. 본 논문에서 제안한 방법은 특징점과 3D 객체의 점들 간의 상대적인 좌표만 준비된다면 각 비디오프레임의 카메라 행렬을 계산할 수 있고 가상객체의 가려짐을 고려하여 합성할 수 있다.

  • PDF

3차원 그래픽 이미지를 위한 XML 데이타베이스 시스템 (An XML Database System for 3-Dimensional Graphic Images)

  • 황종하;황수찬
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권2호
    • /
    • pp.110-118
    • /
    • 2002
  • 본 논문에서는 3차원 이미지의 내용기반 검색을 지원하는 XML 기반의 3차원 그래픽 데이터 베이스 시스템에 대해 기술한다. 현재 대부분의 그래픽 응용들은 2차원 이미지를 대상으로 하고 있으며 3차원 그래픽스 분야에서는 3차원 이미지의 표현에 대해서만 중점적으로 연구가 되고 있을 뿐 이미지가 포함하고 있는 의미 단위로서의 객체 모델링이나 이들 간의 공간 관계에 대한 처리는 아직 미흡한 실정이다. 본 논문의 모델에서 3차원 이미지는 공간관계를 가지고 있는 3차원 그래픽 객체의 조합으로 표현된다. 복잡한 3차원 객체는 기존의 그래픽 시스템에서 사용하는 선과 면 대신에 기본적인 객체들을 이용하여 모델링된다. 이렇게 구성된 3차원 그래픽 이미지들은 객체 모양이나 객체간의 공간관계를 이용한 내용기반 검색의 대상이 된다. 3차원 그래픽 이미지들은 XML 문서 형태로 표현되며, 이를 위한 3DGML DTD를 정의하였다. 끝으로 웹 기반으로 구현된 프로토타입 시스템에서의 질의 예를 보인다.

3DTV 향 3D 영상 정보를 이용한 3D 오디오 원근감 재현 기술 (3D Audio Rendering Method based on 3D Video Information for 3DTV)

  • 김선민;이영우;김승훈;이승수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.204-207
    • /
    • 2011
  • 본 논문에서는 3DTV 의 입체감 향상을 위한 3D 음향의 원근감 재현 기술을 제안한다. 먼저, 3D 영상 객체의 깊이를 추출하고 영상 객체의 깊이에 따라 오디오 객체의 거리감을 조절한다. 오디오 거리감 재현을 위해 필요한 오디오 깊이 인자는 3D 영상의 좌/우 이미지의 차이 정보로부터 오디오에 맞도록 비선형 변환을 통해 구해진다. 3D 오디오 재현 알고리즘은 기존의 서라운드 입체음향 기술과 원근감 재현 기술로 구성된다. 원근감 재현 기술은 추정된 오디오 깊이 인자에 따라 신호크기, 초기 반사음, 근거리 머리전달함수, 위상 제어를 통해서 구현된다. 특히, 3D 영상 객체가 화면 앞으로 튀어 나올 때 소리도 튀어나오도록 함으로써 3D 영상 객체와 연동되는 입체 음향을 효과를 통해 3D 방송 시청 시 오디오/비디오 입체감을 향상시켜준다. 상용화된 3DTV 를 활용하여 음질 평가 전문가들의 주관 청취 평가를 통해 제안한 원근감 재현 기술이 3D 방송 시청에 적합함을 검증한다.

  • PDF

클러스터링 알고리즘에서 저비용 3D LiDAR 기반 객체 감지를 위한 향상된 파라미터 추론 (Improved Parameter Inference for Low-Cost 3D LiDAR-Based Object Detection on Clustering Algorithms)

  • 김다현;안준호
    • 인터넷정보학회논문지
    • /
    • 제23권6호
    • /
    • pp.71-78
    • /
    • 2022
  • 본 논문은 3D LiDAR의 포인트 클라우드 데이터를 가공하여 3D 객체탐지를 위한 알고리즘을 제안했다. 기존에 2D LiDAR와 달리 3D LiDAR 기반의 데이터는 너무 방대하며 3차원으로 가공이 힘들었다. 본 논문은 3D LiDAR 기반의 다양한 연구들을 소개하고 3D LiDAR 데이터 처리에 관해 서술하였다. 본 연구에서는 객체탐지를 위해 클러스터링 기법을 활용한 3D LiDAR의 데이터를 가공하는 방법을 제안하며 명확하고 정확한 3D 객체탐지를 위해 카메라와 융합하는 알고리즘 설계하였다. 또한, 3D LiDAR 기반 데이터를 클러스터링하기 위한 모델을 연구하였으며 모델에 따른 하이퍼 파라미터값을 연구하였다. 3D LiDAR 기반 데이터를 클러스터링할 때, DBSCAN 알고리즘이 가장 정확한 결과를 보였으며 DBSCAN의 하이퍼 파라미터값을 비교 분석하였다. 본 연구가 추후 3D LiDAR를 활용한 객체탐지 연구에 도움이 될 것이다.