• 제목/요약/키워드: 깊이인식

검색결과 430건 처리시간 0.028초

적응형 깊이 추정기를 이용한 미지 물체의 자세 예측 (Predicting Unseen Object Pose with an Adaptive Depth Estimator)

  • 송성호;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권12호
    • /
    • pp.509-516
    • /
    • 2022
  • 3차원 공간에서 물체들의 정확한 자세 예측은 실내외 환경에서 장면 이해, 로봇의 물체 조작, 자율 주행, 증강 현실 등과 같은 많은 응용 분야들에서 폭넓게 활용되는 중요한 시각 인식 기술이다. 물체들의 자세 예측을 위한 과거 연구들은 대부분 각 인식 대상 물체마다 정확한 3차원 CAD 모델을 요구한다는 한계점이 있었다. 이러한 과거 연구들과는 달리, 본 논문에서는 3차원 CAD 모델이 없어도 RGB 컬러 영상들만 이용해서 미지 물체들의 자세를 예측해낼 수 있는 새로운 신경망 모델을 제안한다. 제안 모델은 적응형 깊이 추정기인 AdaBins를 이용하여 스스로 미지 물체 자세 예측에 필요한 각 물체의 깊이 지도를 효과적으로 추정해낼 수 있다. 벤치마크 데이터 집합들을 이용한 다양한 실험들을 통해, 본 논문에서 제안한 모델의 유용성과 성능을 평가한다.

웨어러블 응용을 위한 CNN 기반 손 제스처 인식 (CNN-Based Hand Gesture Recognition for Wearable Applications)

  • 문현철;양안나;천승문;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 추계학술대회
    • /
    • pp.58-59
    • /
    • 2017
  • 손 제스처는 스마트 글라스 등 웨어러블 기기의 NUI(Natural User Interface)를 구현하기 위한 수단으로 주목받고 있다. 최근 손 제스처 인식에서의 인식률 개선을 위하여 다양한 인식기법이 제안되고 있으며, 딥러닝 기반의 손 제스처 인식 기법 또한 활발히 연구되고 있다. 본 눈문에서는 웨어러블 기기에서의 미디어 소비 등 다양한 응용을 위하여 CNN(Convolutional Neural Network) 기반의 손 제스처 인식 기법을 제시한다. 제시된 기법은 스테레오 영상으로부터 깊이 정보와 색 정보를 이용하여 손 윤곽선을 검출하고, 검출된 손 윤곽선 영상을 데이터 셋으로 구성하여 CNN 에 학습을 시킨 후, 이를 바탕으로 손 윤곽선 영상으로부터 제스처를 인식하는 알고리즘을 제안한다.

  • PDF

깊이영상에서 실시간 얼굴 검출을 위한 I-MCTBoost (The I-MCTBoost Classifier for Real-time Face Detection in Depth Image)

  • 주성일;원선희;최형일
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.25-35
    • /
    • 2014
  • 본 논문에서는 실시간 얼굴 검출을 위한 부스팅 기반 분류 방법을 제안한다. 제안하는 방법에서는 조명과 얼굴크기 및 변형에 강건하게 얼굴을 검출하기 위해 깊이영상을 이용하고, 깊이차이특징을 사용하여 I-MCTBoost 분류기를 통해 학습 및 인식을 수행한다. I-MCTBoost는 약분류기로 구성된 강분류기들의 연결을 통해 인식을 수행한다. 약분류기의 학습 과정은 깊이차이특징을 생성하고, 이중에서 8개의 특징을 조합하여 약분류기를 구성하며 이때 각 특징은 2진비트(binary bit)로 표현된다. 강분류기는 정해진 약분류기의 개수만큼 반복적으로 약분류기를 선택하는 과정을 통해 학습이 이루어지며, 학습 과정에서 학습 샘플의 가중치를 갱신하고 학습 데이터를 추가하여 강건한 분류를 수행할 수 있도록 한다. 본 논문에서는 깊이차이특징에 대해 설명하고 이를 이용한 I-MCTBoost의 약분류기 학습 방법과 강분류기 학습 방법에 대해 제안한다. 마지막으로 제안된 분류기를 기존 MCT를 이용한 분류기와 정성적, 정량적 분석을 통해 비교하고 제안한 분류기의 타당성과 효율성을 입증한다.

3차원 정보를 입력으로한 물체의 조형 (Object Modeling from Three-Dimensional Information)

  • 조동욱;김태용;최병욱
    • 대한전자공학회논문지
    • /
    • 제26권1호
    • /
    • pp.10-19
    • /
    • 1989
  • 본 논문에서는 깊이데이타를 이용한 물체의 조형방법을 제안한다. 입력으로 들어온 깊이데이타에서 물체의 형상특징을 추출하기 위하여 $2{\times}2$ 마스크내에서 깊이변화율을 고려한 Z축 기울기를 정의하여 각각의 원시도형(primitive)마다 가지는 크기와 방향특성을 이용하여 표면을 분류한다. 또한 여러개의 원시도형들의 조합으로 되어있는 물체에서는 핵심점을 정의하여 각 원시도형을 분리한다. 나아가 표면영역들간의 공간상의 위치관계를 구하여 인식을 위한 원시도형들간의 상관관계를 추출하였으며 제안된 방법의 유용성을 실험에 의하여 입증한다.

  • PDF

경계선 정보에 따른 가변 블럭 변위 추정을 사용한 3D modeling (3D modeling using variable block disparity estimation based on edge information)

  • 노윤향;고병철;변혜란;유지상
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.205-208
    • /
    • 2000
  • 인간의 좌·우 두 눈에 투영되는 2차원 영상의 양안 시차를 이용하여 물체의 깊이를 인식하는 스테레어 영상이라고 한다. 이러한 2차원 스테레오 영상으로부터 3차원 모델 생성을 위한 깊이 정보를 알기 위해서는 각각의 두 영상에 대응되는 점의 위치를 알 수 있는 변위의 추정이 매우 중요하다. 본 논문에서는 블록 크기에 매우 민감하게 영향 받는 영역기반 방식의 단점을 보완하기 위하여 경계선 정보를 이용한 가변 블록 방식의 변위 추정을 수행한다. 이것은 블록의 크기를 경계선 정보에 따라 가변적으로 정함으로써 정밀한 변위 추성을 할 수 있고 또한 계산량도 많이 줄일 수 있음을 알 수 있다. 이렇게 추정된 변위 정보를 이용하여 특징점에 대한 깊이 정보를 찾아 3차원 모델을 생성한다.

  • PDF

손과 얼굴의 겹침 현상을 고려한 강인한 손 추출 알고리즘 (Robust hand segmentation on hand over face occlusion)

  • 김하영;서종훈;한탁돈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.397-399
    • /
    • 2012
  • 본 연구에서는 픽셀 값이 근소한 차이를 보이는 얼굴과 손이 겹쳤을 때 손을 효과적으로 추출하는 방법을 제안한다. 제안된 알고리즘은 깊이 영상에서 연결요소를 찾음으로써 깊이 정보가 다른 손과 얼굴 영역을 분리하게 된다. 기존의 복잡한 방법을 생략하고, 이진화 영상에 적용하던 connected component labeling 기법을 gray 영상에 적용하여 깊이 영역이 비슷한 영역을 분리하였다. 이로 인하여, 손의 피부색상과 비슷한 색상을 가지는 얼굴과 손의 겹침 현상에서 강건한 손 추출 결과를 얻을 수 있었다. 그리고 보다 자연스러운 제스쳐 인식 시스템을 구축할 수 있다.

깊이정보 기반 지화 학습 프로그램 (Fingerspelling Teaching Program using Depth Information)

  • 이가영;강동현;김지온;신병석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.13-14
    • /
    • 2019
  • 이 논문에서는 깊이 카메라(depth camera)로 부터 획득한 깊이 영상을 분석하여 지화를 인식하는 기술을 개발하고 이를 이용한 지화 교육 프로그램의 구현 사례를 소개한다. 먼저 손의 16 개의 특징점을 뽑아내고, 어떤 지화인지 분류한다. 타자 연습 프로그램처럼 단어를 제시하고 그에 맞는 지화를 올바르게 표현하였는지를 검사함으로써 사용자가 지화를 학습할 수 있도록 도와주는 프로그램이다.

360° 영상 응용을 위한 벤치마크 데이터 생성 연구 (Benchmark Dataset Generation for 360-degree Image Applications)

  • 이종성;이의진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.112-115
    • /
    • 2021
  • 최근 가상현실 및 증강 현실에 대한 관심도가 높아지면서, 깊이 추정, 객체 인식, 영상 분할 등의 다양한 컴퓨터 비전 알고리즘을 360° 영상에 적용하는 연구가 활발히 진행되고 있다. 이 중, 다수의 RGB 카메라를 활용하여 3 차원 정보를 추출하는 깊이 추정 기술은 보다 나은 몰입감을 제공하기 위한 핵심 기술이다. 그러나 깊이 추정 알고리즘의 객관적 성능 평가를 위한 정제된 360° 영상 데이터셋은 극히 부족하며, 이로 인하여 관련 분야 연구에 한계가 있다. 따라서 본 논문에서는 객관적인 알고리즘 성능 평가가 가능하며, 정제된 360° 동영상 데이터셋을 제안하고, 추후 다양한 360° 영상 응용 알고리즘 개발에 활용하고자 한다.

  • PDF

공항 내 시설 안내 서비스를 위한 마커리스 한국 수어 인식 기술 (Keypoint-based Korean sign language recognition for guiding airport facilities)

  • 박한무;정윤영
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.476-478
    • /
    • 2020
  • 공항은 다양한 시설들이 혼재되어 있는 복합 공간으로 원하는 장소로 이동하기 위해서는 지도나 표지판뿐만 아니라 유·무인 안내 서비스를 이용하는 것이 필수적이다. 그러나 이러한 시설 안내 서비스는 이용객의 대다수를 차지하는 비장애인을 기준으로 설계되어 있는 것이 대부분이며, 특히 청각장애인은 음성 언어인 한국어를 통한 의사소통이 어려워 이러한 안내 서비스의 사각 지대에 놓여있다고 볼 수 있다. 본 논문에서는 청각장애인을 대상으로 공항 내 시설 위치 안내 서비스를 제공하는 키오스크를 구현하기 위해 마커리스(makerless) 한국 수어 인식 기술을 적용하는 방법을 제안한다. 기존의 알고리즘들이 수어를 인식하기 위해 사용자의 신체에 마커(marker)를 부착하거나 사용에 제약이 있는 깊이, 자기장 센서 등을 활용한 데 반해, 특징점 기반의 인식 기술은 별도의 마커 없이 RGB 영상만을 활용하여 수어를 인식하기 때문에 사용자의 편의성을 극대화할 수 있는 방법이다. 영상 기반의 마커리스 수어 인식 기술을 위치 안내 키오스크에 적용함으로써 청각장애인이 다른 사람의 도움 없이 공항 시설을 쉽고 안전하게 이용할 수 있도록 지원할 수 있으며, 나아가 배리어프리 (barrier-free) 공항을 구현하는 데에 큰 도움이 될 수 있을 것으로 기대된다.

  • PDF

퍼지적분을 이용한 웨이블릿 기반의 3차원 얼굴 인식 (Wavelet based Fuzzy Integral System for 3D Face Recognition)

  • 이영학;심재창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권10호
    • /
    • pp.616-626
    • /
    • 2008
  • 깊이 값에 따른 얼굴의 형상은 사람의 특징을 나타내는 중요한 요소 중의 하나로서 각 사람마다 다른 모양을 가지고 있으며, 얼굴 영상으로부터 분리한 주파수 성분은 동일한 얼굴에 대하여 또 다른 중요한 하나의 얼굴 특징으로 볼 수 있다. 본 논문은 3차원 얼굴 영상으로부터 등고선 값에 의해 추출된 영역에 대하여 각 영역별로 주파수 분리를 하여 특징을 추출한 후 이 주파수에 대한 퍼지적분을 적용한 얼굴 인식 알고리즘을 제안한다. 먼저 객체와 배경을 분리하여 얼굴을 추출한 후 얼굴에서 가장 두드러진 형태인 코끝을 찾고, 회전에 대해 정규화를 실시한다. 얼굴의 등고선 영역은 코끝을 기준으로 깊이 값에 따라 영역이 추출되며 사람마다 서로 다른 형상 특징을 가진다. 등고선에 따라 획득된 3차원 얼굴 영상으로부터 이산 웨이블릿 변환을 이용하여 4가지의 주파수 성분을 추출하여 특징정보로 사용한다. 각각의 웨이블릿 주파수 성분을 추출한 등고선 영역에 대해 차원의 감소를 위하여 고유얼굴 추출과 특징 공간상에서 클래스간의 분리를 최대화시키기 위해 선형판별분석 알고리즘을 이용하여 유사도를 비교하였다. 클래스간의 분별 정보를 등고선 영역과 각 영역의 주파수 영역에 대해 퍼지적분 방법을 사용하여 인식률을 향상 시켰으며, 깊이 혼합 방식의 경우는 98.6%의 인식률을 나타내었다. 제안된 방법이 다른 알고리즘보다 인식률이 향상되었다.