• 제목/요약/키워드: 3D 특징 벡터

검색결과 108건 처리시간 0.022초

3D 특징 벡터를 이용한 영아 울음소리 분류 (Classification of infant cries using 3D feature vectors)

  • 박정현;김민서;최혁순;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.597-599
    • /
    • 2022
  • 영아는 울음이라는 비언어적 의사 소통 방식을 사용하여 모든 욕구를 표현한다. 하지만 영아의 울음소리를 파악하는 것에는 어려움이 따른다. 영아의 울음소리를 해석하기 위해 많은 연구가 진행되었다. 이에 본 논문에서는 3D 특징 벡터를 이용한 영아의 울음소리 분류를 제안한다. Donate-a-corpus-cry 데이터 세트는 복통, 트림, 불편, 배고픔, 피곤으로 총 5 개의 클래스로 분류된 데이터를 사용한다. 데이터들은 원래 속도의 90%와 110%로 수정하는 방법인 템포조절을 통해 증강한다. Spectrogram, Mel-Spectrogram, MFCC 로 특징 벡터화를 시켜준 후, 각각의 2 차원 특징벡터를 묶어 3차원 특징벡터로 구성한다. 이후 3 차원 특징 벡터를 ResNet 과 EfficientNet 모델로 학습을 진행한다. 그 결과 2 차원 특징 벡터는 0.89(F1) 3 차원 특징 벡터의 경우 0.98(F1)으로 0.09 의 성능 향상을 보여주었다.

문화재의 도면 생성을 위한 벡터 실루엣 추출 (Vector Silhouette Extraction for Creating a Blueprint of Cultural Assets)

  • 정정일;조진수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.192-195
    • /
    • 2008
  • 본 논문에서는 발전하는 3D 그래픽스 기술을 이용하여 문화재의 도면 실루엣을 생성하는 방법을 제안하고자 한다. 3D 스캐너로 정밀 실측된 3D 데이터를 이용하여 문화재의 도면을 생성하기 위한 벡터 실루엣(Silhouette) 추출 과정은 다음과 같다. 먼저 실측된 3D 데이터를 정규화 된 3D공간으로 이동하고, 이동 후에는 데이터에 존재하는 모든 에지(edge)를 검출하여 에지리스트(edge list)를 생성한다. 생성된 에지리스트는 다시 윤곽에지(Contour edge)와 주름에지(Crease edge)로 분류하는데, 윤곽에지는 문화재의 윤곽 실루엣을 형성하는데 이용하고, 윤곽에지를 제외한 주름에지는 문화재의 표면 특징을 나타내는 내부문양 실루엣을 형성하는데 이용한다. 내부문양 실루엣은 사용자가 입력하는 임계값과 주름에지를 구성하는 두면의 방향 벡터의 내적을 비교하여 추출한다. 추출한 벡터 실루엣은 윤곽 실루엣과 내부문양 실루엣으로 구분되며, 두 벡터 실루엣을 이용함으로써 문화재의 구조적 해석과 표면의 특징을 해석할 수 있는 도면 실루엣 생성이 가능했다.

각 분할 스핀 영상을 사용한 3차원 얼굴 특징점 검출 방법 (Robust 3D Facial Landmark Detection Using Angular Partitioned Spin Images)

  • 김동현;최강선
    • 전자공학회논문지
    • /
    • 제50권5호
    • /
    • pp.199-207
    • /
    • 2013
  • 스핀 영상은 3차원 표면의 특징을 효과적으로 표현하기 때문에 3차원 얼굴에서 특징점을 검출하는데 많이 이용된다. 하지만 기존의 스핀 영상은 표면의 법선 벡터 방향에 따라 매우 다른 스핀 영상이 만들어지는 단점이 있다. 또한 해당 영역 내에 존재하는 모든 점을 2차원으로 변환하여 고려하기 때문에 3차원 표면 특징이 모호해질 수 있다. 본 논문에서는 검색 영역을 분할한 스핀 영상을 이용하는 3차원 얼굴 특징점 검출 방법을 제안하였다. 기준점으로부터 떨어진 각도에 따라 검색범위를 분할하여 분할된 영역 내 점들에 대해 스핀 영상을 구성하여 방향에 따른 특징 추출을 극대화했다. 법선 벡터 평탄화를 이용하여 표면 법선 벡터 방향에 대한 잡음 민감성을 줄여 정확한 형태의 스핀 영상을 얻도록 했다. 실험을 통해 제안한 방법으로 찾은 특징점과 실측 특징점과의 거리차를 비교하여 기존방법에 비해 약 34% 향상된 정확도를 얻음을 확인했다.

Optical Flow를 이용한 3차원 운동 정보에 관한 연구 (3D Motion Estimation Using Optical Flow)

  • 조혜리;이경무;이상욱
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.845-848
    • /
    • 2000
  • 운동(motion) 벡터는 보고 있는 카메라와 관측되는 대상물 사이의 상대적인 움직임에 의해서 발생되는 3차원 물체의 속도가 2차원 영상에 투사되어 맺히는 영상에서의 2차원 속도 벡터를 가리킨다 영상에서 물체의 움직임은 3차원 공간상의 운동을 알 수 있는 중요한 정보로써 물체를 추적하는데 응용되고 있다. 본 논문에서는 여러 장의 연속적인 2차원 밝기 영상으로부터 카메라의 움직임을 추정하는 문제를 다룬다. 기존의 특징 기반 추적 기법에서는 저 단계의 영상 처리 과정에서 모델과 배경의 특징점이 서로 분리되지 않거나, 모델의 특징(feature)이 소실되었을 경우, 추적이 용이하지 못하고, 카메라와 3차원 물체의 병진과 회전 운동에 의해 발생된 움직임의 경우 3차원 표적 특징이 많이 사라져서 오차가 많이 누적되기도 한다. 본 논문에서는 이러한 문제를 해결하기 위하여 목표물 및 배경 특징들을 사용하여 카메라의 운동 정보를 찾아내는 기법을 제안한다. 제안하는 3차원 카메라의 운동 정보 추정 기법은 크게 두 장의 연속된 영상으로부터 3차원 모델과 배경의 많은 특징들에 대한 광류(optical flow) 검색 과정과, 이로부터 취득한 움직임 벡터와 카메라의 비선형 운동 방정식과 Lagrange multiplier를 통한 카메라의 운동 정보 추정 과정으로 구성된다.

  • PDF

계층적 특징 학습을 이용한 3차원 물체 인식 시스템의 설계 (Design of the 3D Object Recognition System with Hierarchical Feature Learning)

  • 김주희;김동하;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권1호
    • /
    • pp.13-20
    • /
    • 2016
  • 본 논문에서는 계층적 특징 학습을 이용하여 물체의 컬러 영상과 깊이 영상으로부터 해당 물체가 속한 범주와 개체, 그리고 다양한 속성들을 효과적으로 인식할 수 있는 시스템을 제안한다. 본 시스템의 전처리 단계에서는 물체의 깊이 영상을 물체의 모양 정보를 좀 더 효과적으로 표현할 수 있는 표면 법선 벡터 데이터로 변환하고, 특징 학습 단계에서는 물체의 컬러 영상과 표면 법선 벡터 데이터로부터 두 단계에 걸쳐 패치 단위 특징과 이미지 단위의 특징을 추출해낸다. 그리고 추출된 특징 벡터들과 SVM 학습 알고리즘을 이용하여 각기 독립적인 다수의 분류 모델들을 학습한다. 미국 워싱턴 대학의 RGB-D 물체 데이터 집합을 이용한 실험을 통해, 본 논문에서 제안하는 물체 인식 시스템의 높은 성능을 확인할 수 있었다.

객체별 특징 벡터 기반 3D 콘텐츠 모델 해싱 (3D Content Model Hashing Based on Object Feature Vector)

  • 이석환;권기룡
    • 전자공학회논문지CI
    • /
    • 제47권6호
    • /
    • pp.75-85
    • /
    • 2010
  • 본 논문에서는 3D 콘텐츠 인증을 위한 객체별 특징 벡터 기반 강인한 3D 모델 해싱을 제안한다. 제안한 3D 모델 해싱에서는 다양한 객체들로 구성된 3D 모델에서 높은 면적을 가지는 특징 객체내의 꼭지점 거리들을 그룹화한다. 그리고 각 그룹들을 치환한 다음, 그룹 계수, 랜덤 변수 키와 이진화 과정에 의하여 최종 해쉬를 생성한다. 이 때 해쉬의 강인성은 객체 그룹별 꼭지점 거리 분포를 그룹 계수에 의하여 향상되고, 해쉬의 유일성은 그룹 계수를 치환 키 및 랜덤변수 키 기반의 이진화 과정에 의하여 향상된다. 실험 결과로부터 제안한 해싱이 다양한 메쉬 공격 및 기하학 공격에 대한 해쉬의 강인성과 유일성을 확인하였다.

감정확률을 이용한 동적 얼굴표정의 퍼지 모델링 (Dynamic Facial Expression of Fuzzy Modeling Using Probability of Emotion)

  • 강효석;백재호;김은태;박민용
    • 한국지능시스템학회논문지
    • /
    • 제19권1호
    • /
    • pp.1-5
    • /
    • 2009
  • 본 논문은 거울 투영을 이용하여 2D의 감정인식 데이터베이스를 3D에 적용 가능하다는 것을 증명한다. 또한, 감정 확률을 이용하여 퍼지 모델링 기반의 얼굴표정을 생성하고, 표정을 움직이는 3가지 기본 움직임에 대한 퍼지이론을 적용하여 얼굴표현함수를 제안한다. 제안된 방법은 거울 투영을 통한 다중 이미지를 이용하여 2D에서 사용되는 감정인식에 대한 특징벡터를 3D에 적용한다. 이로 인해, 2D의 모델링 대상이 되는 실제 모델의 기본감정에 대한 비선형적인 얼굴표정을 퍼지를 기반으로 모델링한다. 그리고 얼굴표정을 표현하는데 기본 감정 5가지인 행복, 슬픔, 혐오, 화남, 놀람, 무서움으로 표현되며 기본 감정의 확률에 대해서 각 감정의 평균값을 사용하고 6가지 감정 확률을 이용하여 동적 얼굴표정을 생성한다. 제안된 방법을 3D 인간형 아바타에 적용하여 실제 모델의 표정 벡터와 비교 분석한다.

거대한 구조물의 3차원 영상 재구성을 위한 외곽선 길이 정보 추출 (Outer-line measurement for 3D reconstruction of huge structures)

  • 전병승;박정민;김영중;고한석;황인준;임묘택
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.280-281
    • /
    • 2008
  • 본 논문은 큰 구조물의 3파인 영상 재구성을 위해서 획득한 2차원 영상에서 특징점을 찾아 선으로 조합한 후 선 길이 정보를 추출하는 방법을 제안한다. 거대한 구조물의 외곽선 길이 정보 추출을 위해서는 광각 카메라에 의한 영상을 획득한다. 영상에서의 외곽선들은 모델의 기울어진 정보와 형태, 모델의 크기 등을 결정하게 되는데 광각카메라 사용에 의하여 배럴왜곡, 원근투영왜곡 등이 발생한다. 외곽선 정보 추출의 순서는 먼저모델의 2차원영상을 획득하고 이로부터 왜곡이 보정된 그레이영상을 획득한다. 이 그레이영상에서 잡음을 제거하고 특징점을 찾기 위하여 SUSAN 알고리즘을 사용한다. SUSAN알고리즘 기법은 적은 계산량과 잡음에 매우 강한 장점이 있어서 영상에서의 특징점을 얻기 위한 효과적인 기법이다. 특징점을 3차원 벡터공간에서 맵핑시킨 후 X, Y, Z 좌표축으로 점과 선으로 나타내고 시작점과 끝점의 좌표를 이용하여 벡터 길이를 얻는다. 이러한 벡터 데이터와 3차원 영상 재구성을 위한 라이브러리인 OpenGL을 사용하여 3차원 공간에 거대한 구조물들을 재구성하는 소프트웨어를 개발하였다.

  • PDF

모노 카메라 영상기반 시간 간격 윈도우를 이용한 광역 및 지역 특징 벡터 적용 AdaBoost기반 제스처 인식 (AdaBoost-based Gesture Recognition Using Time Interval Window Applied Global and Local Feature Vectors with Mono Camera)

  • 황승준;고하윤;백중환
    • 한국정보통신학회논문지
    • /
    • 제22권3호
    • /
    • pp.471-479
    • /
    • 2018
  • 최근 안드로이드, iOS 등의 셋톱박스 기반의 스마트 TV에 대한 보급에 따라 제스처로 TV를 컨트롤 할 수 있는 새로운 접근을 제안한다. 본 논문에서는 모노 카메라 센서를 이용한 AdaBoost 기반 제스처 인식에 관한 알고리즘을 제안한다. 우선, 신체 좌표 추출을 위해 가우시안 배경 제거 및 Camshift 기반 자세 추적 및 추정 알고리즘을 사용한다. AdaBoost 학습 모델을 신체 정규화된 광역 및 지역 특징 벡터의 집합을 특징 패턴으로 하여, 속도가 다른 동작들을 인식할 수 있도록 하였다. 또한 속도가 다른 다양한 제스처를 인식하기 위해 다중 AdaBoost 알고리즘을 적용하였다. CART 알고리즘을 이용하여 성공적인 중요 특징 벡터를 확인하고 중요도가 낮은 특징벡터를 제거하는 방식을 적용하면서 분류 성공률이 높은 최적의 특징 벡터를 탐색하였다. 그 결과 24개의 주성분 특징 벡터를 찾았으며, 기존 알고리즘에 비해 낮은 오분류율(3.73%)과 높은 인식률(95.17%)을 지닌 특징 벡터 및 분류기를 설계하였다.

3차원 객체 인식을 위한 RGB-D 영상 특징점 추출 및 특징 기술자 생성 방법 (RGB-D Image Feature Point Extraction and Description Method for 3D Object Recognition)

  • 박노영;장영균;우운택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.448-450
    • /
    • 2012
  • 본 논문에서는 Kinect 방식의 RGB-D 영상센서를 사용하여, 깊이(Depth) 영상으로부터 3차원 객체의 기하정보를 표현하는 표면 정규 벡터(Surface Normal Vector)를 추출하고, 그 결과를 영상화하는 방법을 제안하며, 제안된 방법으로 생성된 영상으로부터 깊이 영상의 특징점 및 특징 기술자를 추출하여 3차원 객체 인식 성능을 향상시키는 방법을 제안한다. 또한 생성된 RGB-D 특징 기술자들을 객체 단위로 구분 가능한 코드북(CodeBook) 학습을 통한 인식방법을 제안하여 객체의 인식 성능을 높이는 방법을 제안한다. 제안하는 RGB-D 기반의 특징 추출 및 학습 방법은 텍스쳐 유무, 카메라 회전 및 이동 변화 등의 환경변화에 강건함을 실험적으로 증명하였으며, 이 방법은 Kinect 방식의 RGB-D 영상을 사용하는 3차원 객체/공간 인식 및 추적, 혹은 이를 응용하는 증강현실 시스템에 적용하여 사용될 수 있다.