• 제목/요약/키워드: 3차원 얼굴영상

검색결과 172건 처리시간 0.034초

휴먼 헤드포즈 정보를 이용한 3차원 공간 내 응시점 추정 (Estimation of a Gaze Point in 3D Coordinates using Human Head Pose)

  • 신채림;윤상석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.177-179
    • /
    • 2021
  • 본 논문은 실내 공간에서 상호작용 로봇이 사용자의 시선이 응시하는 목표지점의 위치정보를 추정하는 방법을 제안한다. 저가의 웹캠으로부터 RGB 영상을 추출하고, 얼굴검출(Openface)모듈로부터 사용자의 헤드포즈 정보를 획득한 후 기하학적 연산을 적용하여 3차원 공간 내 사용자의 응시방향을 추정하게 된다. 추정된 응시방향과 테이블 상의 평면과의 상관관계를 통하여 최종적으로 사용자가 응시하는 목표 지점의 좌표를 추정하게 된다.

  • PDF

3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구 (A study on the lip shape recognition algorithm using 3-D Model)

  • 배철수
    • 한국정보통신학회논문지
    • /
    • 제3권1호
    • /
    • pp.59-68
    • /
    • 1999
  • 최근 통신 시스템의 연구와 발전 방향은 목소리의 음성 정보와 말하는 얼굴 영상의 화상 정보를 함께 적용하므로서 음성 정보만을 제공하는 경우보다 높은 인식율을 제공한다. 따라서 본 연구는 청각장애자들의 언어 대체수단 중 하나인 구화(speechreading)에서 가장 시각적 변별력이 높은 입모양 인식을 일반 퍼스널 컴퓨터상에서 구현하고자 한다. 본 논문은 기존의 방법과 달리 말하는 영상 시퀀스에서 입모양 인식을 행하기 위해 3차원 모델을 사용하여 입의 벌어진 정도, 턱의 움직임, 입술의 돌출과 같은 3차원 특징 정보를 제공하였다. 이와 같은 특징 정보를 얻기 위해 3차원 형상 모델을 입력 동영상에 정합시키고 정합된 3차원 형상 모델에서 각 특징점의 변화량을 인식파라미터로 사용하였다. 그리고, 인식단위로 동영상을 분리하는 방법은 3차원 특징점 변화량에서 얻어지는 강도의 기울기에 의하여 이루어지고, 인식은 각각의 3차원 특징벡터를 이산 HMM 인식기의 인식 파라메타로 사용하였다. 본 논문에서는 한국어 10개 모음에 대하여 인식실험하여 비교적 높은 인식율을 얻을 수 있는 것으로 보아 본 연구에서 사용한 특징 벡터를 시간적 변별 요소로서 사용할 수 있음을 제시하였다.

  • PDF

얼굴인식을 활용한 실시간 인터랙티브 프로젝션 매핑 (Real-time Interactive Projection Mapping Using Face Recognition)

  • 조인재;김도희;이주헌;김경아;최유주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.1013-1016
    • /
    • 2017
  • 본 논문에서는 사각형의 형태를 벗어나 임의의 다각형 평면에 원하는 "카메라 입력 영상", "비디오 클립", 혹은 "3차원 그래픽 실시간 렌더링 영상"등을 보다 쉽게 매핑 시킬 수 있는 인터랙티브 프로젝션 매핑 소프트웨어 시스템을 설계 구현하였다. 제안 시스템은 얼굴 인식 기능을 통하여 사용자 혹은 관객이 프로젝션 매핑 작품 앞에 등장하였음을 인식하고, 관객의 모습이 미디어 콘텐츠의 일부로 실시간 포함되어 임의의 평면에 매핑하는 기능을 포함하고 있다. 제안 시스템은 프로젝션 매핑의 초보자가 쉽게 사용할 수 있도록 텍스트 기반의 구성 파일 (Configuration File)에 매핑 평면과 미디어 콘텐츠의 형태 및 내용을 정의해 주도록 하는 구조로 구성하였다. 제안 시스템의 유용성을 확인하기 위하여, 육면체, 원구형, 사각 평면 형태의 실제의 객체에 다양한 형태의 미디어 콘텐츠를 매핑 한 미디어 작품을 제작하였다.

다차원 정서모델 기반 영상, 음성, 뇌파를 이용한 멀티모달 복합 감정인식 시스템 (Multidimensional Affective model-based Multimodal Complex Emotion Recognition System using Image, Voice and Brainwave)

  • 오병훈;홍광석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.821-823
    • /
    • 2016
  • 본 논문은 다차원 정서모델 기반 영상, 음성, 뇌파를 이용한 멀티모달 복합 감정인식 시스템을 제안한다. 사용자의 얼굴 영상, 목소리 및 뇌파를 기반으로 각각 추출된 특징을 심리학 및 인지과학 분야에서 인간의 감정을 구성하는 정서적 감응요소로 알려진 다차원 정서모델(Arousal, Valence, Dominance)에 대한 명시적 감응 정도 데이터로 대응하여 스코어링(Scoring)을 수행한다. 이후, 스코어링을 통해 나온 결과 값을 이용하여 다차원으로 구성되는 3차원 감정 모델에 매핑하여 인간의 감정(단일감정, 복합감정)뿐만 아니라 감정의 세기까지 인식한다.

ASM과 SVM을 이용한 설진 시스템 개발 (Development of Tongue Diagnosis System Using ASM and SVM)

  • 박진웅;강선경;김영운;정성태
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권4호
    • /
    • pp.45-55
    • /
    • 2013
  • 본 논문에서는 설진을 위하여 얼굴 영상으로부터 혀 영역을 추출하고, 혀 영역을 6개 세부 영역으로 분할한 다음 영역별 설태 비율을 검출하는 방법을 제안한다. 얼굴 영상으로부터 혀 영역을 추출하기 위해 능동적 형태 모델방법의 하나인 ASM을 이용하였다. 검출된 혀 영역을 한의학에서 사용하는 일반적인 6개 영역으로 분할하였고, 분할된 영역 내에서의 설태 분포 정도를 SVM을 이용하여 검출하였다. SVM 분류 시 특징 벡터로는 RGB, HSV, Lab, Luv로 구성된 12차원의 벡터로부터 주성분 분석을 통하여 구해진 3차원의 벡터를 사용하였다. 실험 결과 ASM을 사용하여 혀 영역을 안정적으로 검출할 수 있었고 주성분 분석과 SVM을 활용함으로써 설태 검출율이 높아짐을 알 수 있었다.

3차원 얼굴 모델링을 위한 스캔 데이터의 통합 방법 (A Method of Integrating Scan Data for 3D Face Modeling)

  • 윤진성;김계영;최형일
    • 대한전자공학회논문지SP
    • /
    • 제46권6호
    • /
    • pp.43-57
    • /
    • 2009
  • 여러 시점에서 계측한 3차원 데이터를 통합하는 기술은 3차원 모델링에 매우 중요한 기술이다. 기존의 표면(Surface)통합 방법들은 정합오차와 잡음에 민감하다. 본 논문에서는 표면의 지역적 지형을 이용하는 표면통합 알고리즘을 제안한다. 제안하는 알고리즘은 먼저 인접한 표면 사이에서 일정 지형적 조건을 만족하는 외곽정점의 쌍, 즉 대응정점을 찾아 표면 사이의 지역을 여러 지역으로 구분한다. 다음으로 주성분 분석(PCA)을 통해 각 지역에 대한 최접합 평면(Best Pitting Plane)을 계산하여 표면 사이에 삽입될 삼각형의 생성에 이용한다. 제안하는 알고리즘은 지역적 단위로 지형을 이용하여 인접한 표면을 통합하기 때문에 정합오차와 잡음에 강건하다. 본 논문에서는 또한 변수화(Parameterization)기술을 이용하는 질감(Texture)통합 방법을 제안한다. 제안하는 방법은 통합된 표면을 각 표면의 초기시점으로 변환하고 해당 시점의 질감영상을 투영한다. 투영된 질감영상들을 통합된 표면의 2차원 변수화 표면에 할당하여 표면들이 통합된 이음새를 따라 통합한다. 실험을 통해 제안하는 방법이 얼굴모델링에 효율적임을 보인다.

하이브리드 인식 기술을 이용한 전사적 인적자원관리 (Enterprise Human Resource Management using Hybrid Recognition Technique)

  • 한정수;이정헌;김귀정
    • 디지털융복합연구
    • /
    • 제10권10호
    • /
    • pp.333-338
    • /
    • 2012
  • 인적자원관리는 IT기술을 접목하여 다양한 변화를 가져오고 있다. 특히 HRM이 집단차원의 관리, 물리적 사업장, 근무시간의 제약, 개인적 접촉 등 비과학적 방법으로 이루어졌다면, 현재의 전자적 인적자원관리(e-HRM)는 개별 차원의 관리, 가상 작업 공간의 등장(예. 스마트워크센터, 홈워크 등), 근무시간의 유연화 및 탄력화, 컴퓨터 기반의 통계자료 및 과학적 방법에 의한 분석 및 관리를 근간으로 이루어지고 있다는 점에서 큰 차이가 있다. 따라서 환경의 변화에 따라 기업들은 보다 효율적이고 전략적인 인적자원 관리 체계를 구축하기 위하여 RFID 카드, 지문인식 근태관리 시스템 등 다양한 기술을 도입하고 있다. 본 논문에서는 효율적인 전사적 인적자원 관리를 위한 멀티 카메라를 이용하여 2D 및 3D 얼굴인식기술 기반의 근태관리, 출입통제관리 시스템을 개발하였다. 여기서는 기존 2D방식의 얼굴인식기술이 가지고 있는 문제점인 조명 및 자세에 따른 인식률 저하를 극복하여 90% 이상의 인식률을 확보하였다. 또한 3D 얼굴인식방식의 문제점인 많은 계산량을 개선하기 위하여 3D와 2D 인식기술을 병행하여 처리함으로써 하이브리드 영상인식 및 인식속도를 개선할 수 있었다.

사전 클러스터링을 이용한 LDA-확장법들의 최적화 (On Optimizing LDA-extentions Using a Pre-Clustering)

  • 김상운;구범용;최우영
    • 전자공학회논문지CI
    • /
    • 제44권3호
    • /
    • pp.98-107
    • /
    • 2007
  • 얼굴인식 등과 같은 고차원 패턴인식에서 학습패턴의 수가 패턴 차원에 비해 매우 적을 경우 희소성 문제(the Small Sample Size problem)가 발생한다. 최근 이 문제를 해결하기 위하여 LDA, PCA+LDA, Direct-LDA 등을 비롯한 다양한 LDA-확장 법이 제안되었다. 본 논문에서는 LDA-확장 법으로 차원을 축소하기 전에 학습 패턴을 사전 클러스터링하여 서브 클래스 수를 증가시키는 방법으로 LDA-확장에 기반을 둔 식별기의 성능을 향상시키는 방법을 제안한다. LDA (또는 Direct-LDA)에서 축소된 특징공간의 차원은 학습패턴의 클래스 수로 제한되기 때문에 LDA의 식별 성능을 향상시킬 수 있도록 학습패턴을 사전에 클러스터링하여 서브 클래스의 수를 증가시키는 방법이다. 즉, 학습패턴의 특성공간(the eigen space)은 레인지 공간(the range space)과 널 공간(the null space)으로 구성되며, 레인지 공간의 차원은 클래스 수의 증가에 따라 증가한다. 따라서 변환 행렬을 구성할 때 클래스의 수를 늘려 널 공간을 최소화하게 되면 이 공간에 기인한 정보의 손실을 최소화 할 수 있다. 제안 방법을 X-OR 형태의 인공데이터와 AT&T와 Yale 벤취마크 얼굴영상 데이터베이스를 대상으로 실험한 결과 본 방법의 효용성을 확인하였다.

임베디드 환경에서 SIFT 알고리즘의 실시간 처리를 위한 특징점 검출기의 하드웨어 구현 (A Hardware Design of Feature Detector for Realtime Processing of SIFT(Scale Invariant Feature Transform) Algorithm in Embedded Systems)

  • 박찬일;이수현;정용진
    • 대한전자공학회논문지SD
    • /
    • 제46권3호
    • /
    • pp.86-95
    • /
    • 2009
  • SIFT(Scale Invariant Feature Transform) 알고리즘은 영상 데이터로부터 객체의 꼭지점이나 모서리와 같이 색상 성분의 차가 심한 영역에서 특징점을 찾아 벡터성분을 추출하는 알고리즘으로, 현재 얼굴인식, 3차원 객체 인식, 파노라마, 3차원 영상 복원 작업의 핵심 알고리즘으로 연구 되고 있다. 본 논문에서는 SIFT 알고리즘을 임베디드 환경에서 실시간으로 처리하기 위해 가장 연산량이 많은 특징점 위치 결정 단계를 Verilog HDL 언어를 이용하여 FPGA로 구현하고 그 성능을 분석한다. 하드웨어는 100MHz 클럭에서 $1,280{\times}960$영상기준 25ms, $640{\times}480$영상기준 5ms의 빠른 연산속도를 보인다. 그리고 Xilinx Virtex4 XC4VLS60 FPGA를 타겟으로 Synplify Pro 8.1i합성툴을 이용하여 합성시 약 45,792LUT(85%)의 결과를 나타낸다.

강건한 다인종 얼굴 검출을 위한 통합 3D 피부색 모델 (Integrated 3D Skin Color Model for Robust Skin Color Detection of Various Races)

  • 박경미;김영봉
    • 한국콘텐츠학회논문지
    • /
    • 제9권5호
    • /
    • pp.1-12
    • /
    • 2009
  • 올바른 피부색 검출은 사람의 얼굴 검출 및 동작 분석에서 매우 중요한 전처리과정에 속한다. 피부 검출은 일반적으로 화소의 칼라 공간을 Non-RGB로 변형하고, 피부색의 조명 요소를 제거한 다음 피부색 분포 모델에 의해 Skin과 Non-Skin으로 분류하는 3단계로 진행된다. 이는 피부색 검출이 칼라 공간, 조명 요소의 존재 여부, 피부 모델링 방법에 따라 수행 성능에 많은 영향을 받기 때문이다. 본 연구에서는 조명 조건에 따라 피부색 모델의 범위에 차이가 있다는 사실에 기초하여 다양한 조명 조건과 복잡한 배경을 가진 영상에서 효과적으로 다인종의 피부색을 분류해내 기 위한 3차원 피부색 모델을 제시하고자 한다. 제안된 피부색 모델은 화소의 칼라 공간을 YCbCr공간으로 변형하고, 각 요소(Y, Cb, Cr) 값에 의한 3차원 피부색 모델을 형성한다. 다인종의 피부색을 함께 분할하기 위해 인종(백인, 흑인, 황인)별 피부색 모델을 먼저 생성한 후 각각의 모델에서 피부색 확률에 따라 결합한 다인종을 위한 통합 모델을 생성하였다. 또한 우리는 적은 양의 훈련 데이터로 피부색 영역을 올바르게 검출할 수 있도록 여러 단계의 피부색 영역을 설정하였다.