• 제목/요약/키워드: 다중영상표정

검색결과 21건 처리시간 0.023초

Active Shape Model과 통계적 패턴인식기를 이용한 얼굴 영상 기반 감정인식 (Video-based Facial Emotion Recognition using Active Shape Models and Statistical Pattern Recognizers)

  • 장길진;조아라;박정식;서용호
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권3호
    • /
    • pp.139-146
    • /
    • 2014
  • 본 논문에서는 얼굴 영상으로부터 자동으로 사람의 감정을 인식하는 효과적인 방법을 제안한다. 얼굴 표정으로부터 감정을 파악하기 위해서는 카메라로부터 얼굴영상을 입력받고, ASM (active shape model)을 이용하여 얼굴의 영역 및 얼굴의 주요 특징점을 추출한다. 추출한 특징점으로부터 각 장면별로 49차의 크기 및 변이에 강인한 특징벡터를 추출한 후, 통계기반 패턴분류 방법을 사용하여 얼굴표정을 인식하였다. 사용된 패턴분류기는 Naive Bayes, 다중계층 신경회로망(MLP; multi-layer perceptron), 그리고 SVM (support vector machine)이며, 이중 SVM을 이용하였을 때 가장 높은 최종 성능을 얻을 수 있었으며, 6개의 감정분류에서 50.8%, 3개의 감정분류에서 78.0%의 인식결과를 보였다.

자동 얼굴인식을 위한 얼굴 지역 영역 기반 다중 심층 합성곱 신경망 시스템 (Facial Local Region Based Deep Convolutional Neural Networks for Automated Face Recognition)

  • 김경태;최재영
    • 한국융합학회논문지
    • /
    • 제9권4호
    • /
    • pp.47-55
    • /
    • 2018
  • 본 논문에서는 얼굴인식 성능 향상을 위해 얼굴 지역 영역 영상들로 학습된 다중개의 심층 합성곱 신경망(Deep Convolutional Neural Network)으로부터 추출된 심층 지역 특징들(Deep local features)을 가중치를 부여하여 결합하는 방법을 제안한다. 제안 방법에서는 지역 영역 집합으로 학습된 다중개의 심층 합성곱 신경망으로부터 추출된 심층 지역 특징들과 해당 지역 영역의 중요도를 나타내는 가중치들을 결합한 특징표현인 '가중치 결합 심층 지역 특징'을 형성한다. 일반화 얼굴인식 성능을 극대화하기 위해, 검증 데이터 집합(validation set)을 사용하여 지역 영역에 해당하는 가중치들을 계산하고 가중치 집합(weight set)을 형성한다. 가중치 결합 심층 지역 특징은 조인트 베이시안(Joint Bayesian) 유사도 학습방법과 최근접 이웃 분류기(Nearest Neighbor classifier)에 적용되어 테스트 얼굴영상의 신원(identity)을 분류하는데 활용된다. 제안 방법은 얼굴영상의 자세, 표정, 조명 변화에 강인하고 기존 최신 방법들과 비교하여 얼굴인식 성능을 향상시킬 수 있음이 체계적인 실험을 통해 검증되었다.

다중 분류기의 판정단계 융합에 의한 얼굴인식 (Multi-classifier Decision-level Fusion for Face Recognition)

  • 염석원
    • 대한전자공학회논문지SP
    • /
    • 제49권4호
    • /
    • pp.77-84
    • /
    • 2012
  • 얼굴인식 기술은 지능형 보안, 웹에서 콘텐츠 검색, 지능로봇의 시각부분, 머신인터페이스 등, 활용이 광범위 하다. 그러나 일반적으로 대상자의 표정과 포즈 변화, 주변의 조명 환경과 같은 문제가 있으며 이와 더불어 원거리에서 획득한 영상의 경우 저해상도를 비롯하여 블러와 잡음에 의한 영상의 열화 등의 여러 가지 어려움이 발생한다. 본 논문에서는 포톤 카운팅(Photon-counting) 선형판별법(Linear Discriminant Analysis)을 이용한 다중 분류기(Classifier)에 의한 판정을 융합하여 얼굴 영상 인식을 수행한다. Fisher 선형판별법은 집단 간 분산을 최대로 하고 집단 내 분산을 최소로 하는 공간으로 선형 투영하는 방법으로, 학습영상의 수가 적을 경우 특이행렬 문제가 발생하지만 포톤카운팅 선형 판별법은 이러한 문제가 없으므로 차원축소를 위한 전 처리 과정이 필요 없다. 본 논문의 다중 분류기는 포톤 카운팅 선형판별법의 유클리드 거리(Euclidean Distance) 또는 정규화된 상관(Normalized Correlation)을 적용하는 판정규칙에 따라 구성된다. 다중분류기의 판정의 융합은 각 분류기 cost의 정규화(Normalization), 유효화(Validation), 그리고 융합규칙(Fusion Rule)으로 구성된다. 각 분류기에서 도출된 cost는 같은 범위로 정규화된 후 유효화 과정에서 선별되고 Minimum, 또는 Average, 또는 Majority-voting의 융합규칙에 의하여 융합된다. 실험에서는 원거리에서 획득한 효과를 구현하기 위하여 고해상도 데이터베이스 영상을 인위적으로 Unfocusing과 Motion 블러를 이용하여 열화하여 테스트하였다. 실험 결과는 다중분류기 융합결과의 인식률은 단일분류기보다 높다는 것을 보여준다.

지형공간정보 생성을 위한 KOPMSAT-2 영상의 활용성 분석 (Analysis for Practical use as KOMPSAT-2 Imagery for Product of Geo-Spatial Information)

  • 이현직;유지호;고영창
    • 대한공간정보학회지
    • /
    • 제17권1호
    • /
    • pp.21-35
    • /
    • 2009
  • KOMPSAT-2(KOrean MultiPurpose SATellite-2)위성은 GSD(Ground sample distance) 1m급 전정색(panchromatic) 영상과 GSD 4m급의 다중분광(multispectral)영상을 동시에 제공하는 세계 7번째 고해상도(High-Resolution) 위성으로 지도제작, 국토모니터링, 환경 등 여러 분야에서의 다양한 활용이 기대된다. 그러나, KOMPSAT-2영상은 다중분광센서(MSC : Multi Spectral Camera)의 복잡성과 보안성에 의해 위성궤도 및 자세정보 등 영상 취득 시 기하학적 정보 및 영상이 제한적으로 제공되고 있어 KOMPSAT-2 영상을 이용한 다양한 연구가 미흡한 실정이다. 이에 본 연구에서는 KOMPSAT-2의 스테레오 영상을 이용하여 DEM 및 정사영상 제작실험을 수행하여 KOMPSAT-2 영상을 이용한 지형공간정보 생성 가능성을 타진하고자 하였다. KOMPSAT-2영상을 이용한 DEM(Digital Elevation Model) 및 정사영상을 제작하기 위해서는 먼저 표정해석(orientation)을 수행하여야 한다. DEM을 제작하여 정확도를 분석한 결과, 전반적으로 수치지도에 비해 표고가 높게 추출되었다. 평지부에서는 평균 1.8m, 구릉지에서는 평균 7.2m, 산지에서는 평균 11.9m의 표고오차를 나타냈다. 본 연구를 통해 생성된 정사영상의 수평위치오차 평균은 ${\pm}3.081m$로 1:5,000 수치지도 수평위치오차 허용범위인 ${\pm}3.5m$ 준하는 것으로 나타났다. KOMPSAT-2호 영상을 이용하여 DEM 및 정사영상을 제작한 결과, 1:5,000급의 수치지도제작 및 지형공간정보 생성에 활용할 수 있을 것으로 판단된다.

  • PDF

비디오 카메라를 이용한 3차원 도로중심선 추출 (The Extract of 3D Road Centerline Using Video Camera)

  • 서동주;이종출
    • 한국도로학회논문집
    • /
    • 제8권1호
    • /
    • pp.65-75
    • /
    • 2006
  • 컴퓨터의 발전에 따라 현재 제4세대 수치사진측량의 활용도가 광범위하게 진행되고 있다. 특히 비디오동영상을 이용하여 실용적이며, 비전문가들도 활용할 수 있는 부분들이 증가하고 있다. 이러한 현시점에서 국가산업의 중추적인 시설물 도로분야에서 도로안전진단과 유지관리목적으로 도로정보획득 및 도로정보수집에 많은 연구를 하고 있다. 따라서, 본 연구에서는 실용성, 경제성이 있는 비전문가용인 디지털비디오 동영상을 이용하여 도로증심선의 3차원 위치정보를 추출하여 도로정보화사업의 기본적인 자료로 제공되리라 판단된다.

  • PDF

수치영상을 이용한 도로 노면관리시스템 개발 (Development of Road Surface Management System using Digital Imagery)

  • 서동주
    • 한국지리정보학회지
    • /
    • 제10권1호
    • /
    • pp.35-46
    • /
    • 2007
  • 본 연구에서는 수치영상을 이용하여 아스팔트 콘크리트포장 도로를 대상으로 차량에 비디오 카메라를 설치하여 도로에서 일정하게 차량속도를 유지하면서 촬영된 수치 영상정보로 객체 지향적인 언어인 Delphi를 이용하여 도로노면정보(균열, 소성변형, 종평탄성)를 획득할 수 있는 도로노면 관리시스템을 개발하고, 개발된 시스템은 동영상 및 그래프를 이용하여 시각화 효과를 증진시킬 수 있도록 하였다. 다중영상표정과 광속조정법에 의해 결정된 도로노면의 3차원 좌표의 정확도를 분석한 결과 표준 오차의 평균은 X방향으로 0.0427m, Y방향으로 0.0527m, Z방향으로 0.1539m로 나타났다. 이 값은 우리나라에서 현재 제작하여 사용하고 있는 축척 1:1,000 이하의 지도제작 및 GIS 자료로서 충분히 활용성이 있다. 수치영상을 이용하여 12개소에 대하여 균열폭의 정확도를 분석한 결과 표준오차가 ${\pm}0.256mm$로 정밀도가 아주 높게 나타났으며, 또한 소성변형량을 비교하기 위하여 4개소의 실측된 횡단면과 영상으로부터 추출된 횡단면을 비교한 결과 최대 오차는 10.80mm로 나타났으나, 작업능률면에서는 실용성이 있다고 판단된다.

  • PDF

디지털 영상을 이용한 수중구조물 측량 (Submerged Structure Surveying using Digital Image)

  • 박경식;정성혁;안정욱;이재기
    • 한국측량학회지
    • /
    • 제23권4호
    • /
    • pp.401-408
    • /
    • 2005
  • 현재 많은 구조물들이 수중에 건설되고 있으나. 수중환경은 지상과 비교하여 다른 매질로 이루어져 있기 때문에 수중구조물의 측정이 어려운 실정이다. 일반적으로 수중 구조물의 측정 방법은 줄자나, 깊이 게이지, 음향 위치시스템 등을 사용한다. 그러나, 줄자는 수중에서 정확한 장력을 가하기가 어렵기 때문에 정확한 거리를 측정하기 어렵고, 깊이 게이지는 설치에 장시간이 걸리는 단점이 있으며, 음향위치시스템은 제한된 공간에서 밖에 작업을 할 수 없고, 가격이 고가이다. 따라서, 본 연구에서는 첫째, 물-유리-공기와 같은 다중매질에서 광선의 경로를 이해하며 둘째, 현장에서 카메라 검정을 실시하여 내부표정요소를 비교하였다. 셋째, 큐브를 이용한 정확도 실험을 통해 사진측량을 수중대상물에 적용할 수 있는지의 여부를 알아보고, 마지막으로 교각모형과 하상의 수중대상물에 대해 수중사진측량을 수행하였다. 실험결과 수중 구조물과 수중지형에 수중사진측량을 적용하는 것이 가능하다는 결론을 얻었다.

인체 계측을 위한 수치모형생성 (The Digital Model Generation for the Human Body Measurement)

  • 이재기;최석근;임인섭
    • 한국측량학회지
    • /
    • 제15권1호
    • /
    • pp.81-89
    • /
    • 1997
  • 인체의 형상 및 크기는 인류학뿐만 아니라 일상 생활용품의 설계에서도 중요한 요소가 되고 있다. 비록 새로운 기법의 3차원 계측이 도입되고 제안되었지만, 여전히 결과분석 및 계측방법에 대한 많은 문제점들이 있다. 본 연구에서는 취득된 영상의 내·외부 표정요소, 사진좌표를 얻고 광속조정을 통해 대상물 좌표를 계산하고 다중영상을 접합하여 대상물을 도화하고 Auto-CAD나 다른 Graphic 처리 Utility를 이용하여 3차원 수치모형을 생성하였다. 그 결과, 인체의 수치모형이 일단 생성되면, 많은 응용분야에서 설계자가 필요로 하는 정보를 얻을 수 있고, 기하학적인 많은 정보를 쉽게 얻을 수 있음을 알았다. 따라서 수치모형 생성을 통한 간접적인 인체계측의 가능성을 제시하고자 한다.

  • PDF

공연장에서 다중 몰입도 측정을 위한 시스템 개발 (System Development for Measuring Group Engagement in the Art Center)

  • 류준모;최일영;최이권;김재경
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.45-58
    • /
    • 2014
  • 몰입은 관람객이 콘텐츠를 관람할 때 관람객들이 콘텐츠에 몰두하고 있는 심리적 상태를 의미하는 것으로, 관람객의 몰입경험은 콘텐츠의 만족도에 긍정적인 영향을 미친다. 따라서 공연 같은 콘텐츠를 제공하는 기업들은 콘텐츠의 흥행을 위해 관람객의 몰입도를 측정하는 것은 매우 중요하다. 설문 등의 표본조사 방법을 통해 관람객의 몰입도를 측정 연구는 방송분야 등 에서 널리 사용되고 있다. 이러한 몰입도 측정방법은 콘텐츠 관람 이후 설문을 실시하기 때문에 몰입도를 실시간으로 측정할 수 없을 뿐만 아니라 몰입도 측정의 정확성이 저하되는 문제 등이 있다. 이러한 문제를 해결하기 위하여 생리적 반응이나 얼굴 표정 분석, 그리고 움직임 관찰 방법 등을 이용하여 몰입도를 측정하는 연구가 수행되고 있다. 생체 신호를 이용하여 몰입도를 측정하는 연구의 경우, 1인을 대상으로 생체신호를 측정할 뿐만 아니라, 많은 데이터 처리 시간과 비용이 소모되는 단점이 있어 많은 관람객이 관람하는 공연장에 적용하기에는 한계가 있다. 얼굴 표정인식 통해 몰입도를 측정하는 경우도 1인을 대상으로 하고 있으며, 밝은 조명의 실험실 환경에서만 가능하다는 단점이 존재한다. 또한 관람객들의 움직인 동기화를 이용하여 몰입도를 특정한 연구는 다중관객을 대상으로 하였지만, 이는 실험실 환경에 한정하여 적용된 사례이다. 따라서 본 연구에서는 공연장, 시사회관 등 많은 관람객들이 콘텐츠를 관람하는 실제 환경에서 다중관람객이 다중몰입도의 정량적 평가를 위한 시스템을 설계하고 개발하였다. 제안된 시스템은 외부장치, 서버, 내부장치 등의 3부분으로 구성되어 있다. 서울시 마포구 상암동에 위치한 DMC 홍보관에 상설 전시장으로 운영하고 있으며, 관람객들을 대상으로 데이터를 획득하고 있다. 제안하고 있는 시스템을 활용하면 콘텐츠의 어느 구간에서 관객들이 몰입을 하고 있는지, 어느 구간에서 몰입을 하고 있지 못한지 분석가능하기 때문에, 향후 콘텐츠 제작 및 마케팅에 유용하게 활용할 수 있을 것으로 기대된다.

정사모자이크 제작을 위한 Agisoft Metashape의 병렬처리 성능 평가 (Assessment of Parallel Computing Performance of Agisoft Metashape for Orthomosaic Generation)

  • 한수희;홍창기
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.427-434
    • /
    • 2019
  • 본 연구에서는 SfM (Structure from Motion) 기술을 기반으로 항공삼각측량을 수행하고 3차원 포인트 클라우드를 생성하며 정사모자이크를 제작할 수 있는 Agisoft Metashape의 병렬처리 성능을 평가하였다. SfM의 속성상 상호표정에 해당하는 Align photos와 3차원 포인트 클라우드를 생성하는 Build dense cloud가 대부분의 시간을 차지하는데, Metashape에서는 이러한 과정에서 CPU (Central Processing Unit)의 다중코어와 함께 GPU (Graphics Processing Unit)를 이용하여 병렬처리를 수행할 수 있다. 세 가지 병렬처리 방법(CPU only, GPU only, CPU + GPU)과 두 가지 운영체제(Windows, Linux)를 조합하여 총 여섯 가지 조건으로 대용량 무인기 영상으로부터 정사모자이크를 제작하였다. 아울러 사용자의 개입 없이 자동화된 방법으로 영상에서 지상기준점을 인식하여 항공삼각측량의 RMSE (Root Mean Square Error)를 측정함으로써 각 조건에 따른 결과의 일관성을 평가하였다. 4220만 화소의 무인기 영상 521장으로부터 정사모자이크를 제작한 결과, 본 연구에서 사용한 시스템에서는 CPU와 GPU의 조합이 가장 나은 성능을 나타내었고 모든 조건에서 Linux가 Windows보다 나은 성능을 나타내었다. 그러나 항공삼각측량의 RMSE를 측정한 결과, 각 설정에 따른 RMSE 값에서 오차 범위 안에서 미세한 차이가 나타났다. 따라서 Metashape는 운영체제 및 병렬처리 여부에 관계없이 동일한 결과가 도출되도록 개선할 여지가 있는 것으로 판단된다.