• 제목/요약/키워드: 얼굴영역검출

검색결과 516건 처리시간 0.021초

웨이브렛 변환과 신경망 기반 얼굴 인식 (Facial Image Recognition Based on Wavelet Transform and Neural Networks)

  • 임춘환;이상훈;편석범
    • 대한전자공학회논문지TE
    • /
    • 제37권3호
    • /
    • pp.104-113
    • /
    • 2000
  • 본 연구에서는 웨이브렛 변환과 신경망 기반 얼굴 인식 알고리즘을 제안한다. 이 알고리즘은 일정한 조도 상태에서 두 개의 영상을 그레이 레벨로 취득하고 가우시안 필터를 이용하여 영상 내에 존재하는 잡음을 제 거한 후 배경영상과 얼굴이 포함된 입력영상의 차를 구하여 차영상에 대해 축소와 팽창과정을 통한 전처리 과정을 거치게 된다. 그리고 팽창 영상으로부터 마스크를 생성하여 마스크를 얼굴이 존재하는 원 영상에 투영하여 배경과 얼굴을 분할하고 분할된 얼굴영상의 에지를 조사하여 눈, 코, 입, 눈썹 그리고 뺨이 포함된 사 각 모양의 특징영역을 검출한다. 그리고 특징영역에 대해 이산 웨이브렛 변환을 수행하여 특징벡터를 추출하고 정규화한 후 신경망의 입력벡터로 하여 학습에 의한 인식을 수행한다. 시뮬레이션 결과 학습된 영상에 대해서는 100%의 인식률을 보였고 학습되지 않는 실험적 영상에 대해서도 92%의 인식률을 나타내었다.

  • PDF

입술 영역의 움직임과 밝기 변화를 이용한 음성구간 검출 알고리즘 개발 (Voice Activity Detection using Motion and Variation of Intensity in The Mouth Region)

  • 김기백;유제웅;조남익
    • 방송공학회논문지
    • /
    • 제17권3호
    • /
    • pp.519-528
    • /
    • 2012
  • 음성구간을 검출하는 일반적인 방법은 음향신호로부터 특징값을 추출하여 판별식을 거치는 것이다. 그러나 잡음이 많은 환경에서 그 성능은 당연히 저하되며, 이 경우 영상신호를 이용하거나 영상과 음성을 동시에 사용함으로써 성능향상을 도모할 수 있다. 영상신호를 이용하여 음성구간을 검출하는 기존 방법들에서는 액티브 어피어런스 모델, 옵티컬 플로우, 밝기 변화 등 주로 하나의 특징값을 이용하고 있다. 그러나 음성구간의 참값은 음향신호에 의해 결정되므로 한 가지의 영상정보만으로는 음성구간을 검출하는데 한계를 보이고 있다. 본 논문에서는 입술 영역의 옵티컬 플로우와 밝기 변화 두 가지 영상정보로부터 특징값을 추출하고, 추출된 특징값들을 결합하여 음성구간을 검출하는 알고리즘을 제안하고자 한다. 또한, 음성구간 검출 알고리즘이 다른 시스템의 전처리로 활용되는 경우에 적은 계산량만으로 수행되는 것이 바람직하므로, 통계적 모델링에 의한 방법보다는 추출된 특징값으로부터 간단한 대수적 연산만으로 스코어를 산정하여 문턱값과 비교하는 방법을 제안하고자 한다. 입술 영역 검출을 위해서는 얼굴에서 가장 두드러진 특징점을 갖는 눈을 먼저 검출한 후, 얼굴의 구조와 밝기값을 이용하는 알고리즘을 제안하였다. 실험 결과 본 논문에서 제안하는 두 가지 특징값을 결합한 음성구간 검출 알고리즘이 하나의 특징값만을 이용했을 때보다 우수한 성능을 보임을 확인할 수 있다.

사용자 인터페이스 기능의 개인용 3D 방송단말을 위한 얼굴 및 눈인식 알고리즘의 고속 검출 방법 (High Speed Face and Eye Detection Algorithm for Personal 3D Broadcasting Devices with User Interactive Function)

  • 송혁;곽수영;배진우;최병호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.428-429
    • /
    • 2011
  • 3D 디스플레이 장치는 디스플레이 장치의 시점 수에 따라 다시점 디스플레이 장치 및 스테레오 디스플레이 장치로 구분할 수 있다. 스테레오 디스플레이 장치는 좌우 두 개의 영상을 디스플레이 방식에 따라 영상포맷을 변경하여 디스플레이에 보여지고 다시점 디스플레이는 두 개 이상의 영상 데이터를 포함하는 것으로 구분할 수 있다. 영상의 화질문제로 인하여 최근 3DTV는 스테레오 방식을 사용하고 있으며 대기업에서 양산하고 있는 기술이다. 스테레오 방식에서는 개인용 단말의 경우 사용자의 위치 및 눈의 위치에 따라 깊이감을 달리 보여주는 장치가 개발되고 있어 이에 대한 연구를 진행하였다. 이와같은 기술의 흐름에 맞춰 3D 디스플레이 장치를 위한 눈 추적 알고리즘을 구현하였다. 본 논문에는 카메라에서 입력되는 영상에서 얼굴영역을 Haar training 방법을 통하여 추출하였으며 PCA 방법을 통하여 눈 영역을 추출하였다. 알고리즘의 복잡도로 인하여 연산량을 줄이기 위하여 Downsampling 방법을 활용하여 연산량을 약 26% 감소시켰다. 본 연구 결과를 통하여 얼굴 및 눈 추적 알고리즘 구현시 최적화를 위하여 필요한 프로세스를 예측할 수 있다.

  • PDF

소형 DISPLAY 장치를 위한 비 메모리 피부 검출 알고리즘 및 HARDWARE 구현 (Memory-Free Skin-Detection Algorithm and Implementation of Hardware Design for Small-Sized Display Device)

  • 임정욱;송진근;하주영;강봉순
    • 한국정보통신학회논문지
    • /
    • 제11권8호
    • /
    • pp.1456-1464
    • /
    • 2007
  • 정보의 보안 및 감시, 관리에 대한 중요성의 증대와 공항, 항만 및 일반 기업에서의 얼굴 및 피부 인식을 이용한 패스워드 제어 시스템이 활용됨으로써 피부색 검출에 관한 연구가 지속적으로 이루어져 왔다. 뿐만 아니라 광범위 통신망을 이용한 화상 통신 및 전자 결재 등 그 적용 범위가 급속하게 확산됨에 따라 정확한 피부색 검출의 중요성이 그 무엇보다 커지고 있다. 본 논문에서는 인종별로 수집된 수백 개의 인물 이미지로부터 얻어진 정보를 사용해 피부색의 YCbCr을 파악하고 이 중 Cb와 Cr 정보만을 이용하여 피부 영역을 설정하였으며, 적응적인 피부 범위 설정을 통하여 그 피부 영역의 포함 여부에 따라 피부색을 검출하는 효율적이고 간단한 구조를 제안한다. 이것은 메모리를 사용하지 않는 ID 처리를 가능하게 함으로써 모바일 장비와 같은 상대적으로 작은 크기의 하드웨어나 시스템으로의 적용을 가능하게 하였다. 그리고 선택적 모드를 추가함으로써 더욱 향상된 피부 검출을 할 수 있을 뿐 만 아니라 복잡한 알고리즘을 사용하는 기존의 얼굴 인식 기술에 상응하는 결과를 보여준다.

다중 얼굴 태깅 자동화 (Automatic Tagging Scheme for Plural Faces)

  • 이충연;이재동;진성아
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.11-21
    • /
    • 2010
  • 최근 웹페이지의 생성 및 웹이 가진 정보량이 기하급수적으로 늘면서 사용자의 검색 목적을 파악하여 효율을 높이기 위한 다양한 방법이 연구되고 있으며, 태깅 시스템이 하나의 대안으로 떠오르고 있다. 태깅 시스템은 인터넷 사용자로 하여금 태그라고 불리는 메타데이터를 글, 사진, 동영상 등에 부여하도록 함으로써 콘텐츠의 검색 및 브라우징을 편리하게 하는 시스템이다. 이처럼 태그는 해당 페이지의 대표 키워드를 의미하므로 콘텐츠 분류의 기준을 마련할 수 있으나, 사용자에 의해 직접 입력되어야 하는 수고가 필요하고, 또한 무분별한 태깅으로 인해 오히려 분류에 방해가 되는 등의 문제점들이 있다. 본 논문에서는 이러한 태깅의 문제를 해결하기 위한 방법으로 얼굴인식 알고리즘을 활용한 영상콘텐츠 내에서의 다중 얼굴 태깅 자동화 방법을 제시한다. 이를 위해 먼저 여러 얼굴검출 방법 중 Haar-like features와 AdaBoost 알고리즘을 이용하여 빠른 속도와 높은 정확도로 영상콘텐츠 내에서 얼굴 영역을 검출한다. 이후 PCA와 고유얼굴을 이용하여, 검출해 낸 얼굴을 데이터베이스에 미리 저장해 놓은 프로필 사진과 비교, 인식해냄으로써 해당 인물에 대한 정보를 불러와서 자동으로 태깅하는 시스템을 구현하였다. 이러한 새로운 방식의 태깅 기술은 현존하는 사진공유, 쇼핑, 검색 등의 수많은 웹서비스에 적용이 가능하며, 특히 소셜네트워크서비스에서의 사진 관리나 인물검색 등에서 활용할 때 큰 효과를 보일 것으로 기대된다.

생체기반 GMM Supervector Kernel을 이용한 운전자검증 기술 (Driver Verification System Using Biometrical GMM Supervector Kernel)

  • 김형국
    • 한국ITS학회 논문지
    • /
    • 제9권3호
    • /
    • pp.67-72
    • /
    • 2010
  • 본 논문에서는 음성과 얼굴 정보를 분석하여 자동차환경에서 운전자를 검증하는 기술을 소개한다. 음성정보를 이용한 화자검증을 위해서는 잘 알려진 Mel-scale Frequency Cepstral Coefficients(MFCCs)를 음성 특징으로 사용하였으며, 동영상을 이용한 얼굴검증에 대해서는 AdaBoost를 이용하여 검출된 얼굴 영역에 대해 주성분 분석을 수행하여 데이터의 크기가 현저히 줄어든 특징벡터를 추출하였다. 기존의 화자검증 방식에 비해 본 논문에서는 추출된 음성 및 얼굴 특징들을 Gaussian Mixture Models(GMM)-Supervector기반의 Support Vector Machine(SVM)커넬 방식에 적용하여 운전자의 음성과 얼굴을 효과적으로 검증하는 방식을 제안하였다. 실험결과 제안한 방법은 단순한 GMM 방식이나 SVM 방식보다 운전자 검증성능을 향상시킴을 알 수 있었다.

공포와 놀람 표정인식을 이용한 위험상황 인지 (Risk Situation Recognition Using Facial Expression Recognition of Fear and Surprise Expression)

  • 곽내정;송특섭
    • 한국정보통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.523-528
    • /
    • 2015
  • 본 논문은 얼굴의 표정 인식을 이용한 위험상황 인지 알고리즘을 제안한다. 제안방법은 인간의 다양한 감정 표정 중 위험상황을 인지하기 위한 표정인 놀람과 공포의 표정을 인식한다. 제안방법은 먼저 얼굴 영역을 추출하고 검출된 얼굴 영역으로부터 눈 영역과 입술 영역을 추출한다. 각 영역에 유니폼 LBP 방법을 적용하여 표정을 판별하고 위험 상황을 인식한다. 제안방법은 표정인식을 위해 사용되는 Cohn-Kanade 데이터베이스 영상을 대상으로 성능을 평가하였다. 이 데이터베이스는 사람의 기본표정인 웃는 표정, 슬픈 표정, 놀란 표정, 화난 표정, 역거운 표정, 공포 표정 등 6가지의 표정영상을 포함하고 있다. 그 결과 표정 인식에 좋은 결과를 보였으며 이를 이용하여 위험상황을 잘 판별하였다.

Rank Order Filter와 화소값 차이를 이용한 강인한 눈동자 검출 (Robust Pupil Detection using Rank Order Filter and Pixel Difference)

  • 장경식
    • 한국정보통신학회논문지
    • /
    • 제16권7호
    • /
    • pp.1383-1390
    • /
    • 2012
  • 이 논문에서는 얼굴 영상에 대해 rank order 필터와 화소 값 차이를 사용하여 강인하게 눈동자를 찾는 방법을 제안한다. 개선된 rank order 필터를 사용하여 얼굴 영상에서 눈동자 후보점을 찾는다. 눈동자와 흰자위의 경계에서 화소값 변화가 크다는 사실을 이용하여 눈썹 등 눈동자가 아닌 위치에 있는 눈동자 후보점들을 제거한다. 눈동자 후보점을 두 점간의 거리와 각도를 이용하여 쌍으로 묶고 눈동자 영역에서의 밝기 정보를 이용한 적합도 함수를 적용하여 최종 눈동자를 추출한다. BioID 얼굴 데이터베이스에 있는 얼굴 영상 400개에 대한 실험 결과 90.25%의 눈동자 추출율을 보여 기존 방법보다 4% 개선된 결과를 얻었으며, 특히 안경을 착용한 얼굴 영상의 경우 기존 방법보다 약 12% 개선된 결과를 얻었다.

입술 움직임 정보를 이용한 실시간 화자 클로즈업 시스템 구현 (Real Time Speaker Close-Up System using The Lip Motion Informations)

  • 권혁봉;장언동;윤태승;안재형
    • 한국멀티미디어학회논문지
    • /
    • 제4권6호
    • /
    • pp.510-517
    • /
    • 2001
  • 본 논문에서는 다수의 사람이 존재하는 입력영상에서 입술 움직임 정보를 이용한 실시간 화자 클로즈업(close-up) 시스템을 구현한다. 칼라 CCD 카메라를 통해 입력되는 동영상에서 화자를 검출한 후 입술 움직임 정보를 이용하여 다른 한 대의 카메라로 화자를 클로즈업한다. 구현된 시스템은 얼굴색 정보와 형태 정보를 이용하여 각 사람의 얼굴 및 입술 영역을 검출한 후, 입술 영역 변화량을 이용하여 화자를 검출한다. 검출된 화자를 클로즈업하기 위하여 PTZ(Pan/Tilt/Zoom) 카메라를 사용하였으며, RS-232C 시리얼 포트를 이용하여 카메라를 제어한다. 실험결과 3인 이상의 입력 동영상에서 정확하게 화자를 검출할 수 있다.

  • PDF

Adaboost를 이용한 모바일 환경에서의 홍채인식을 위한 눈 검출에 관한 연구 (A Study on Eye Detection by Using Adaboost for Iris Recognition in Mobile Environments)

  • 박강령;박성효;조달호
    • 전자공학회논문지CI
    • /
    • 제45권4호
    • /
    • pp.1-11
    • /
    • 2008
  • 본 논문에서는 adaboost(adaptive boosting)를 이용한 눈 검출 알고리즘을 제안한다. 또한 기존의 adaboost를 이용한 눈 검출 알고리즘의 문제점으로 지적된, 실제 눈이 아님에도 불구하고, 눈으로 찾는 오검출율(false alarm rate)를 감소시키기 위해 각막 면에 생성되는 조명의 반사광을 모델링을 통해 추정하고 adaboost의 학습과 눈 검출에 사용되는 박스의 최적의 크기를 실험을 통해 결정하였다. 위의 결과로 검출된 눈 영역을 중심으로 일정 영역에 대하여 동공과 홍채 영역을 원형검출기(circular edge detector)를 이용하여 검출하였다. 실험결과 휴대폰으로 취득한 얼굴영상에서 약 99%의 눈 검출 정확도를 나타내었으며 휴대폰 환경에 적용했을 때 처리시간은 1초 내외 소요됨을 알 수 있었다.