• 제목/요약/키워드: 특징 히스토그램

검색결과 441건 처리시간 0.023초

가변템플릿과 신경회로망을 이용한 실시간 눈 영역의 추적 (A Realtime Tracking of Eye Region Using Deformable Template and Neural Network)

  • 김도형;이선화;이학만;차의영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.247-250
    • /
    • 2000
  • 본 논문에서는 다양한 배경을 가지는 연속적인 얼굴 영상에서 실시간으로 눈의 위치를 자동적으로 추출하는 방법에 대하여 제시한다. 얼굴 요소 중에서 눈은 얼굴 인식 분야에 있어서 중요한 특징을 나타내는 주 요소로써 주로 히스토그램 분석과 색상 정보를 이용하여 눈 영역의 윤곽을 추출하는 방법이 제기되고 있다. 본 논문에서는 명암의 변화에도 비교적 적응력이 강한 이진화 기법을 사용하여 원영상을 이진화하고, 가변 템플릿(Deformable Template)방법을 사용하여 후보 영역을 추출한다. 이러한 후보영역들은 ART2 신경회로망을 이용하여 병합되며, 병합된 후보 영역들은 얼굴 요소의 기하학적 사전지식을 기반으로 검증되어, 시간에 따라 모양변화가 급변하는 눈 영역에 대한 실시간 추출을 가능하게 한다. 이상의 연구 결과는 교통사고 방지를 위한 눈의 졸림감지 등의 응용 시스템에 이용될 수 있다.

  • PDF

3차 칼라 오브젝트 관계에 의한 내용 기반 영상 검색 (Content-Based Image Retrieval using 3rd Order Color Object Relation)

  • 권희용;최재우;이인행;조동섭;황희융
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.500-502
    • /
    • 1998
  • 최근 정보 사회에서 중요한 기술로 자리잡은 멀티미디어 정보 검색에 대한 다양한연구가 진행 중에 있다. 본 논문은 정지 화상에 대한 CBIR(Content-Based Image Retrieval)방법 중 칼라 정보를 이용한 방법에서 공간 정보를 충분하게 표현할 수 있는 알고리즘을 제안한다. 일반적으로 칼라 정보를 이용한 CBIR에서는 공간정보를 표현하기 위하여 인위적으로 영상을 여러 개로 분할하는 방법이나 영상의 히스토그램 내에서 영상의 위치 정보를 이용하는 방법 등이 연구되었다. 본 논문에서는 기존의 방법을 칼라 오브젝트의 추출 방법에 따라 1차와 2차 관계에 의한 방법으로 분류하고, 이동, 회전 특히 크기 변화(축소, 확대)에 탁월한 성능을 보이는 3차 칼라 오브젝트 관계를 이용한 방법을 소개한다. 제안된 알고리즘은 주어진 영상으로부터 양자화 된 24개의 버킷(bucket)을 생성해서 각 버킷 내의 칼라에 대한 색의 표준 편차로 색의 분산 정도를 나타내고, 빈도수가 높은 3개 버킷의 평균 칼라 위치를 계산해서 그들의 상호 각도를 추출하여 영상의 특징 벡터로 사용하였다. 실험결과 기존 방법보다 특히 영상의 크기 변화에 대해 좋은 결과를 얻을 수 있었으며, 계산량도 적어 효율적임을 보여 주었다.

  • PDF

다양한 사용자 인터페이스를 고려한 내용기반 영상 검색시스템 (Contents Based Image Retrieval System Considering Various User Interface)

  • 방상배;이채영;남재열
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
    • /
    • pp.257-260
    • /
    • 2001
  • 내용 기반 영상 검색 시스템의 전체 구조를 살펴볼 때 질의영상을 입력하는 입력부, 입력된 질의영 상의 색상 및 형태정보를 분석하여 DB내의 영상과 유사도를 측정하는 검색 엔진부, 그리고 유사도 측정 결과 검색된 영상을 사용자에게 보여주는 출력부로 나눠볼 수 있다. 본 논문에서는 효율적인 검색 결과를 얻기 위해서 입력부에서는 사용자의 편의성을 고려한 인터페이스 설계를 논의하고, 검색엔진부 에서는 질의영상의 한 빈에 대하여 비교영상의 인접한 빈 중 유사도가 높은 빈을 검색한 후 그 위치 가 가까울수록 인접 빈에 높은 가중치를 부여하는 방식을 이용하여 히스토그램 인터섹션이 가지는 장점을 그대로 계승하면서 색상이나 명도, 태도에 약간의 차이가 존재하는 영상들들 효율적으로 검색할 수 있는 검색 기법을 제안하였다. 또한 출력부에서는 검색 시스템의 검색 효율이 뛰어나더라도 그것을 사용자에게 효과적으로 제시되지 못할 경우 일어날 검색 시스템의 효율성 반감을 고려하여 영상 특징 간의 관계성과 전체적인 일견의 효과를 제공할 수 있는 Iandscape 모델을 제안하였다.

  • PDF

디지털 방송 환경에서 비주얼 리듬을 이용한 재색인화 (Indexing method for reusing the existing information with Visual Rhythm in the digital broadcasting)

  • 조용래;설상훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2005년도 학술대회
    • /
    • pp.239-242
    • /
    • 2005
  • 본 논문은 디지털 방송에서 다양한 부가 정보 제공 및 관련 기기의 기능을 효과적으로 활용하기 위한 연구로서, 방송 시스템에서의 방송이나 편집 등을 고려하여 색인 정보를 재사용하는 알고리즘에 관한 것이다. 이를 위해 본 논문에서는 비주얼 리듬을 이용한 원본 영상과 목표 영상의 매칭을 제안하며, 비주얼 리듬의 히스토그램을 특징 벡터로 사용하여 유사도를 계산한다. 검색 시 목표 영상에 대해 우선 검색 구간을 설정하여 검색 시간을 줄이고자 하였으며, 실제 이 알고리즘을 적용한 결과 약97%의 정확도의 매칭 결과를 보였다. 또한 결과를 시각적으로 쉽게 알 수 있었기에 오류를 수정하는데 수월하였다. 이를 통해 기존의 색인화 정보를 목표 영상의 복호화작업 없이 쉽게 재사용 할 수 있어, 불필요한 비용의 증가를 방지하는 효과를 기대할 수 있다.

  • PDF

주민등록증 이미지의 숫자 인식을 통한 보고서 자동 기입 시스템 (Automatic Reporting System through ID Number Recognition at ID Card Image)

  • 이종호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.57-61
    • /
    • 2002
  • 대부분의 공문서들이 주민등록증에 기입된 정보들을 반복적으로 기입하도록 요구하는 경우가 많다. 자동으로 주민 정보들을 기입하기 위해서 기계적으로 해독 가능한 정보로는 현재 주민등록증의 이미지만이 가능하다. 본 연구에서는 주민등록증을 스캐닝해서 얻은 이미지에서 주민번호를 추출하여, 개인신용정보의 조회나 반복적인 서류 작성에 개인정보들이 자동으로 기입되는 시스템을 개발하였다. 주민증의 이미지에는 사진과 위조 방지 문양, 그리고 성명, 주소, 주민번호 등의 문자 정보들이 들어있는데, 이 중에서 주민번호 숫자만 추출하였다. 이렇게 인식된 주민번호를 이용해서, 전산화가 되어 있는 주민 정보와의 대조를 할 수 있게 하였고, 개인 정보들을 XML로 정리하여 각종 문서 양식에 자동으로 기입될 수 있도록 하였다. 위조방지문양과 스캐너의 잡음 등에 기인한 왜곡을 해소하기 위해, 히스토그램 기법을 이용하여 숫자영역을 분리하고, 이진화한 다음, 특징점(끝점, 교차점, 분기점)의 정보와 ART1를 사용하여 숫자들을 분류하였다.

  • PDF

COMS이미지 센서용 효과적인 White Balance 구현 (Implementation of Efficient White Balance of CMOS Image Sensor)

  • 송형돈;이동훈;손승일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.607-610
    • /
    • 2005
  • 상황에 따라 조명의 밝기나 종류 등에 영향으로 CMOS 이미지 카메라 센서로부터 입력 받은 영상의 색상은 원색과 차이가 있다. 이러한 왜곡된 색상을 Red, Green, Blue와 휘도를 이용하여 원래의 색으로 표현하는 과정이 White Balance이다. 사람은 색이 눈으로 입사되는 물리적인 자극 외에 대뇌의 작용으로 광원이 바뀌어도 같은 색으로 인지하는 특징이 있다. 따라서 이러한 과정이 없을 시에는 우리의 눈으로 보는 것과 영상장치를 통해서 모니터에 표시되는 영상의 색상과 차이가 생긴다. 본 논문에서는 RGB와 휘도를 이용하는 방법과 논문에서 제안한 히스토그램을 이용하는 방법에 대해 소프트웨어를 사용하여 각각의 상황에 따라 알고리즘을 적용하여 WB를 수행한 결과에 대하여 PSNR을 구하여 비교 분석한 후 최적화된 알고리즘을 이용하여 하드웨어 설계 언어인 VHDL을 사용하여 구현하고, ModelSim6.0a를 이용하여 데이터를 검증한다.

  • PDF

스테레오 영상에서 웨이블릿을 이용한 거리정보 검출 (Distance Detection Using Wavelet in Stereo Images)

  • 양석주;백중환
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.77-80
    • /
    • 2000
  • 본 논문에서는 두 대의 디지틀 카메라로 측정한 근거리 차량 스테레오 영상에서 시차(disparity)를 구한 후 전방 차량의 거리를 검출하는 방법을 제시한다. 다중 해상도 특성을 가진 변형된 웨이블릿을 이용하여 차량으로 생각되는 물체의 경계선을 구한다. 이때 전체적인 특징을 고려하고, 정확한 시차를 구하기 위해 점차적으로 해상도를 높이는 coarse to fine 방법을 이용하여 히스토그램을 분석하고 이를 통하여 얻어진 좌, 우 영상의 시차를 이용하여 전방 근거리 차량의 거리를 효과적으로 검출한다.

  • PDF

인공신경망을 이용한 판소리 마디추정 ("Pansori" Joint Assumption using Neural Network)

  • 박근호;서경숙;이준환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.975-977
    • /
    • 2014
  • 본 논문에서는 판소리 자동채보에 중요한 요소인 '합'과 '궁'의 위치 즉 마디를 인공신경망과 히스토그램을 이용하여 추정한다. 기존의 합과 궁을 추정하는 방법으로는 NCC(Normalized Cross Correlation)를 이용한 대표치 추정 윈도우와 칼만 필터를 이용하였다. 하지만 대표치 추정 윈도우를 구성하는 과정에서 단순히 15개의 특징벡터 각각의 평균을 이용하기 때문에 분별력이 떨어지고, 마디위치를 보정하는 과정에서 칼만 필터를 사용하면 전체음원이 길이가 짧을 경우 오차가 발생할 가능성이 크다. 본 논문에서 제안한 마디 추정 알고리즘은 장단별로 최대 90%이상의 정확도로 마디를 추정할 수 있다.

핵심-포즈 분포 기반 다중 시점에서의 휴먼 행동 인식 (Human Action Recognition in Various Viewpoints with a Key-Pose Distribution)

  • 김선우;석흥일;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.507-511
    • /
    • 2010
  • 휴먼 행동 인식은 크게 3D 모델 기반 방법과 템플릿 기반 방법으로 나눌 수 있다. 3D 모델 기반 방법은 휴먼의 포즈를 3D로 재구성한 뒤 특징을 추출하는 것으로 인식 정확도는 높으나 연산량이 많아 매우 비효율적이다. 반면 템플릿 기반의 방법은 간단하고 수행 시간이 빠르기 때문에 여러 논문들에서 채택되고 있다. 그러나 템플릿을 이용한다는 특성 때문에 시점, 행동 스타일의 변화 등에 따라 실루엣의 변화가 심해 인식 성능에 한계점을 가진다. 본 논문에서는 핵심-포즈들의 히스토그램으로 표현되는 핵심-포즈 분포와 광류의 변화를 이용하여 다중 시점에서의 휴먼 행동 인식 방법을 제안한다. 제안하는 방법은 IXMAS 데이터 셋을 이용한 실험에서 적은 수의 템플릿을 이용하면서도 평균 87.9%의 높은 인식률을 보였다.

  • PDF

지능형 교통 시스템을 위한 형태학적 차량 분류 알고리즘 (Morphological Vehicle Classification Algorithm for Intelligent Transportation System)

  • 김기석
    • 한국멀티미디어학회논문지
    • /
    • 제5권1호
    • /
    • pp.10-17
    • /
    • 2002
  • 제한된 도로 여건 하에서 대중 교통 활성화를 위해 전용차로 운영을 위한 지능형 무인 관리 시스템의 필요성이 대두되고 있다. 본 논문에서는 수리 형태학적 영상 처리 및 인식 기법을 적용하여 차량 검지 자동화 시스템을 연구하였다. 배경과 분리된 차량 객체 영상을 추출하였으며, 형태학적 골격을 분석하여 골격 히스토그램으로부터 차종 분류를 위한 새로운 유일 가중 골격 특징을 추출하는 알고리즘을 제안하였다. 실험을 통해 제안한 차종 분류 알고리즘이 승용차, 트럭 등의 차종 인식에 효과적임을 볼 수 있었다.

  • PDF