• 제목/요약/키워드: Vertical projection histogram

검색결과 15건 처리시간 0.018초

눈 깜박임 패턴을 이용한 졸음 검출 (Drowsiness Detection using Eye-blink Patterns)

  • 최기호
    • 한국ITS학회 논문지
    • /
    • 제10권2호
    • /
    • pp.94-102
    • /
    • 2011
  • 본 논문은 눈 깜박임 패턴을 이용한 새로운 졸음 검출 알고리즘을 제안하였다. 유한오토마타를 이용한 졸음 검출 모델을 제안하여 눈감은 상태를 나타내는 입력 심벌의 개수만을 체크함으로써 눈 깜박임, 졸음, 수면 검출을 용이하게 하였다. 또한 수평 투영 히스토그램의 특성을 이용하여 눈동자가 있는 영역만을 구해 수직 투영 히스토그램을 취함으로써 눈썹이나 안경테와 같은 외부 영향을 최소화 시켜 정확도를 높였다. ZJU 눈 깜박임 데이터베이스를 이용한 눈 깜박임 검출 실험 결과 93% 이상의 정확도를 얻음으로써 제안된 방법의 우수함을 보였다.

영역별 수직 투영 히스토그램 매칭 및 선형 회귀모델 기반의 차량 운행 영상의 안정화 기술 개발 (Regional Projection Histogram Matching and Linear Regression based Video Stabilization for a Moving Vehicle)

  • 허유정;최민국;이현규;이상철
    • 방송공학회논문지
    • /
    • 제19권6호
    • /
    • pp.798-809
    • /
    • 2014
  • 본 논문에서는 블랙박스 혹은 운전석에 장착된 카메라로부터 얻어진 차량 영상에 대한 영역별 수직 투영 히스토그램 매칭 및 선형 회귀분석 모델을 활용한 강건한 차량 운행 동영상의 안정화 기법을 제안한다. 동영상 안정화 기법은 영상의 흔들림 보정 뿐 아니라 동영상 내 강건한 특징점 추적 및 매칭을 위한 이전의 전처리 과정으로 활용된다. 일반적으로 촬영 과정에서 많은 떨림이 포함될 수 있는 야외 CCTV 영상이나 손으로 들고 촬영된 동영상에 대한 흔들림 보정 등에 적용되고 있으나 영상 내 특징점이 지속적으로 변하고 영상의 변화 정도가 매우 심한 차량 운행 동영상에서는 적용된 사례가 드물다. 본 연구에서는 일반적인 비디오 안정화 기술이 적용되기 어려운 차량 운행 동영상에 대하여 흔들림 보정을 위한 동영상 안정화 기법을 제안한다. 제안된 기법은 입력 영상에 대한 영역별 수직 투영 히스토그램 매칭을 수행하고 선형 회귀모델을 통해 영상에 나타나는 수직 및 회전 이동 변환을 선형 근사하여 시간 영역상에서의 입력 영상에 대한 안정화를 수행한다. 제안 방법의 검증을 위해 블랙박스로 촬영된 동영상에 동영상 안정화 기술을 적용하였으며, 운행 중 불규칙한 노면으로 인한 영상의 흔들림이 효과적으로 제거되는 것을 확인할 수 있었다.

대용량 필기체 문자 인식을 위한 비선형 형태 정규화 방법의 정량적 평가 (Quantitative Evaluation of Nonlinear Shape Normalization Methods for the Recognition of Large-Set Handwrittern Characters)

  • 이성환;박정선
    • 전자공학회논문지B
    • /
    • 제30B권9호
    • /
    • pp.84-93
    • /
    • 1993
  • Recently, several nonlinear shape normalization methods have been proposed in order to compensate for the shape distortions in handwritten characters. In this paper, we review these nonlinear shape normalization methods from the two points of view : feature projection and feature density equalization. The former makes feature projection histogram by projecting a certain feature at each point of input image into horizontal-or vertical-axis and the latter equalizes the feature densities of input image by re-sampling the feature projection histogram. A systematic comparison of these methods has been made based on the following criteria: recognition rate, processing speed, computational complexity and measure of variation. Then, we present the result of quantitative evaluation of each method based on these criteria for a large variety of handwritten Hangul syllables.

  • PDF

객체영역의 컬러비와 모멘트를 이용한 내용기반 영상검색 (Content-based Image Retrieval using Color Ratio and Moment of Object Region)

  • 김은경;오준택;김욱현
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.501-508
    • /
    • 2002
  • 본 논문에서는 영상 내에 존재하는 객체영역의 컬러비와 모멘트를 이용한 영상검색을 제안한다. 객체는 영상의 중심에 위치한다는 가설 하에 미리 정의한 중심영역의 우세컬러를 기반으로 수평-수직 투영을 이용하여 객체영역과 배경영역을 분할함으로써 최적의 공간정보를 획득한다. 또한 영상 내 객체의 회전 및 크기에 불변한 특성을 가지기 위해 컬러비와 모멘트를 특징정보로 이용하며 유사성 측정은 컬러 히스토그램의 구간별 연관성을 고려하기 위해 변형된 히스토그램 인터섹션을 이용한다. 실험결과 제안한 방법이 기존의 영역분할에 의한 방법보다 효율적인 결과를 보였다.

PCB 패턴 검출을 위한 FPGA 기반 프레임 그래버 시스템 구현 (Implementation of an FPGA-based Frame Grabber System for PCB Pattern Detection)

  • 문철홍
    • 한국전자통신학회논문지
    • /
    • 제13권2호
    • /
    • pp.435-442
    • /
    • 2018
  • 본 논문에서는 FPGA를 기반으로 Camera Link (Medium)를 제공하는 PCB 패턴 검출 시스템을 구현하였다. 시스템 구현을 위해 비전 라이브러리를 IP로 구현하여 고속으로 패턴 매칭을 할 수 있도록 하였다. 구현된 IP는 영상입력용 카메라링크 IP, 히스토그램 IP, VGA 제어 IP, 수직투영 IP 및 수평투영 IP가 있다. 디지털 카메라에서 고속으로 전송되는 영상을 처리하기 위해 Xilinx사의 Virtex-5 계열의 FPGA 칩을 사용하였다. 그래버 시스템 구현을 위해 RISC 구조의 CPU인 MicroBlaze를 사용하였으며, PC와의 연동을 위해 PCI Express를 사용하였으며, 영상의 처리결과는 컴퓨터의 모니터와 7인치 LCD에 표현하였다.

에지 투영의 유사도를 이용한 압축된 영상에 대한 Reduced-Reference 화질 평가 (Reduced-Reference Quality Assessment for Compressed Videos Based on the Similarity Measure of Edge Projections)

  • 김동오;박래홍;심동규
    • 대한전자공학회논문지SP
    • /
    • 제45권3호
    • /
    • pp.37-45
    • /
    • 2008
  • 화질 평가는 원영상과 열화된 영상 간의 차이를 측정함으로써, 열화된 영상의 화질이 좋고 나쁨을 판단하는 것을 목표로 한다. 본 논문에서는 열화된 영상의 화질 평가를 위해, 원영상과 열화된 영상 전체를 비교하는 것 대신, 원영상과 열화된 영상, 각각의 특징으로 에지 투영을 이용하는 방법을 제안하였다. 여기서 에지 투영은 에지 맵에서 수직, 수평 방향으로 투영시킴으로써 얻을 수 있다. 에지 투영 시 수직, 수평 방향에 대한 그래디언트 크기를 고려함으로써, 보다 나은 화질 평가 방법을 제안하였다. 제안한 방법의 탁월함을 기존의 화질 평가 방법인 structural similarity(SSIM), edge peak signal-to-noise ratio(EPSNR), 그리고 edge histogram descriptor(EHD) 방법과 비교 실험을 통해 보였다.

PCA 복원과 HOG 특징 기술자 기반의 효율적인 보행자 인식 방법 (An Efficient Pedestrian Recognition Method based on PCA Reconstruction and HOG Feature Descriptor)

  • 김철문;백열민;김회율
    • 전자공학회논문지
    • /
    • 제50권10호
    • /
    • pp.162-170
    • /
    • 2013
  • 최근 보행자의 교통안전 개선을 위한 목적으로 차량에 장착되는 보행자 보호 시스템(PPS, Pedestrian Protection System)에 대한 관심과 요구가 증가하고 있다. 본 연구에서는 보행자 검출 후보 윈도우 추출과 셀(cell) 단위 히스토그램 기반의 HOG 특징 계산 방법을 제안하였다. 보행자 검출 후보 윈도우 추출은 주변밝기 비율체크, 수직방향 에지투영, 에지펙터(edge factor), 그리고 PCA(Principal Component Analysis) 복원 영상을 이용하였다. Dalal 의 HOG 는 겹침 블록 상의 모든 픽셀에 대해 가우시안 가중치와 삼선형보간에 의한 히스토그램 계산이 필요한데 반하여 제안하는 방법은 단위 셀마다 가우시안 가중 및 히스토그램을 계산하고 그것들을 인접 셀과 결합하므로 연산 속도가 빠르다. 제안하는 PCA 복원 에러 기반의 보행자 검출 후보 윈도우 추출은 보행자의 머리와 어깨 영역과의 차이를 기준으로 배경을 효율적으로 분류한다. 제안하는 방법은 카메라 컬리브레이션이나 스테레오 카메라를 이용한 거리 정보 없이도 영상만으로 전통적인 HOG 에 비하여 연산속도가 크게 개선된다.

연속 입력된 영상을 이용한 높이 측정 (Height Measurement using the image sequences)

  • 김태은
    • 디지털콘텐츠학회 논문지
    • /
    • 제7권1호
    • /
    • pp.9-14
    • /
    • 2006
  • 본 논문에서는 보안 시스템에서 사람 인식을 위한 중요한 단서 중의 하나인 사람의 키를 측정하는 알고리즘으로, 이미지 시퀀스에서 사람의 영역을 추출하고 기하학적 정보를 이용해 추출된 사람의 키를 측정하고자 한다. 이를 위해 단일 이동 물체 사람을 대상으로 하여 시퀀스 이미지에서 사람의 움직임 정보를 추출하고, 추출된 영역에서 수직히스토그램 투영을 하여 사람의 중심선을 찾아 머리와 발의 좌표점을 추출한다. 추출된 좌표점들은 소실점과 소실선의 기하학적 해석과 미리 입력한 다른 물체의 기준 높이를 가지고 실세계에서의 사람의 키를 측정하게 된다.

  • PDF

Optical Character Recognition for Hindi Language Using a Neural-network Approach

  • Yadav, Divakar;Sanchez-Cuadrado, Sonia;Morato, Jorge
    • Journal of Information Processing Systems
    • /
    • 제9권1호
    • /
    • pp.117-140
    • /
    • 2013
  • Hindi is the most widely spoken language in India, with more than 300 million speakers. As there is no separation between the characters of texts written in Hindi as there is in English, the Optical Character Recognition (OCR) systems developed for the Hindi language carry a very poor recognition rate. In this paper we propose an OCR for printed Hindi text in Devanagari script, using Artificial Neural Network (ANN), which improves its efficiency. One of the major reasons for the poor recognition rate is error in character segmentation. The presence of touching characters in the scanned documents further complicates the segmentation process, creating a major problem when designing an effective character segmentation technique. Preprocessing, character segmentation, feature extraction, and finally, classification and recognition are the major steps which are followed by a general OCR. The preprocessing tasks considered in the paper are conversion of gray scaled images to binary images, image rectification, and segmentation of the document's textual contents into paragraphs, lines, words, and then at the level of basic symbols. The basic symbols, obtained as the fundamental unit from the segmentation process, are recognized by the neural classifier. In this work, three feature extraction techniques-: histogram of projection based on mean distance, histogram of projection based on pixel value, and vertical zero crossing, have been used to improve the rate of recognition. These feature extraction techniques are powerful enough to extract features of even distorted characters/symbols. For development of the neural classifier, a back-propagation neural network with two hidden layers is used. The classifier is trained and tested for printed Hindi texts. A performance of approximately 90% correct recognition rate is achieved.

움직임 검출의 캠 제어에 의한 웹기반 이동 객체 추적 (Web-based Moving Object Tracking by Controlling Pan-Tilt Camera using Motion Detection)

  • 박천주;박희정;이재협;전병민
    • 한국콘텐츠학회논문지
    • /
    • 제2권2호
    • /
    • pp.17-26
    • /
    • 2002
  • 본 연구에서는 연속된 비디오 프레임을 대상으로 움직임을 검출하고, 이에 따른 움직임 벡터를 이용하여 카메라를 좌우 상하로 제어함으로써 이동 객체 중심의 비디오 프레임을 지속적으로 확보할 수 있는 웹 기반의 이동 객체 추적방법을 제안한다. 비디오 스트림에서 두 프레임간 일정 간격의 격자점에서의 차분을 계산하고, 임계치 이상의 차분을 갖는 격자점들에 대한 수평 및 수직 투영 히스토그램을 이용하여 움직임의 방향과 거리를 결정한다. 이 방향과 거리 정보를 이용하여 RCM을 제어함으로써 이동 객체의 움직임 영역이 비디오 스트림의 중앙에 위치하도록 한다. 실험 결과, 움직임이 있는 부분이 비디오 프레임의 중앙에 위치하는 것을 확인할 수 있었으며, 웹상의 서버/클라이언트 방식으로 구현함으로써 인터넷을 이용하여 원격의 클라이언트가 비디오 스트림을 모니터할 수 있었다.

  • PDF