• 제목/요약/키워드: 수직 히스토그램

검색결과 81건 처리시간 0.023초

PCA 복원과 HOG 특징 기술자 기반의 효율적인 보행자 인식 방법 (An Efficient Pedestrian Recognition Method based on PCA Reconstruction and HOG Feature Descriptor)

  • 김철문;백열민;김회율
    • 전자공학회논문지
    • /
    • 제50권10호
    • /
    • pp.162-170
    • /
    • 2013
  • 최근 보행자의 교통안전 개선을 위한 목적으로 차량에 장착되는 보행자 보호 시스템(PPS, Pedestrian Protection System)에 대한 관심과 요구가 증가하고 있다. 본 연구에서는 보행자 검출 후보 윈도우 추출과 셀(cell) 단위 히스토그램 기반의 HOG 특징 계산 방법을 제안하였다. 보행자 검출 후보 윈도우 추출은 주변밝기 비율체크, 수직방향 에지투영, 에지펙터(edge factor), 그리고 PCA(Principal Component Analysis) 복원 영상을 이용하였다. Dalal 의 HOG 는 겹침 블록 상의 모든 픽셀에 대해 가우시안 가중치와 삼선형보간에 의한 히스토그램 계산이 필요한데 반하여 제안하는 방법은 단위 셀마다 가우시안 가중 및 히스토그램을 계산하고 그것들을 인접 셀과 결합하므로 연산 속도가 빠르다. 제안하는 PCA 복원 에러 기반의 보행자 검출 후보 윈도우 추출은 보행자의 머리와 어깨 영역과의 차이를 기준으로 배경을 효율적으로 분류한다. 제안하는 방법은 카메라 컬리브레이션이나 스테레오 카메라를 이용한 거리 정보 없이도 영상만으로 전통적인 HOG 에 비하여 연산속도가 크게 개선된다.

Wavelet 변환을 이용한 차량 번호판 영역 추출 (Extraction of Car Number Plate Using Wavelet Transform)

  • 황운주;박성욱;박종욱
    • 전자공학회논문지S
    • /
    • 제36S권6호
    • /
    • pp.76-86
    • /
    • 1999
  • 본 논문은 웨이브렛 변환을 이용하여, 차량 번호판 영역을 추출하는 새로눙 방법을 제안한다. 차량 영상을 웨이브렛 변환에 의하여 분해하고 분해된 각 영상으로부터 생성되는 고주파 영상들은 특징 영상으로 선정한다. 선정된 3개의 특징 영상들을 하나의 특징 영상으로 합성하고, 번호판 위치 영역을 검출한다. 검출된 영역에 대하여 수직 방향 히스토그램에 의해 Y축 영역을 결정하고, 수평 방향 히스토그램의 분산 히스토그램을 구성하여 X축 영역을 결정하므로써의 번호판 영역을 추출한다. 또한 제안한 방법의 타당성을 보이기 위하여, 다양한 국내${\cdot}$외 차량 데이터에 대하여 실험한 결과, 기존방법들의 문제점을 해결하고 96%의 높은 정확성의 번호판 영역을 추출하였다.

  • PDF

기하학적 정보를 이용한 영상 시퀀스에서 높이 추정에 관한 연구 (Height Measurement using Geometric informations from image sequences)

  • 김상훈;김종수;윤용인;최종수;김진태
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.529-532
    • /
    • 2001
  • 본 논문에서는 보안 시스템에서 사람 인식을 위한 중요한 단서 중의 하나인 사람의 키를 측정하는 알고리즘으로, 이미지 시퀀스에서 사람의 영역을 추출하고 기하학적 정보를 이용해 추출된 사람의 키를 측정하고자 한다. 이를 위해 단일 이동 물체 사람을 대상으로 하여 시퀀스 이미지에서 사람의 움직임 정보를 추출하고, 추출된 영역에서 수직 히스토그램 투영을 하여 사람의 중심선을 찾아 머리와 발의 좌표점을 추출한다. 추출된 좌표점들은 소실점과 소실선의 기하학적 해석과 미리 입력한 다른 물체의 기준높이를 가지고 실세계에서의 사람의 키를 측정하게 된다.

  • PDF

스포츠 비디오를 위한 자막 위치검색 시스템 (Korea Information Science Society Caption position retrieval system for sports video)

  • 임정훈;곽순영;국나영;이지현;이양원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.628-630
    • /
    • 2002
  • 하이라이트를 구성하는데 종전에는 사람의 수작업에 의해서 이루어졌다. 요즘은 이런점을 연구를 통해 계속 자동화시키고 있는 추세이고 많은 논문들이 나오고 있다. 이 논문은 낮은 해상도의 동영상을 향상시키기 위해 Shannon Upsampling을 수행하고 적당한 임계치를 찾아내 이진영상을 만들어 전처리를 수행하고 수평 수직 히스토그램 기법과 다중프레임조함을 혼합해 자막위치를 찾는 방법을 제안한다. 이는 기존의 에지를 사용하는 방법들에 비해 간단하고 비교적 빠른 성능을 보인다.

  • PDF

해리스 코너 검출기를 이용한 배경 영상에서의 문자 검출 (Character Detection in Complex Scene Image using Harris Corner Detector)

  • 김민하;김미경;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.97-100
    • /
    • 2013
  • 본 논문은 복잡한 배경 영상에서 필기체가 아닌 수평, 수직 성분이 많이 포함된 문자 검출 방법을 제안한다. 본 논문에서 검출하고자 하는 문자는 코너 성분이 많이 밀집되어 있으며 배경 영상은 그에 비해 코너 성분이 적고 드문드문하다는 특징을 이용하여 먼저 해리스 코너 검출기를 이용하여 전체 영상에서 코너를 검출한다. 검출된 코너들의 위치 정보를 이용해 밀집되어 있는 코너들을 클러스터링 함으로써 문자 영역을 검출한다. 검출된 문자 영역간의 위치 정보와 히스토그램 분포를 비교하여 비슷한 특징을 갖는 영역들을 합치고 문자 성분의 특징을 갖지 않는 영역은 필터링 하여 문자 영역을 개선한다. 문자 영역에서 R채널, G채널, B채널 각각의 채널에 대한 히스토그램 분포를 분석하여 문자를 검출한다.

  • PDF

형태학적 정보와 개선된 신경망을 이용한 차량 번호판 인식 (Car Plate Recognition using Morphological Information and Enhanced Neural Network)

  • 임은경;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 춘계학술대회 학술발표 논문집 제14권 제1호
    • /
    • pp.192-197
    • /
    • 2004
  • 본 논문에서는 수평ㆍ수직 에지의 형태학적 정보를 이용한 차량 번호판 추출과 개선된 RBF 네트워크를 이용한 차량 번호판 인식 시스템을 제안한다. 번호판 영역은 수평ㆍ수직 에지의 형태학적 정보를 이용하여 추출하고 개별 문자는 히스토그램 방법과 위치 정보를 이용한 방법에 윤곽선 추적 알고리즘을 병합하여 추출한다. 개별 문자 인식은 ARTI 알고리즘을 개선하여 지도 학습 방법과 결합한 개선된 신경망을 제안하여 차량 번호판 인식에 적용한다. 제안된 방법의 성능을 확인하기 위하여 트루 컬러 차량 영상 155개와 그레이 컬러 차량 영상 100개를 대상으로 실험한 결과, 수평ㆍ수직 에지의 형태학적 정보를 이용한 차량 번호판 추출 방법이 임계화를 이용한 차량 번호판 추출 방법, RGB와 HSI 컬러 정보를 각각 이용한 차량 번호판 추출 방법보다 추출률이 개선되었으며, 인식 성능도 개선된 신경망의 학습 알고리즘이 기존의 학습 알고리즘들보다 우수한 성능이 있음을 확인하였다.

  • PDF

화소의 기울기와 레이블링을 이용한 효율적인 바코드 검출 알고리즘 (Bar Code Location Algorithm Using Pixel Gradient and Labeling)

  • 김승진;정윤수;김봉석;원종운;원철호;조진호;이건일
    • 정보처리학회논문지D
    • /
    • 제10D권7호
    • /
    • pp.1171-1176
    • /
    • 2003
  • 바코드의 기하학적 특징과 레이블링을 이용하여 효율적으로 추출하는 알고리즘을 제안하였다. 네 개의 라인 연산자(line operator)[8]를 이용하여 화소가 가지는 방향을 구한 후, 블록 별로 각 방향에 대한 화소의 누적 히스토그램(histogram)을 구한다. 히스토그램에서 최대값과 최소값의 차가 가장 큰 블록을 바코드 영역의 블록이라고 결정한다. 구해진 블록만을 이용하여 바코드의 중심을 지나가는 직선을 구할 수도 있지만 좀더 정확한 직선을 구하기 위해 바코드 영역에 있는 많은 블록들을 찾는다. 가장 큰 차 값을 이용하여 문턱값을 구하고 블록별로 히스토그램의 최대값과 최소값의 차가 문턱값보다 큰 블록을 바코드의 기하학적(a) 특징을 갖는 블록으로 분류함으로써 블록을 대상으로 영상을 이진화한다. 이진화 한 영상에 대해 레이블링(labeling)[8,9]을 행하여 바코드 영역의 후보 블록들을 결정한다. 후보 블록들의 화소를 이용하여 바코드의 기울기와 중심점을 바코드의 중심점을 구하여 바코드와 수직이고 바코드의 중심을 지나가는 직선을 그을 수 있으며 바코드를 검출 할 수 있다. 수직선이 지나갈 때 화소값을 순차적으로 획득함으로써 바코드가 가지고 있는 정보를 파악한다.

적응적 비선형 히스트그램 스트레칭을 이용한 의료영상의 화질향상 (Medical Image Enhancement Using an Adaptive Nonlinear Histogram Stretching)

  • 김승종
    • 한국산학기술학회논문지
    • /
    • 제16권1호
    • /
    • pp.658-665
    • /
    • 2015
  • 의료영상에서 잡음을 제거하는 것과 명암대비를 좋게하는 것은 화질을 향상시키는 중요한 방법이다. 본 논문에서는 의료영상의 화질 향상을 위해 에지 기반 잡음 제거 방법과 적응적 비선형 히스토그램 스트레칭 알고리즘을 제안한다. 첫째, 웨이블릿 변환을 수행하고 분해된 고주파 부밴드 각각에 대해 Haar 변환을 수행한다. 동시에 수평, 수직, 대각 방향의 Sobel 마스크를 적용하여 방향별 에지를 검출한다. 둘째, 고주파 부밴드에 대해 에지 기반 적응적 문턱치를 이용하여 잡음을 제거한다. 셋째, 적응적 가중치를 이용하여 고주파 부밴드 계수 값을 향상한 후, Haar 역변환 및 웨이블릿 역변환을 수행하여 복원영상을 얻는다. 마지막으로 복원된 영상의 화소 값의 범위가 좁아졌으므로 제안하는 비선형 히스토그램 스트레칭 알고리즘을 이용하여 명암대비가 향상된 영상을 얻는다. 제안한 알고리즘을 낮은 명암대비를 갖는 의료영상에 적용했을 경우 효율적으로 에지를 보존하면서도 시각적으로 우수한 결과를 얻었다.

문서 영상에서의 테이블 벡터화에 관한 연구

  • 심진보;김우성;박용범;오원근
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1995년도 제4회 멀티미디어 산업기술 학술대회 논문집
    • /
    • pp.177-182
    • /
    • 1995
  • 본 논문에서는 문서 인식 시스템에서 정확한 문서 인식의 기본이 되고 인식 결과에 중요한 영향을 미치는 전처리 알고리즘 중 테이블 입력의 효율적인 처리 방법을 연구한다. 테이블 내의 문자를 인식하기 위해서는 테두리선과 문자부분을 먼저 분리하는 작업이 필요하다. 왜냐하면, 테이블을 인식하기 위해서는 테두리선에 의해 블록화된 테두리선 안의 문자를 인식해야 하며 또한 테두리선을 효율적으로 벡터화하는 방법이 필요하다. 따라서 테이블을 벡터화하는 방법으로 8방향 체인 코드를 이용하여 테이블 선 성분을 추출하는 방법과 히스토그램을 이용하여 테이블의 수평, 수직 성분을 추출하여 얻어진 교차점을 이용하여 대각선 성분을 찾아내는 방법 및 화소의 run-length를 이용하여 수평, 수직 성분을 추출하여 얻어진 교차점을 이용해 대각선 성분을 찾아내는 방법 등이 있다. 본 논문에서는 문서 영상 내의 테이블을 효율적으로 벡터화하기 위한 방법을 연구한다.

  • PDF

노노그램 퍼즐을 이용한 인쇄체 영문자 인식 (A Recognition of the Printed Alphabet by Using Nonogram Puzzle)

  • 손영선;김보성
    • 한국지능시스템학회논문지
    • /
    • 제18권4호
    • /
    • pp.451-455
    • /
    • 2008
  • 본 논문에서는 흑백 CCD 카메라로부터 입력되는 2가지 인쇄체(바탕, 돋움) 영문자를 인식하여 편집 가능한 텍스트 형식으로 변환하는 시스템을 구현하였다. 입력된 인쇄체 영어 문장 영상을 이진화 처리 후. 히스토그램 기법을 적용하여 수평 투영으로 각 문장의 행을 분리하고 수직 투영으로 개별 문자를 분리하였으며, 문자의 높이를 48픽셀로 변환하여 정규화 하였다. 정규화 된 개별 문자에 노노그램 퍼즐 원리를 역으로 이용하여, 픽셀을 단위로 하는 작은 사각형들로 구성된 사각형으로 문자를 덮은 후 문자의 특성을 노노그램 퍼즐의 수치 정보로 나타내어 표준 패턴 정보와 비교하여 인식하게 하였다. 바탕체 2609개, 돋움체 1475개의 문자를 대상으로 실험하여 100% 인식률을 얻었다.