• 제목/요약/키워드: 문자 영역 검출

검색결과 144건 처리시간 0.024초

웹 이미지로부터 이미지기반 문자추출 (Locating Text in Web Images Using Image Based Approaches)

  • Chin, Seongah;Choo, Moonwon
    • 지능정보연구
    • /
    • 제8권1호
    • /
    • pp.27-39
    • /
    • 2002
  • 본 논문은 다양한 웹 이미지로부터 문자영역(text block)의 위치를 알아내고 문자영역을 추출하는 방법을 제안한다. 인터넷 사용자관점에서 볼 때, 웹 이미지에 포함되어 있는 문자정보는 중요한 정보이지만 최근까지 이 분야의 연구는 그리 활발하지 못했다. 본 연구에서 제안된 알고리즘은 문자의 경사방향(skew)과 문자의 크기나 폰트에 관한 사전 정보 없이 수행되어 질 수 있도록 제안되었다 폰트 스타일과 크기에 제약되지 않고 문자영역을 적합하게 추출하기 위해 유용한 에지 검출, 문자 클러스터링 영역으로 정의되는 문자의 고유한 특성을 위한 히스토그램을 사용하였다. 다수의 실험을 통하여 제안된 방법을 테스트하고 수용할 만한 결과를 도출했다.

  • PDF

합성곱 신경망 기반의 차량 번호판 인식 시스템 (Convolutional Neural Network based Vehicle License Plate Recognition System)

  • 임성훈;이재흥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.749-752
    • /
    • 2018
  • 깊은 신경망 모델을 이용한 차량 번호판 검출과 번호판 문자 인식 시스템을 제안한다. 차량 번호판 인식 시스템은 세 가지 종류의 깊은 신경망 모델로 구성된다. 기존의 영상처리 기반의 차량 번호판 검출과 문자 인식을 전부 신경망으로 대체함으로써 영상의 밝기, 회전, 왜곡 등의 변형에 강인한 성능을 얻을 수 있다. 차량 번호판 검출률은 99.3%, 문자 영역 검출률은 99%, 문자 인식률을 98.5%를 얻었다.

가상 데이터를 활용한 번호판 문자 인식 및 차종 인식 시스템 제안 (Proposal for License Plate Recognition Using Synthetic Data and Vehicle Type Recognition System)

  • 이승주;박구만
    • 방송공학회논문지
    • /
    • 제25권5호
    • /
    • pp.776-788
    • /
    • 2020
  • 본 논문에서는 딥러닝을 이용한 차종 인식과 자동차 번호판 문자 인식 시스템을 제안한다. 기존 시스템에서는 영상처리를 통한 번호판 영역 추출과 DNN을 이용한 문자 인식 방법을 사용하였다. 이러한 시스템은 환경이 변화되면 인식률이 하락되는 문제가 있다. 따라서, 제안하는 시스템은 실시간 검출과 환경 변화에 따른 정확도 하락에 초점을 맞춰 1-stage 객체 검출 방법인 YOLO v3를 사용하였으며, RGB 카메라 한 대로 실시간 차종 및 번호판 문자 인식이 가능하다. 학습데이터는 차종 인식과 자동차 번호판 영역 검출의 경우 실제 데이터를 사용하며, 자동차 번호판 문자 인식의 경우 가상 데이터만을 사용하였다. 각 모듈별 정확도는 차종 검출은 96.39%, 번호판 검출은 99.94%, 번호판 검출은 79.06%를 기록하였다. 이외에도 YOLO v3의 경량화 네트워크인 YOLO v3 tiny를 이용하여 정확도를 측정하였다.

운송 컨테이너 영상의 효율적인 문자인식을 위한 전처리에 관한 연구 (A Study on Preprocessing for Efficient Character Recognization of Shipping Container Image)

  • 최재영;김낙빈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.1077-1083
    • /
    • 2000
  • 본 논문은 운송 컨테이너 식별자의 자동화 처리를 위한 문자 인식의 단계중 최종 문자 인식 전단계 까지의 처리 과정을 컨테이너의 특성에 맞게 제안하였으며, 이러한 전처리 과정은 문자 인식 시스템의 성능에 중요한 영향을 미친다. 제안한 방법은 먼저 입력된 컨테이너 컬러 영상을 명암 영상으로 바꾸고 전체 영상중 인식에 필요한 식별자 영역만을 경계선 검출과 형태학적 연산을 이용하여 추출한다. 이어서 다양한 배경색과 문자색을 판단하여 일반 문서와 같이 일관성있게 통일한 후, DCT를 이용한 명암도별 이진영역으로 분할한 후에 Otsu방법과 새로운 이진화방법을 자동으로 선택하여 효율적인 이진화가 이루어지도록 하였다. 이렇게 얻어진 이진 영상은 문자인식 단계로 넘어갈 수 있도록 개별 문자로 분할한다. 이 방법은 컨테이너 영상의 불균등한 배경색과 잡음으로 인하여 문자인식에 오류가 생기는 단점을 보완하였으며 컨테이너 특성을 최대한 반영함으로써 효과적인 전처리 결과를 얻을 수 있었다. 또한, 제안한 방법의 응용은 컨테이너 이외의 다른 상황에서도 매우 효과적으로 사용될 수 있으리라 본다.

  • PDF

딥러닝 기반 자동차 모델 및 번호판 인식 시스템 구현 (Implementation of Deep Learning-Based Vehicle Model and License Plate Recognition System)

  • 함경윤;강길남;이장현;이정우;박동훈;류명춘
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.465-466
    • /
    • 2022
  • 본 논문에서는 딥러닝 영상인식 기술을 활용한 객체검출 모델인 YOLOv4를 활용하여 차량의 모델과 번호판인식 시스템을 제안한다. 본 논문에서 제안하는 시스템은 실시간 영상처리기술인 YOLOv4를 사용하여 차량모델 인식과 번호판 영역 검출을 하고, CNN(Convolutional Neural Network)알고리즘을 이용하여 번호판의 글자와 숫자를 인식한다. 이러한 방법을 이용한다면 카메라 1대로 차량의 모델 인식과 번호판 인식이 가능하다. 차량모델 인식과 번호판 영역 검출에는 실제 데이터를 사용하였으며, 차량 번호판 문자 인식의 경우 실제 데이터와 가상 데이터를 사용하였다. 차량 모델 인식 정확도는 92.3%, 번호판 검출 98.9%, 번호판 문자 인식 94.2%를 기록하였다.

  • PDF

손으로 설계한 서식 문서의 문자 영역 분리 및 서식 벡터화 (Text Area Segmentation and Layout Vectorization of Off-line Handwritten Forms)

  • 김병용;권오석
    • 한국정보처리학회논문지
    • /
    • 제7권10호
    • /
    • pp.3086-3097
    • /
    • 2000
  • 본 논문에서는 손으로 자유스럽게 그린 서식 문서에서 문자 영역을 분리하고, 이 중 선 성분을 벡터화하는 방법을 제안한다. 제안된 방법은 우선 이진화 및 세선화 과정에서의 데이터 손실을 방지하기 위해 스캔한 영상에 DRC 알고리즘을 적용한다. 그리고 영상의 기울어짐을 교정하기 위해 세선화된 영상에 허프 변환을 적용하여 기울어짐을 추정하고 교정한 다음, 서식의 구조를 이루는 선 성분을 추출해 낸다. 그리고 문자 영역은 연결 요소 분석법에 의해 문자 영역을 나타내는 데이터로 변환되며, 추출된 선 성분을 정렬, 합병 및 교정처리를 통해 벡터화 된다. 제안된 방법의 실효성을 입증하기 위해 각각 25명의 다른 사람이 필기구에 제한을 두지 않고 하나는 자를 사용하여 작성하고 다른 하나는 자를 사용하지 않고 작성한 서식에 대해 실험한 결과 전체 750개의 벡터 집합 중에서 전처리를 하지 않은 경우에는 666개, 전처리를 한 경우에는 746개의 서식 벡터 검출에 성공하여 그 유효성을 확인할 수 있었다.

  • PDF

효과적인 도서목록 검색을 위한 개선된 OCR알고리즘에 관한 연구 (Improvement OCR Algorithm for Efficient Book Catalog RetrievalTechnology)

  • 하문;백영현;문성룡
    • 전자공학회논문지CI
    • /
    • 제47권1호
    • /
    • pp.152-159
    • /
    • 2010
  • 본 논문에서는 기울어진 문자, 다양한 크기, 글씨체, 흐린 문자를 포함한 입력영상의 문자 복원과 인식, 효율적인 도서 검색을 위한 광학문자인식 알고리즘을 제안한다. 본 논문에서 제안한 광학문자 인식알고리즘은 검출부와 인식부로 구성되며, 검출부에서는 복잡한 배경에서 정확한 도서 영역 검출을 위하여 로버츠 에지 연산자와 허도로프 거리 알고리즘을 적용하여 필요한 영역을 검출하였다. 또한 인식부에서는 문자의 크기와 경사도, 부분 손실 등의 영상에 강인성을 갖는 바이큐빅 보간법을 적용하여 데이터 손실 복원과, 반자동 기울기를 갖는 입력 영상의 보정을 하였다. 모의실험 결과 기존 알고리즘 보다 인식률에서는 6%, 검색시간에서는 1.077초 더 우수함을 확인하였다.

모폴로지 연산을 이용한 문서 이미지의 고속 기울기 검출 기법 (Fast Skew Detection of Document Image Using Morphological Operation)

  • 신명진;김도현;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.796-799
    • /
    • 2006
  • 본 논문은 스캔한 문서 및 전자 문서 등과 같은 문서 이미지에서의 기울기를 검출하는 기법을 제안하고 있다. 제안한 알고리즘은 처리 속도 향상을 위해 일정 비율로 축소된 이미지를 사용한다. 하지만 여전히 문서 전체를 대상으로 기울기를 검출하는 것은 많은 계산량을 요구하므로 대상영역(ROI)을 선택한다. 대상 영역은 모폴로지 연산을 통해 문자열을 하나의 긴 component로 연결하고 Labeling 과정을 통해 선택된다. 그리고 원본 이미지에서 문자의 baseline을 바탕으로 대상 영역에서 기울기를 검출한다. 실험결과를 통하여, 제안한 방법은 표나 그래프가 포함된 여러 종류의 문서 이미지에서 빠르고 정확한 기울기 값을 검출함을 확인할 수 있다.

  • PDF

비디오 영상 정보 검색을 위한 문자 추출 및 인식 (Caption Detection and Recognition for Video Image Information Retrieval)

  • 구건서
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권7호
    • /
    • pp.901-914
    • /
    • 2002
  • 본 논문에서는 비디오에서 입력된 영상으로부터 내용기반 검색을 위해 자동으로 자막을 추출하여 특징 추출을 기반의 단층 연결 신경망 인식기(FE-MCBP)에 의해 자막 문자를 인식하여 영상 자막의 내용을 검출하는 방법을 제시하였다. 비디오에서 자막 추출은 먼저, 비디오에서 일정한 시간 간격으로 획득한 프레임 중에서 히스토그램 분석을 통하여 키 프레임을 찾는 과정을 수행하며, 그 다음에 각각의 키 프레임에 대하여 칼라 세그먼테이션 후 라인 검사 방법 통하여 자막 영역을 추출하도록 하였다. 마지막으로 추출된 자막영역에서 개별문자를 분리하였다. 본 연구에서는 칼라 히스토그램을 분석 후 지역 최대값을 이용하여 세그먼테이션 후 라인 검사를 수행함으로써 처리 속도와 자막영역 검출의 정확도를 개선하였다. 비디오에서 자막 추출은 비디오 정보를 멀티미디어 데이터베이스화하는 초기 단계로 추출된 자막은 바로 문자 인식기의 입력이 된다. 또한 인식된 자막정보는 데이터베이스로 구축되며 내용기반 검색 기법에 의해 검색되도록 하였다.

  • PDF

손 영역의 무게 중심과 퍼지 논리를 이용한 USB 카메라 기반의 지문자 인식 시스템 (USB Camera-Based Korean Manual Alphabet Recognition System Using Center of Gravity of Hand Region and Fuzzy Logic)

  • 오영준;박광현;변증남
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.300-303
    • /
    • 2007
  • 지문자는 청각장애인이 사용하는 수화로 표현하지 못하는 한글 문자를 알파벳으로 표시하기위한 손 제스처이다. 본 논문에서는 추출된 손 영역의 무게 중심과 퍼지 논리를 이용하여 지문자를 인식하는 알고리즘을 제안하고, 한글 문자를 표현하는 시스템을 개발한다. USB 카메라로부터 얻어진 영상에서 히스토그램을 이용하여 손의 피부색 영역을 추출하고, 영상 마스크를 이용하여 피부색이 아닌 배경 영역을 제거한다. 문턱 값을 사용하여 얻어진 이진화된 영상에서 손의 영역을 검출하고, 무게 중심을 이용하여 손 중심과 손가락 끝의 거리를 측정한다. 얻어진 거리 정보에 퍼지 기법을 적용하여 손가락의 굽힘 정도를 판단하고, 손 모양 데이터베이스에서 손가락 굽힘 정도와 가장 근사한 한글 문자를 선택한다.

  • PDF