• 제목/요약/키워드: 문자 영역 검출

검색결과 144건 처리시간 0.023초

YOLO, EAST: 신경망 모델을 이용한 문자열 위치 검출 성능 비교 (YOLO, EAST : Comparison of Scene Text Detection Performance, Using a Neural Network Model)

  • 박찬용;임영민;정승대;조영혁;이병철;이규현;김진욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.115-124
    • /
    • 2022
  • 본 논문에서는 최근 다양한 분야에서 많이 활용되고 있는 YOLO와 EAST 신경망을 이미지 속 문자열 탐지문제에 적용해보고 이들의 성능을 비교분석 해 보았다. YOLO 신경망은 일반적으로 이미지 속 문자영역 탐지에 낮은 성능을 보인다고 알려졌으나, 실험결과 YOLOv3는 문자열 탐지에 비교적 약점을 보이지만 최근 출시된 YOLOv4와 YOLOv5의 경우 다양한 형태의 이미지 속에 있는 한글과 영문 문자열 탐지에 뛰어난 성능을 보여줌을 확인하였다. 따라서, 이들 YOLO 신경망 기반 문자열 탐지방법이 향후 문자 인식 분야에서 많이 활용될 것으로 전망한다.

인간에게 친밀한 한글 인식 및 편집 지원시스템 (Human Friendly Recognition and Editing Support System of Korean Language)

  • 손영선
    • 한국지능시스템학회논문지
    • /
    • 제17권4호
    • /
    • pp.494-499
    • /
    • 2007
  • 본 논문에서는 책 또는 논문을 읽을 때 중요한 부분 또는 정리해야 할 부분의 영역을 선택하면, 해당영역의 문자들을 문서편집기에 순차적으로 출력시킴으로써 수정 저장 가능하게 하여 공부한 부분을 정리하는 시스템을 구현하였다. 이 시스템은 사용자가 원하는 영역을 손가락으로 선택하면, 손 인식 알고리즘을 적용하여 손가락 움직임을 검출하여 선택된 영역을 인식한다. 선택된 영역의 가로, 세로 거리를 펄스 수로 변환한 후 모터를 제어하여 그 위치만큼 카메라를 이동시킨다. 문자인식이 가능하도록 줌을 확대/축소하고 조정된 줌에 맞는 초점으로 근접 제어한 후, 더욱 선명한 영상을 얻기 위해 명암차이를 이용하여 미세조정을 하였다. 획득된 영상에 문자인식 알고리즘을 적용하여 문서로 변환시켜서 중요 부분들을 정리케하는 한글 인식 및 편집지원 시스템을 구현하였다

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.

기울어진 신규차량번호판 인식을 위한 FE-MCBP (The FE-MCBP for Recognition of the Tilted New-Type Vehicle License Plate)

  • 구건서
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.73-81
    • /
    • 2007
  • 본 논문은 문자의 특징을 추출하여 다중연결 인식기를 통해 신규 자동차 번호판을 인식하는 방법을 제안한다. 이를 위해 영상 전처리과정과 번호판 영역 추출을 위한 과정과 개별문자 추출 과정을 통해 얻어진 개별문자를 인식을 위해 FE-MCBP를 제안하였다. FE-MCBP는 차량 번호판처럼 한글과 숫자가 혼용된 문자열을 인식할 때는 문자의 특징을 기반으로 하는 인식기로서 기존 역전파 인식기에 비해 인식률 면에서 9.7%가 향상되었다. 아울러 기울어진 번호판 영상을 정규화하기 위하여 직선 성분 검출 및 영역 좌표 생성기술을 이용하였다. 시스템 운용 면에서 볼 때 신규차량번호판 인식 시스템은 번호판 영역이 기울진 영상도 인식이 가능하기 때문에 비스듬하게 획득된 번호판 영상이나, 훼손된 번호판의 경우도 인식이 가능한 것으로 연구결과 나타났다.

  • PDF

색상과 모양 특징을 이용한 실시간 속도제한 표지판 인식 (Real-time Speed Sign Recognition with Color and Shape Feature)

  • 임광용;김승규;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.504-506
    • /
    • 2012
  • 운전자 지원 시스템(ADAS)은 최근 지능형 자동차 분야에서 중요한 이슈로 손꼽히는 기술 중 하나이다. 이 중에서 실시간 표지판 인식 기술은 운전자 지원 시스템의 하나로 운전자의 안전과 직결될 수 있어 높은 정확성과 실시간성이 요구된다. 그동안 표지판 인식 분야는 색상과 현상을 기반으로 연구가 진행되어왔으나, 교통 표지판은 국가별로 그 특징과 형태가 각기 상이하여 적용하는데 한계가 있다. 본 논문에서는 한국의 속도제한 표지판을 실시간으로 검출하고 인식하기 위하여, 1) 영상에서 색상 특징을 이용하여 후보 영역을 검출하고, 2) 형상 정보를 분석하여 표지판의 형태를 검증하고, 3) 검출된 후보영역의 내부문자(숫자)를 분할하고 인식하는 시스템을 제안한다.

도로 동영상에서 차량번호판 인식 (Recognition of License Plate of Car in Vehicle Motion Images)

  • 이향정;이효종;이훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.775-778
    • /
    • 2002
  • 본 논문에서는 도로를 주행하는 차량영상으로부터 번호판의 인식에 대한 연구이다. 차량을 검출하기 위해 두 프레임의 차를 이용하여 도로상에서 차량을 분리하였고, 번호판 영역을 추출하기 위해 명암도 변화의 파형 곡선 결과에 임계값을 적용하여 번호판을 추출하였다. 번호판 영역 검출은 96.05%의 검출결과를 얻었으며, 차량의 번호판 문자인식은 신경망을 통하여 학습 시켰 그 성능은 잭나이프 기법을 통해 측정하였다. 학습데이터에 대해서는 99.85 비학습데이터에 대해서는 88.15%의 인식율을 보였다.

  • PDF

문서 영상의 기울기 검출을 위한 기준선 탐색 기법 (Baseline Searching Method for Document Skew Detection)

  • 신명진;김도연;차의영
    • 한국멀티미디어학회논문지
    • /
    • 제10권2호
    • /
    • pp.218-225
    • /
    • 2007
  • 본 논문은 문자 인식 등을 통한 문서 자동 처리 시스템을 위해서 스캔 과정에서 발생할 수 있는 문서의 기울기를 정확하게 검출하는 기법을 제안한다. 제안한 알고리즘은 처리 속도 향상을 위해 영상을 축소한 다음 형태학적 연산과 연결 성분 분석 방법으로 기울기 검출 대상 영역(ROI)을 먼저 설정한 후 설정된 영역 내에서 문서의 기울기 정보를 가지고 있는 기준선을 탐색하는 방법으로 정확하게 기울어진 각도를 검출할 수 있게 하였다. 기존의 형태학적 연산을 기반으로 한 기울기 검출 기법과 비교하고 다양한 종류의 대용량 문서 영상을 대상으로 한 실험 및 분석을 통해 제안한 기울기 검출 방법의 정확도 및 효율성을 증명하였다.

  • PDF

투영 프로파일, GaP 및 특수 기호를 이용한 텍스트 영역의 어절 단위 분할 (Decomposition of a Text Block into Words Using Projection Profiles, Gaps and Special Symbols)

  • 정창부;김수형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권9호
    • /
    • pp.1121-1130
    • /
    • 2004
  • 본 논문에서는 인쇄체 텍스트 영상에 대한 문자열 분리 방법과 어절 분리 방법을 제안한다. 문자열 분리 방법은 수평 투영 프로파일을 분석하고, 오분리된 문자열에 대하여 재귀적 투영 프로파일 (Recursive Projection Profile) 분석을 수행한다. 어절 단위 분리는 문자열에 대한 연결요소 분석을 통하여 gap을 검출한 후, 계층적 군집화 기법에 의해 어절과 어절 사이에 존재하는 gap을 판별하여 어절 분리점을 결정한다. 또한 어절과 어절 사이에 존재하는 특수기호를 검출하여 어절 분리점을 추가하기 위해서, 연결요소의 종횡비와 골격선(skeleton)의 형태적 특징을 고려한다. 제안 방법의 성능 평가를 위하여 총 84 개의 텍스트 영상에 대하여 실험하였고, 국내 상용 OCR 소프트웨어인 아르미와 성능 비교하였다. 최종 어절 분리에 대하여 제안 방법과 아르미가 각각 99.92%와 97.58%의 성능으로 측정됨으로써 제안 방법이 아르미에 비해 우수함을 보였다.

실시간 처리를 위한 컨테이너 ISO코드 인식시스템의 구현 (Implementation of the Container ISO Code Recognition System for Real-Time Processing)

  • 최태완
    • 한국정보통신학회논문지
    • /
    • 제10권8호
    • /
    • pp.1478-1489
    • /
    • 2006
  • 컨테이너 ISO코드 인식시스템은 ISO코드 검출 및 영상 획득, ISO코드 영역 추출, 개별 문자 추출, 문자인식 및 데이터베이스의 5가지 핵심부분으로 구성된다. 이 중에서도 ISO코드 추출의 정확성은 전체 시스템 인식률에 지대한 영향을 줄 수 있는 부분이며, 다양한 컨테이너 종류 및 주위 환경 변화에서도 정확한 추출을 요구한다. 본 논문에서는 획득된 영상을 주위 환경 변화에도 적응 가능한 이 진화 방법을 사용하여 ISO코드 템플릿의 영역을 이 진화하고 ISO코드의 분포를 가지는 후보 영역을 추출한다. 추출된 후보 영역 중에서 ISO코드 문자 분포의 특성을 이용한 검증과정을 통해 최종 영역을 추출하여 ISO코드를 인식하는 시스템을 설계 및 구현하였다. 구현된 시스템을 실시간으로 컨테이너에서 획득한 영상에 적용한 결과 다양한 컨테이너 종류 및 주위 환경변화에서도 ISO코드 영역이 정확히 추출됨을 확인하였다.

메쉬 및 세선화 기반 특징 벡터를 이용한 차량 번호판 인식 (A Vehicle License Plate Recognition Using the Feature Vectors based on Mesh and Thinning)

  • 박승현;조성원
    • 한국지능시스템학회논문지
    • /
    • 제21권6호
    • /
    • pp.705-711
    • /
    • 2011
  • 본 논문은 산업응용을 목표로 효과적인 차량 번호판 인식 알고리즘을 제안한다. 자동차 이미지를 얻은뒤 캐니 에지 추출(Canny Edge Detecting) 알고리즘을 이용하여 연결된 사각형을 찾아 번호판을 추출한다. 추출된 번호판의 색상 정보를 이용하여 흰색/녹색 번호판을 구분하고, 각 번호판을 OTSU 이진화와 주변 전경 픽셀 전파 알고리즘인 CLNF (CCLUF with NFPP)을 통해 문자를 제외한 잡음을 제거하고 레이블링하여 숫자 및 문자 영역을 분리한다. 분리된 문자 영역은 메쉬 방법 및 세선화 후 X-Y 투영 방법으로 특징 벡터를 추출한다. 추출된 특징 벡터는 역전파 신경망으로 미리 학습된 가중치 값과 비교되며, 최종 문자 인식을 수행한다. 제안된 차량 번호판 인식 알고리즘의 효과적 동작은 실험을 통해 확인하였다.