• 제목/요약/키워드: Character segmentation

검색결과 172건 처리시간 0.026초

획기반 필기한글 문자분할 (Handwritten Hangul Character Segmentation Based on Stroke Extraction)

  • 김호연;김두식;남윤석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.593-596
    • /
    • 2001
  • 본 논문에서는 획기반 필기한글 문자분할 방법을 제안하고 이를 한글단어인식에 적용하였다. 제안된 방법에서는 획 단위의 문자분할을 시도함으로써 불필요한 분할점을 줄일 수 있었을 뿐 아니라 문자간 획의 접촉이나 겹침을 해결할 수 있었다. 실험에서는 이를 단어인식에 적용하여 비교적 높은 인식률을 얻음으로써 제안된 방법의 가능성을 입증하였다. 실험에서 이용한 문자인식기의 성능이 낮음에도 불구하고 비교적 높은 단어인식률을 얻을 수 있었던 것은 의미 있는 획 단위의 문자분할을 통해 불필요한 분할 가능성을 줄였고, 단어사전을 이용함으로써 사전정보를 충분히 활용할 수 있었기 때문이다.

  • PDF

번호판에서의 문자 세그멘테이션에 관한 연구 (A Study on Character Segmentation in Car Plates)

  • 이상훈;김경현;김춘림;차의영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.623-626
    • /
    • 2003
  • 본 논문에서는 현재 자동차 번호판의 형식이 구 번호판과 신 번호판 두 가지 유형으로 구성되어 있다는 점을 고려하여 번호판의 세부적 세그멘테이션의 성능을 개선하는 방법에 대하여 제시한다. 컴퓨터 비젼을 바탕으로 한 자동차 번호판의 인식방법과 문자인식방법은 비용면이나 간편성에서 맡은 장점을 가지고 있으며 여러 응용분야에서 사용될 수 있기 때문에 다방면에서 시도되고 있다. 본 시스템은 모폴로지 연산과 클러스트링을 이용하여 자동차 번호판 전체 영역을 추출하는 방법을 사용한다. 다음으로 구번호판에서 신번호판으로 넘어가는 과도기적 단계에 있는 번호판들의 특징인 용도기능의 표시문자의 위치 차이를 이용하여 구 번호판과 신번호판을 먼저 분류한다. 분류된 번호판에서 두 번호판의 차이점인 차종기초 표시영역의 숫자를 나누어서 세그멘테이션함으로서 기존의 연구방법보다 개선된 세그멘테이션 능력과 이로 인하여 향상된 번호판 인식결과를 얻을 수 있다.

  • PDF

필기체한글 글자단위 분할에 관한 연구 (A study of Character segmentation of Handwritten Hangul)

  • 박아람;조범준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.831-834
    • /
    • 2004
  • 본 연구에서는 무제약으로 쓰여진 필기체 한글단어를 글자단위로 분할하는 새로운 방법을 제안한다. 이 방법은 글자와 글자사이 흑은 자소사이에 존재하는 배경(Background)정보를 세선화(Thinning) 처리하여 얻은 패스(Path)를 이용하여 글자와 글자사이를 지나는 패스를 결정하는 방법이다. 특히, 이 방법은 분할에 대한 판단을 인식기로 넘기지 않는 외적분할 방법으로 빠른 처리시간을 얻을 수 있고 외적분할 방법의 단정인 정확도를 다른 외적분할 방법에 비해서 높일 수 있었다. 제안한 방법은 필기체 한글에서 많이 발생할 수 있는 중첩(Over lap)글자와 연결(Touched)글자를 분할하는데 효과적인 성능을 보였다. 중첩글자의 경우, 세선화에 의해 생성된 패스가 자연스럽게 중첩된 부분의 사이를 지나가면서 생성되기 때문에 매우 정확한 패스를 얻을 수 있었고, 연결 글자의 경우는 연결된 부분을 판단하고, 후보영역을 선정하여 연결된 부분을 분리해내는 방법을 사용하였다.

  • PDF

측면 윤곽 패턴을 이용한 접합 문자 분할법 (Character Segmentation Using Side Profile Pattern)

  • 정민철
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2003년도 춘계학술발표논문집
    • /
    • pp.260-263
    • /
    • 2003
  • 본 연구에서는 접합 문자를 분할하는 알고리듬을 소개한다. 문자 인식기는 문자를 인식하기 위해 문자 분할을 전 처리 단계에 필요로 하는데, 문자 분할은 높은 수행력을 위해 문자 인식 결과를 필요로 한다. 이 딜레마를 해결하기 위해서는 문자 분할과 문자 인식, 이 두 문제를 동시에 해결하는 방법이 필요하다. 이를 위해 본 논문에서는 문자 분할 전에 접합 문자 내에 있는 소속 문자를 인식하고 문자를 분할하는 새로운 문자 분할 방법을 제시한다. 본 연구에서 제시한 문자 분할 알고리즘은 접합 문자 내에 있는 소속 문자를 문자 분할 전에 인식하기 위해 측면 윤곽을 정의하고, 그 히스토그램을 구해 프로토타입에 있는 단일 문자의 측면 윤곽 히스토그램과 비교 계산하여 가장 적은 거리차를 가지는 단일 문자를 분할 문자의 일차 후보로 내정하여, 분할 비용을 가지고 접합문자를 분할한다.

  • PDF

학습 기반의 자동차 번호판 인식 시스템 (Learning-based approach for License Plate Recognition System)

  • 김종배;김갑기;김광인;박민호;김항준
    • 융합신호처리학회논문지
    • /
    • 제2권1호
    • /
    • pp.1-11
    • /
    • 2001
  • 자동차 번호판은 조명과 카메라에 따라 영상에서 다양한 형태로 나타나고 영상내의 잡음으로 인해 알고리즘 방식으로 자동차 번호판을 인식하기가 쉽지 않다. 이러한 문제에 적합한 해결 방법으로 본 논문에서는 학습 기반의 자동차 번호판 인식 시스템을 제안한다. 제안한 시스템은 자동차 검출 모듈, 번호판 추출 모듈, 번호판 문자 인식 모듈로 구성된다 본 논문에서는 자동차 번호판 추출을 위해서 입력 영상의 잡음에 상대적인 영향이 적은 시간-지연 신경망(Time-Delay Neural Networks : TDNN)과 번호판 인식을 위해서 일반적인 신경망보다 일반화 성능이 뛰어난 서포트 벡터 머신(Support Vector Machines : SVMs)을 시스템에 적용한다. 주차장과 톨게이트에서 여러 시간대의 움직이는 자동차 영상들을 실험한 결과, 번호판 추출율은 97.5%, 번호판 문자 인식률은 97.2%의 성능을 내었고, 전체 시스템 성능은 947%이며 처리 시간은 약 1조 미만이다. 따라서 본 논문에서 제안한 시스템은 실세계에서 유용하게 적용될 수 있다.

  • PDF

변형에 무관한 필기체 문자 인식을 위한 퍼지 신경망과 학습 알고리즘 (A Novel Fuzzy Neural Network and Learning Algorithm for Invariant Handwritten Character Recognition)

  • 유정수
    • 정보교육학회논문지
    • /
    • 제1권1호
    • /
    • pp.28-37
    • /
    • 1997
  • 본 논문에서는 퍼지 집합을 기반으로한 새로운 신경망에 대해 기술하고 있다. 새로운 퍼지 신경망은 변형에 영향을 받지 않는 문자 인식을 적용하였다. 퍼지 신경망은 5개 층으로 구성되어 있다. 구현 결과 왜곡, 이동, 회전 및 필기체 문자의 크기가 서로 달라도 문자들을 정확하게 인식함을 보였다. 잡은(8${\sim}$30%)이 있는 경우에도 정확하게 인식을 하였다. 이동, 왜곡, 서로 다른 문자 크기 및 잡음은 L2 층에 의해서 이루어 졌으며, 회전에 영향을 받지 않게 하기 위해서 L5층을 구성하였다. 퍼지 신경망을 훈련하기 위해서 108개 문자를 사용하였으며 훈련 패턴에서 1- 또는 2-픽셀의 이동이 있는 경우에도 100%의 인식률을 보였다. ${\pm}20^{\circ}$ 도 정도 회전된 문자인 경우에는 정확하게 인식하였다. 또한 제안된 퍼지 신경망은 학습된 문자인 경우 100% 인식률을 가지고 recall하였다. 제안된 퍼지 신경망은 구조가 간단하고 학습 속도와 recall속도가 매우 빨랐다. 본 퍼지 신경망은 필기체 문자열의 분할과 인식에도 적용하였다.

  • PDF

문자열 검출을 위한 슬라브 영역 추정 (Slab Region Localization for Text Extraction using SIFT Features)

  • 최종현;최성후;윤종필;구근휘;김상우
    • 전기학회논문지
    • /
    • 제58권5호
    • /
    • pp.1025-1034
    • /
    • 2009
  • In steel making production line, steel slabs are given a unique identification number. This identification number, Slab management number(SMN), gives information about the use of the slab. Identification of SMN has been done by humans for several years, but this is expensive and not accurate and it has been a heavy burden on the workers. Consequently, to improve efficiency, automatic recognition system is desirable. Generally, a recognition system consists of text localization, text extraction, character segmentation, and character recognition. For exact SMN identification, all the stage of the recognition system must be successful. In particular, the text localization is great important stage and difficult to process. However, because of many text-like patterns in a complex background and high fuzziness between the slab and background, directly extracting text region is difficult to process. If the slab region including SMN can be detected precisely, text localization algorithm will be able to be developed on the more simple method and the processing time of the overall recognition system will be reduced. This paper describes about the slab region localization using SIFT(Scale Invariant Feature Transform) features in the image. First, SIFT algorithm is applied the captured background and slab image, then features of two images are matched by Nearest Neighbor(NN) algorithm. However, correct matching rate can be low when two images are matched. Thus, to remove incorrect match between the features of two images, geometric locations of the matched two feature points are used. Finally, search rectangle method is performed in correct matching features, and then the top boundary and side boundaries of the slab region are determined. For this processes, we can reduce search region for extraction of SMN from the slab image. Most cases, to extract text region, search region is heuristically fixed [1][2]. However, the proposed algorithm is more analytic than other algorithms, because the search region is not fixed and the slab region is searched in the whole image. Experimental results show that the proposed algorithm has a good performance.

YOLO와 OCR 알고리즘에 기반한 시각 장애우를 위한 유통기한 알림 시스템 (Expiration Date Notification System Based on YOLO and OCR algorithms for Visually Impaired Person)

  • 김민수;문미경;한창희
    • 한국전자통신학회논문지
    • /
    • 제16권6호
    • /
    • pp.1329-1338
    • /
    • 2021
  • 점자를 제외한 시각 장애우들이 유통기한을 확인할 수 있는 효과적인 방법이 거의 개발되어 있지 않으며, 이로 인하여 시각 장애우들의 식품 안전성이 위협받고 있다. 본 연구에서는 시각 장애우의 식품 안전성 확보를 위해 실시간 객체 인식 알고리즘(you only look once, YOLO) 및 광학 문자 인식 (optical character recognition, OCR)에 기반한 유통기한 알림 시스템을 개발했다. 제안하는 시스템은 총 4가지 단계로 시각 장애우에게 유통기한 정보를 전달한다: (1) 표적 제품의 바코드 스캔을 통한 제품 확인 (2) 실시간으로 입력되는 제품 영상에서 YOLO 알고리즘을 활용하여 유통기한이 표기된 이미지 영역 검출; (3) 검출된 이미지 영역에서 OCR 알고리즘을 활용하여 유통기한 문자 인식; (4) Text to Speech (TTS) 기술을 활용하여 유통기한 정보를 사용자에게 전달. 성능 평가를 위한 온라인 실험 결과, 앞이 보이지 않는 피험자가 개발한 시스템을 사용해서 제품의 유통기한을 평균 86%의 높은 정확도로 확인할 수 있음이 검증되었다. 이러한 결과는 제안하는 시스템이 저시력자를 포함한 시각 장애우들의 식품 안전성 확보에 이바지할 수 있음을 보여준다.

ROS 기반 지능형 무인 배송 로봇 시스템의 구현 (Implementation of ROS-Based Intelligent Unmanned Delivery Robot System)

  • 공성진;이원창
    • 전기전자학회논문지
    • /
    • 제27권4호
    • /
    • pp.610-616
    • /
    • 2023
  • 본 논문에서는 Robot Operating System(ROS) 기반의 모바일 매니퓰레이터(Manipulator)를 이용한 무인 배송 로봇 시스템을 구현하고 시스템 구현을 위해 사용된 기술에 대해 소개한다. 로봇은 엘리베이터를 이용해 건물 내부에서 자율주행이 가능한 모바일 로봇과 진공 펌프를 부착한 Selective Compliance Assembly Robot Arm(SCARA)-Type의 매니퓰레이터로 구성된다. 로봇은 매니퓰레이터에 부착된 카메라를 이용하여 이미지 분할과 모서리 검출을 통해 배송물을 들어올리기 위한 위치와 자세를 결정할 수 있다. 제안된 시스템은 스마트폰 앱 및 ROS와 연동된 웹서버를 통해 배송 현황을 조회하고 로봇의 실시간 위치를 파악할 수 있도록 사용자 인터페이스를 가지고 있으며, You Only Look Once(YOLO)와 Optical Character Recognition(OCR)을 통해 배송 스테이션에서 배송물과 주소지를 인식한다. 아울러 4층 건물 내부에서 진행한 배송 실험을 통해 시스템의 유효성을 검증하였다.

Text Extraction from Complex Natural Images

  • Kumar, Manoj;Lee, Guee-Sang
    • International Journal of Contents
    • /
    • 제6권2호
    • /
    • pp.1-5
    • /
    • 2010
  • The rapid growth in communication technology has led to the development of effective ways of sharing ideas and information in the form of speech and images. Understanding this information has become an important research issue and drawn the attention of many researchers. Text in a digital image contains much important information regarding the scene. Detecting and extracting this text is a difficult task and has many challenging issues. The main challenges in extracting text from natural scene images are the variation in the font size, alignment of text, font colors, illumination changes, and reflections in the images. In this paper, we propose a connected component based method to automatically detect the text region in natural images. Since text regions in mages contain mostly repetitions of vertical strokes, we try to find a pattern of closely packed vertical edges. Once the group of edges is found, the neighboring vertical edges are connected to each other. Connected regions whose geometric features lie outside of the valid specifications are considered as outliers and eliminated. The proposed method is more effective than the existing methods for slanted or curved characters. The experimental results are given for the validation of our approach.