• 제목/요약/키워드: Printed Korean characters recognition

검색결과 44건 처리시간 0.022초

한글 문자의 전자계산조직에 적응하기 위한 특징추출에 관한 연구(I) (A Method For the Recognition of Printed Korean Characters)

  • 이주근
    • 대한전자공학회논문지
    • /
    • 제6권4호
    • /
    • pp.8-19
    • /
    • 1969
  • 우리 문자는 자모의 조합된 언어문자이기 때문에 그 수가 방대하여 수천개의 식별기구를 필요로 할 뿐만 dkl니라 재조가 복잡하며 대부분이 유이문자이기 때문에 Patttern 인식문제에 잇어서는 허다한 난점이 있다. 따라서 이들 재조상에서 오는 문제점을 분석, 평가하하여 최적조건을 결정하고, 특징추출에 노이적별함수의 적용은 다른 문자에서는 볼 수 없는 한글 문자에 관한 한 특수한 장점으로 나타난다는 것을 확인하여다. 이 특수점을 Systen의 서례에 최대한으로 적용하여 3분지 1이상의 System축소를 보았다. 인식방버버으로서는 표본 Pattern을 추출해 내서 Register에 기제한 다음 인식 Matrix에 의하여 식별하였다. 식별된 문자는 판정논리에 의하여 특수Parameter를 추출하였다. 이논적인 입증을 위한 몇가지의 실험적인 검사를 가하였으며 이 과정에서 얻어진 모든 자료들은 이 분양의 연구에 매우 유익한 기초자료를 제공할 것이로 보며, 한글문자의 Patterndlstlr에 관한 실마리가 잡혀졌다고 보겠다.

  • PDF

한글문자 인식에 관한 연구(II)(한글자모의 인식 Code와 display) (Recognition of Printed Korean Characters(II))

  • 이주근
    • 대한전자공학회논문지
    • /
    • 제7권3호
    • /
    • pp.5-11
    • /
    • 1970
  • 이 연구는 연구(I)의 계속연구로서 한글자음과 모음의 특징추출에 의한 coding방법과 그의 display에 대해서 검토하였다. 문자를 3x5mesh의 Matrix로서 양자화해서 그의 특징을 변수로한 2단 matrix에 의하여 문자 pattern을 발생하고, 또 발생된 특징 pattern을 다시 논리집합하여 단일 Serial coding 방법을 제시하였다. 이 code는 한글 자모의 원문자가 재생되며, 모든 자모는 각각 15개의 흑백 bit로서 구성된다. 24개 한글자음과 모음에 대해서 coding하였으며, 이론치와 측정치가 잘 일치함을 보았고 그것이 또한 완전히 재현됨을 이 연구에서 알맞게 설계된 display로서 확인하였다.

  • PDF

문서 입출력 시스템의 구성에 관한 연구 (A Study on the Construction of a Document Input/Output system)

  • 함영국;도상윤;정홍규;김우성;박래홍;이창범;김상중
    • 전자공학회논문지B
    • /
    • 제29B권10호
    • /
    • pp.100-112
    • /
    • 1992
  • In this paper, an integrated document input/output system is developed which constructs the graphic document from a text file, converts the document into encoded facsimile data, and also recognizes printed/handwritten alphanumerics and Korean characters in a facsimile or graphic document. For an output system, we develop the method which generates bit-map patterns from the document consisting of the KSC5601 and ASCII codes. The binary graphic image, if necessary, is encoded by the G3 coding scheme for facsimile transmission. For a user friendly input system for documents consisting of alphanumerics and Korean characters obtained from a facsimile or scanner, we propose a document recognition algirithm utilizing several special features(partial projection, cross point, and distance features) and the membership function of the fuzzy set theory. In summary, we develop an integrated document input/output system and its performance is demonstrated via computer simulation.

  • PDF

Automatic Generation of Training Character Samples for OCR Systems

  • Le, Ha;Kim, Soo-Hyung;Na, In-Seop;Do, Yen;Park, Sang-Cheol;Jeong, Sun-Hwa
    • International Journal of Contents
    • /
    • 제8권3호
    • /
    • pp.83-93
    • /
    • 2012
  • In this paper, we propose a novel method that automatically generates real character images to familiarize existing OCR systems with new fonts. At first, we generate synthetic character images using a simple degradation model. The synthetic data is used to train an OCR engine, and the trained OCR is used to recognize and label real character images that are segmented from ideal document images. Since the OCR engine is unable to recognize accurately all real character images, a substring matching method is employed to fix wrongly labeled characters by comparing two strings; one is the string grouped by recognized characters in an ideal document image, and the other is the ordered string of characters which we are considering to train and recognize. Based on our method, we build a system that automatically generates 2350 most common Korean and 117 alphanumeric characters from new fonts. The ideal document images used in the system are postal envelope images with characters printed in ascending order of their codes. The proposed system achieved a labeling accuracy of 99%. Therefore, we believe that our system is effective in facilitating the generation of numerous character samples to enhance the recognition rate of existing OCR systems for fonts that have never been trained.

원소 변환을 이용한 한글 패턴의 구조 분석 (A Syntactic Structure Analysis of Hangul Using the Primitive Transformation)

  • 강현철;최동혁;이완주;박규태
    • 대한전자공학회논문지
    • /
    • 제26권12호
    • /
    • pp.1956-1964
    • /
    • 1989
  • In this paper, a new method of Hangul recognition is proposed to solve the problems of misrecognition owing to the contacts of FCEs (Fundamental Character Elements) in a Hangul pattern. Structures of FCFs are represented with PAG(Programmed Array Grammar) to recognize an input pattern on 2-D. array of pels., and the unnecessary deformation of the conventional approach can be eliminated by using PEACE parsing which extracts primitives and computes attributes in the course of analyzing the structure of an input pattern. Also, primitive transformation at contacts can afford to confirm all the possible structures of an input pattern and solve the problem of misrecognition owing to the contacts of FCEs. The recognition rate of proposed method for printed Hangul characters shows 96.2% for 1978 Gothic-letters and 92.0% for 1920 Myng-style-letters, respectively.

  • PDF

모바일 기반 Air Writing을 위한 객체 탐지 및 광학 문자 인식 방법 (Object Detection and Optical Character Recognition for Mobile-based Air Writing)

  • 김태일;고영진;김태영
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제15권5호
    • /
    • pp.53-63
    • /
    • 2019
  • 모바일 환경에서 딥러닝을 통한 손 제스처 인터페이스를 제공하려면 높은 인식률을 제공하면서 실행속도의 저하를 막기 위한 네트워크 경량화의 연구가 필수적이다. 본 논문은 딥러닝 모델의 경량화를 통해 모바일 기기에서 손가락을 이용하여 공중에 쓴 문자를 실시간으로 인식하는 방법을 제안한다. MobileNet을 특징 추출기로 활용하는 객체 탐지 모델인 SSD (Single Shot Detector)를 기반으로 집게손가락을 탐지하고 손끝 경로를 이어 결과문자 영상을 생성한다. 이 영상은 서버로 전송되어 정규화 과정을 수행한 다음 학습된 OCR 모델을 이용하여 문자를 인식한다. 본 방법을 검증하기 위하여 12명의 사용자가 GALAXY S10+ 기기를 사용하여 1,000개의 단어를 실험한 결과 평균 88.6%의 정확도로 손가락을 인식하고 124 ms 이내로 인식된 텍스트가 출력되어 실시간으로 활용 가능함을 알 수 있었다. 본 연구결과는 모바일 환경에서 손가락을 이용한 간단한 문자 전송, 메모 및 공중 서명 등에 활용될 수 있다.

Preceding Layer Driven 다층 퍼셉트론을 이용한 한글문자 인식 (The Recognition of Korean Character Using Preceding Layer Driven MLP)

  • 백승엽;김동훈;정호선
    • 전자공학회논문지B
    • /
    • 제28B권5호
    • /
    • pp.382-393
    • /
    • 1991
  • In this paper, we propose a method for recognizing printed Korean characters using the Preceding Layer Driven multi-layer perceptron. The new learning algorithm which assigns the weight values to an integer and makes use of the transfer function as the step function was presented to design the hardware. We obtained 522 Korean character-image as an experimental object through scanner with 600DPI resolution. The preprocessing for feature extraction of Korean character is the separation of individual character, noise elimination smoothing, thinnig, edge point extraction, branch point extraction, and stroke segmentation. The used feature data are the number of edge points and their shapes, the number of branch points, and the number of strokes with 8 directions.

  • PDF

경계선 기울기 방법을 이용한 다양한 인쇄체 한글의 인식 (Recognition of Various Printed Hangul Images by using the Boundary Tracing Technique)

  • 백승복;강순대;손영선
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.1-5
    • /
    • 2003
  • 본 논문에서는 CCD 흑백 카메라를 이용하여 입력되는 인쇄체 한글 이미지의 문자를 인식하여 편집 가능한 텍스트 문서로 변환하는 시스템을 구현하였다 문자 인식에 있어서 잡음에 강한 경계선 기울기 방법을 이용함으로써 문자의 구조적 특성에 근거한 윤곽선 정보를 추출할 수 있었다. 이를 이용하여 각 문자 이미지의 수평 및 수직 모음을 인지하고 6가지 유형으로 분류한 후, 자소 단위로 분리하고 최대 길이 투영을 사용하여 모음을 인식하였다. 분리된 자음은 경계선이 변화되는 위상의 형태를 미리 저장된 표준 패턴과 비교하여 인식하였다. 인식된 문자는 KS 한글 완성형 코드로 문서 편집기에 출력되어 사용자에게 제공되는 시스템을 구현하였다.

피쳐 추출에 기반을 둔 신경회로망을 이용한 인쇄체 한글 문자 인식 (Printed Korean Characters Recognition Using Neural Networks Based on Feature Extraction)

  • 김우태;윤영식;진성일
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1991년도 제3회 한글 및 한국어정보처리 학술대회
    • /
    • pp.287-299
    • /
    • 1991
  • 본 논문은 하드웨어 구현이 가능한 신경 회로망을 구성하여 한글 문자 인식을 수행하였다. 먼저 입력 장치로부터 받아들인 문자 영상은 인식 속도를 높히기 위하여 특별한 전처리 과정 없이 직접 피쳐를 추출하였으며 추출한 피쳐로는 하드웨어 구현이 용이한 교차 피쳐와 투영 피쳐를 이진화로 코딩하였다. 신경 회로망의 하드웨어 구현을 가능하게 하기위해서 정수형 연결 강도와 비선형 Hard-limit 함수를 가지고 학습을 하는 Rounding 학습 방법을 도입하여 학습시켰으며 한글의 구조적 특성을 이용하여 한글을 유형별로 Module화 및 Submodule화 작업을 수행한 다음 인식하는 계층적인 문자 인식 시스템을 구성하였다. 그리고 이러한 방법을 이용하여 한글 문자 인식용 CMOS 신경회로망 Chip을 설계하였다.

  • PDF

계층구조 신경망을 이용한 한글 인식 (Hangul Recognition Using a Hierarchical Neural Network)

  • 최동혁;류성원;강현철;박규태
    • 전자공학회논문지B
    • /
    • 제28B권11호
    • /
    • pp.852-858
    • /
    • 1991
  • An adaptive hierarchical classifier(AHCL) for Korean character recognition using a neural net is designed. This classifier has two neural nets: USACL (Unsupervised Adaptive Classifier) and SACL (Supervised Adaptive Classifier). USACL has the input layer and the output layer. The input layer and the output layer are fully connected. The nodes in the output layer are generated by the unsupervised and nearest neighbor learning rule during learning. SACL has the input layer, the hidden layer and the output layer. The input layer and the hidden layer arefully connected, and the hidden layer and the output layer are partially connected. The nodes in the SACL are generated by the supervised and nearest neighbor learning rule during learning. USACL has pre-attentive effect, which perform partial search instead of full search during SACL classification to enhance processing speed. The input of USACL and SACL is a directional edge feature with a directional receptive field. In order to test the performance of the AHCL, various multi-font printed Hangul characters are used in learning and testing, and its processing its speed and and classification rate are compared with the conventional LVQ(Learning Vector Quantizer) which has the nearest neighbor learning rule.

  • PDF