• Title/Summary/Keyword: 한글 인쇄체

Search Result 55, Processing Time 0.038 seconds

Recognition of Various Printed Hangul Images by using the Boundary Tracing Technique (경계선 기울기 방법을 이용한 다양한 인쇄체 한글의 인식)

  • Baek, Seung-Bok;Kang, Soon-Dae;Sohn, Young-Sun
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.13 no.1
    • /
    • pp.1-5
    • /
    • 2003
  • In this paper, we realized a system that converts the character images of the printed Korean alphabet (Hangul) to the editable text documents by using the black and white CCD camera, We were able to abstract the contours information of the character which is based on the structural character by using the boundary tracing technique that is strong to the noise on the character recognition. By using the contours information, we recognized the horizontal vowels and vertical vowels of the character image and classify the character into the six patterns. After that, the character is divided to the unit of the consonant and vowel. The vowels are recognized by using the maximum length projection. The separated consonants are recognized by comparing the inputted pattern with the standard pattern that has the phase information of the boundary line change. We realized a system that the recognized characters are inputted to the word editor with the editable KS Hangul completion type code.

Hangul Character Recognition Using Fuzzy Reasoning:Hangul Character Type Classification by Maximum Run Length Projenction (퍼지추론을 이용한 한글 문자 인식:최대 길이 투영에 의한 한글 문자 유형 분류)

  • 이근수;최형일
    • Korean Journal of Cognitive Science
    • /
    • v.3 no.2
    • /
    • pp.249-270
    • /
    • 1992
  • The purpose of this paper is to classify the types of input characters,printed Hangul characters,using Maximum Run Length Projection(MRLP)that is used to extract features of input character.Because the number of Hangul characters is large and its structure is complex,there exists close similarities among characters.This paper,therefore,tried to increment the type classification rate using fuzzy resoning.The Maximum Run Length Projection is very immune to noise,and also useful to extracting the demanding information efficiently.In a test case with the most frequently use 917 printed Hangul characters,it achieved 98.58%correct classification rate.

Improvement of The Printed Korean Grapheme Recognition using Meaningful Noises (규칙적인 잡음을 이용한 인쇄체 한글 자소인식 개선)

  • Lee, Jin-Soo;Kwon, Oh-Jun;Bang, Sung-Yang
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.143-147
    • /
    • 1995
  • 한글은 문자수가 많고 초성, 중성, 종성의 조합으로 이루어진 2차원적인 특성 때문에, 신경망을 이용한 한글 인식의 경우에는 자소를 분리한 후 자소별로 인식하는 방법이 많이 사용된다. 이러한 방법의 경우 분리된 자소영역에 원하는 자소 이외의 부분이 첨가되면 학습이 어려워 오인식의 주된 원인이 되기 때문에, 정확한 자소분리 알고리즘이나 전처리등을 통하여 그러한 잡음을 없애려는 시도가 많이 있었으나 아직도 원하는 자소부분 만을 정확히 분리하는 것은 어려운 문제로 남아있다. 본 논문에서는 그러한 잡음이 규칙적임을 이용하여, 필요한 자소영역만을 추출하려하기보다는 오히려 필요한 자소영역 외의 부분을 포함시킴으로써, 잡음이라고만 생각했던 부분을 하나의 정보로 역이용하여 이로 인한 여러 오인식 경우를 해결하였다. 또한 자소의 위치가 불규칙적인 부분에 있어서는, 그 위치를 고정시키는 알고리즘을 사용하여 인식률을 더욱 높였다.

  • PDF

Documentation of Printed Hangul Images of the Selected Area by Finger Movement (손가락 이동에 의해 선택된 영역의 인쇄체 한글 영상 문서화)

  • 백승복;손영선
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.05a
    • /
    • pp.51-54
    • /
    • 2002
  • 본 논문은 글자 문서를 배경으로 사용자의 손가락 이동에 의하여 일정한 영역을 그린 후, 영역내의 한글영상을 편집 가능한 에디터에 출력하는 시스템을 구현하였다. 영상의 전처리 단계에서는 문서 배경과 손영역을 분리하고 최대 원형 이동법을 이용하여 손의 무게 중심점을 추출한다. 원형 패턴 벡터 알고리즘을 사용하여 손을 인식한 후, 거리 스펙트럼으로 손가락 위치를 찾는다. 손가락의 움직임에 의해 선택되어진 문자 영역을 추출한 후, 한글 자소 간 히스토그램을 이용하여 추출된 문자 이미지 영역에서 문자단위로 분할하고 다양한 크기의 문자를 표준화한다. 퍼지 추론을 적용한 원형 패턴 벡터 알고리즘을 이용하여 표준 패턴문자와 입력문자의 특징벡터를 비교하여 문자를 인식하게 함으로써 사용자가 원하는 영역의 문자들을 수정 가능한 문서로 변환하였다

  • PDF

Neural Network design for Printed Hangul recognition using structural characteristic of Hangul (한글의 구조적 특징을 이용한 인쇄체 한글인식을 위한 신경망 설계)

  • 서원택;조범준
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.588-591
    • /
    • 2003
  • 본 논문에서는 한글의 구조적인 특징을 이용하여 이를 효과적으로 인식할 수 있는 신경망을 설계해보았고, 이를 이용하여 주민등록증에 있는 이름을 인식하는 시스템을 구성해 보았다. 본 시스템은 한글의 6형식에 따른 구조적인 특징을 효과적으로 구분하기 위해 형식을 구분하는 신경망을 먼저 구성하여 형식별로 분류한 뒤, 형식에 따라 자모음을 분리하여 각 형식에 따라 구성된 2차 신경망으로 입력을 하여 인식하는 구조로 설계되었다. 훈련용 데이터는 각 형식 별로 자소를 분리해서 얻은 영상들을 자소별 평균이미지로 만들어서 이를 조합하여 만든 글자로 사용하였다. 그래서 같은 형식의 같은 자음이라도 글자의 모양과 위치가 조금 다른 것에 대해서 강인한 훈련을 할 수 있었다. 또한 히스토그램의 국부 평균을 적용함으로써 잡음에 효과적으로 대응하였다. 100명의 주민등록증을 컴퓨터 카메라를 이용하여 입력 받아서 테스트한 결과 98.1%의 높은 인식률을 얻을 수 있었다.

  • PDF

A Hierarchical Neural Network for Printed Hangul Character Recognition (인쇄체 한글문자 인식을 위한 계층적 신경망)

  • 조성배;김진형
    • Korean Journal of Cognitive Science
    • /
    • v.2 no.1
    • /
    • pp.33-50
    • /
    • 1990
  • Recently, neural networks have been proposed as computaional models for hard prlblems that the brain appears to solve easily. This paper proposes a hierarchical network which practically recognizes printed Hangul characters based on the various psychological stueies. This system is composed of a type classification netwotk and six recognition networks. The former clessifier input character images into one of the six thper by their overall sturcture, and the latter further classify them into character code. Extperiments with most frequently used 990 printed hangul characters conform the superiority of the propsed system. After all, neural nework approach turns out to be very reasonable through a comparison with statistical classifier and an analysis of mis-classification and generalization capability.

Construction of Printed Hangul Character Database PHD08 (한글 문자 데이터베이스 PHD08 구축)

  • Ham, Dae-Sung;Lee, Duk-Ryong;Jung, In-Suk;Oh, Il-Seok
    • The Journal of the Korea Contents Association
    • /
    • v.8 no.11
    • /
    • pp.33-40
    • /
    • 2008
  • The application of OCR moves from traditional formatted documents to the web document and natural scene images. It is usual that the new applications use not only standard fonts of Myungjo and Godic but also various fonts. The conventional databases which have mainly been constructed with standard fonts have limitations in applying to the new applications. In this paper, we generate 243 image samples for each of 2350 Hangul character classes which differs in font size, quality, and resolution. Additionally each sample was varied according to binarization threshold and rotational transformation. Through this process 2187 samples were generated for each character class. Totally 5,139,450 samples constitutes the printed Hangul character database called the PHD08. In addition, we present the characteristics and recognition performance by an commercial OCR software.

Grapheme Segmentation Method for Low Quality Printed Hangul Text Recognition (저해상도 인쇄체 한글 영상 인식을 위한 자소 분할 방법)

  • Lee Seong-Hun;Cho Kyu-Tae;Kim Jin-Sik;Kim Jin-Hyung;Jung Cheol-Kon;Kim Sang-Kyun;Moon Young-Su;Kim Ji-Yeun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.382-384
    • /
    • 2006
  • 본 논문에서는 저해상도 한글 영상을 자소 단위로 분리하는 방법을 제안한다. 비디오 자막이나 저해상도 스캔 영상의 경우 자소간 획이 접촉되거나 잡영이 많이 포함되어 기존의 자소 분할 방법으로는 한계가 있다. 한자 문자열을 문자 단위로 분할하는데 사용된 비선형 분할 경로 알고리즘을 한글 낱자 영상에 적용하여 자소 단위로 분할한다. 기존의 분할 경로 알고리즘을 한글 자소 분할에 효과적으로 적용하기 위해서 우세점 탐지 알고리즘을 이용하여 자소간 접촉점을 찾고 이를 바탕으로 생성된 분할 경로에 따라 여러 개의 자소 후보 영상이 생성된다. 자소 영상을 자소 인식기로 인식한 결과 높은 인식률을 보이는 것을 실험을 통하여 확인하였다.

  • PDF

Printed Name on ID Card recognition using a Hierachical Organized Neural Network (계층적 신경망을 이용한 주민등록증 성명인식)

  • 서원택;조범준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.325-327
    • /
    • 2003
  • 본 논문에서는 인쇄체 한글을 실용적으로 인식할 수 있는 계층적으로 구성한 신경망을 제안하고, 이를 이용해서 주민등록증의 성명을 인식하는데 적용하였다. 문자영상을 신경망을 이용하여 한글의 6가지 유형으로 먼저 분류한 후, 분류된 문자영상을 각 형식에 따라 자소단위로 분할해서 각 형식에 따른 신경망으로 인식하는 구조로 만들었다. 훈련용 데이터는 각 형식 별로 자소를 분리해서 얻은 영상들을 자소별 평균이미지로 만들어서 이를 조합하여 만든 글자로 사용하였다. 그래서 같은 형식의 같은 자음이라도 글자의 모양과 위치가 조금 다른것에 대해서 강인한 훈련을 할 수 있었다. 또한 입력단에서의 잡음을 줄이기 위해 히스토그램의 국부 평균을 적용하였다. 100명의 주민등록증을 컴퓨터 카메라를 이용하여 입력받아서 테스트한 결과 98.1%의 높은 인식률을 얻을 수 있었다.

  • PDF

Character spotting using image-based stochastic models (이미지 기반 확률모델을 이용한 문자검출)

  • 김선규;신봉기
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.484-486
    • /
    • 2001
  • 본 논문에서는 의사 2차원 은닉 마르코프 모델의 구조로 생성한 마르코프 체인형 확률모형에 의한 인쇄체문자 이미지의 모델링에 대해 논한다. 이미지 데이터에서 바로 모델을 실시간 생성하며 문자 인식 및 검출에 응용할 수 있다. 실험에 의하면, 이 방법을 통해 특정 낱말이 포함된 문장에서 숫자를 인식, 한글을 검출할 수 있음을 확인하였다.

  • PDF