• 제목/요약/키워드: Hangul character recognition

검색결과 77건 처리시간 0.023초

변형에 의한 필기체 한글의 생성과 이를 이용한 한글 문자인식 시스템의 정량적 평가 (Automatic Generation of Handwritten Hangul Character Images and Its Application to the Evaluation of Hangul Character Recognition Systems)

  • 박상태;방승양
    • 전자공학회논문지B
    • /
    • 제30B권3호
    • /
    • pp.50-59
    • /
    • 1993
  • There is basic problem with the current evaluation method for character recognition systems. The current method evaluates the average recognition rate by applying the test data to the target system. The average recognition rate tells no more than and no less than the overall performance and it depends on the data. In this paper we propose a testing method which will analyze the target system and point out its strong points and weak points. This can be made possible through using the data which are generated cy distorting the standard character images according to a carefully controlled manner. This paper will describe how to automatically generate such distorted images. Also we will show the method is actually effective and useful by applying it to evaluating existing recognition algorithms.

  • PDF

필기체 한글의 오프라인 인식을 위한 획 정합 방법 (A Stroke Matching Method for the Off-line Recognition of Handprinted Hangul)

  • 김기철;김영식;이성환
    • 전자공학회논문지B
    • /
    • 제30B권6호
    • /
    • pp.76-85
    • /
    • 1993
  • In this paper, we propose a stroke matching method for the off-line recognition of handprinted Hangul. In this method, the preprocessing steps such as position normalization, contour tracing and thinning are carried out first. Then, after extracting features such as the firection component distribution of contour, the direction component distribution of skeleton, and the distribution of structural feature points, strokes are extracted and matched based on the midpont distribution of the direction and the length of each stroke. In order to reduce the recognition time, a preliminary classification based on the direction component distribution features of the contour is performed. In order to domonstrate the performance of the proposed method, experiments with 520 most frequently used Hangul were performed, and 90.7% of correct recognition rate and 0.46second of recognition time per one character has been obtained. This results reveal that the proposed method can absorb effectively the noise in input character and the variations of stroke slant.

  • PDF

Handwritten Hangul Graphemes Classification Using Three Artificial Neural Networks

  • Aaron Daniel Snowberger;Choong Ho Lee
    • Journal of information and communication convergence engineering
    • /
    • 제21권2호
    • /
    • pp.167-173
    • /
    • 2023
  • Hangul is unique compared to other Asian languages because of its simple letter forms that combine to create syllabic shapes. There are 24 basic letters that can be combined to form 27 additional complex letters. This produces 51 graphemes. Hangul optical character recognition has been a research topic for some time; however, handwritten Hangul recognition continues to be challenging owing to the various writing styles, slants, and cursive-like nature of the handwriting. In this study, a dataset containing thousands of samples of 51 Hangul graphemes was gathered from 110 freshmen university students to create a robust dataset with high variance for training an artificial neural network. The collected dataset included 2200 samples for each consonant grapheme and 1100 samples for each vowel grapheme. The dataset was normalized to the MNIST digits dataset, trained in three neural networks, and the obtained results were compared.

한글 문자 인식에서의 오인식 문자 교정을 위한 단어 학습과 오류 형태에 관한 연구 (A Study on Word Learning and Error Type for Character Correction in Hangul Character Recognition)

  • 이병희;김태균
    • 한국정보처리학회논문지
    • /
    • 제3권5호
    • /
    • pp.1273-1280
    • /
    • 1996
  • 본 논문에서는 문자 인식 과정을 거치고 난 후에 발생하게 되는 오인식된 문자들 을 언어적 지식을 이용하여 교정하는 문자 인식 후처리에 관하여 논한다. 문자 인식의 오인식 교정시스템의 경우 후보 단어가 많을 때 많은 후보 단어중에서 가장 적당한 단어를 후보 단어로 올려주기 위해서는 여러 가지 정보가 필요하다. 본 논문에서는 이러한 정보로 이용할 수 있는 것으로 단어들의 특성과, 문자 인식에 발생하는 오인식 형태, 단어 학습에 관하여 논한다. 이를 위한 실험으로 15 만여의 단어가 수록된 국어 사전을 이비력하고 초중고 국어교과서에 나타난 단어 들의 사용빈도를 조사하여 국어 사전에 등록된 단어 중에서 10.7%정도가 실제 초중고 국어교과서에 사용되고 있다는 것을 알 수 있었다. 또한 실제 문자 인식 시스템들을 가지고 여러 문서를 입력하고 인식하여 오인식이 자주 일어나는 글자들 의 형태를 분류하여 보았다. 그리고 한국어 처리 관련 서적이나 논문을 처리하고자 한국어에 관련된 책의 찾아보기에 나타난 단어 를 학습시켜 후보 단어들의 다른 인하여 정확한 단어를 예측하기 힘들던 문제를 해결 하고자 하였다.

  • PDF

퍼지추론을 이용한 한글 문자 인식:최대 길이 투영에 의한 한글 문자 유형 분류 (Hangul Character Recognition Using Fuzzy Reasoning:Hangul Character Type Classification by Maximum Run Length Projenction)

  • 이근수;최형일
    • 인지과학
    • /
    • 제3권2호
    • /
    • pp.249-270
    • /
    • 1992
  • 본 논문은 입력 문자에 대한 특징 추출을 위하여 최대 길이 투영(MRLP:Maximum Run Length Project)방법을 제안한다. 제안된 최대길이 투영 방법은 잡음에 강하며 필요한 정보를 가능한 정확하고 효율적으로 추출하는데 유용하다.한글문자는 그 양이 방대하고 그 구조가 복잡하며 몬자들 사이에 밀접한 유사성이 있다.따라서 본 논문에서는 추출된 특징들에 대한 퍼지추론을 적용하여 유형 분류율의 향상을 도모하였다.사용 빈도수가 높은 인쇄체 한글 문자 917자에 대하여 실험한 결과 98.58%의 분류율을 얻었다.

신경회로망을 이용한 온라인 문자 인식 시스템의 자소 분리에 관한 연구 (A Phoneme Separation and Learning Using of Neural Network in the On-Line Character Recognition System)

  • 홍봉화
    • 정보학연구
    • /
    • 제9권1호
    • /
    • pp.55-63
    • /
    • 2006
  • In this paper, a Hangul recognition system using of Kohonen Network in the phoneme separation and learning is proposed. A Hangul consists of phoneme that are consists of strokes. The phoneme recognition and separation are very important in the recognition of character. So, the phonemes which mismatching has been happened are correctly separated through the learning of neural networks. also, learning rate($\alpha$) adjusted according to error, in order to solved that its decreased the number of iteration and the problem of local minimum, adaptively.

  • PDF

오프라인 필기체 한글 인식을 위한 자소 내 자획의 분리 (Stroke Extraction in Phoneme for Off-Line Handwritten Hangul Recognition)

  • 정민철
    • 한국산학기술학회논문지
    • /
    • 제7권3호
    • /
    • pp.385-392
    • /
    • 2006
  • 본 논문은 오프라인 필기체 한글 인식을 위한 요소 기술의 하나인 자소 분할을 위한 새로운 자획 추출법을 제안한다. 수평 런 길이를 이용하여 자소의 자획을 수직, 경사, 수평으로 구분 분리한다. 수직 자획이나 경사 자획의 수평 런 길이는 자획 두에가 되며, 수평 자획의 수평 런의 개수가 자획 두께가 된다. 수평 자획을 분리 추출한 후, 끊어진 수직, 경사 자획을 자획 두께의 수평 런으로 연결하여 분리한 자획들이 문자의 특징을 나타내게 한다. 추출된 자획들은 온라인 필기체 한글 인식 시스템에서 개발 사용되고 있는 자획 사전 정합을 통해 문자 인식을 할 수 있다.

  • PDF

전표 금액란에 나타나는 필기 한글의 신경망-기반 인식 (Neural Network-based Recognition of Handwritten Hangul Characters in Form's Monetary Fields)

  • 이진선;오일석
    • 한국산업정보학회논문지
    • /
    • 제5권1호
    • /
    • pp.25-30
    • /
    • 2000
  • 한글은 부류수의 방대성과 글자간의 유사성으로 인해 인식이 어려운 문자 집합으로 간주되고 있다. 기존 연구 대부분은 일반적으로 사용되는 2,350 글자를 대상으로 인식을 시도하였는데, 이는 일반성을 제공하는 대신 낮은 성능 문제를 안고 있다. 이에 반해, 우편 영상이나 전표 영상 등의 특정 필드에 나타나는 한글만을 대상으로 하는 접근 방법이 보다 현실적이라 할 수 있다. 본 논문은 금액란에 나타나는 필기 한글을 인식하는 연구를 기술한다. 인식을 위해 모듈러 신경망 인식기를 사용하였으며, 세 종류의 특징을 사용하였다. 표준 한글 데이터베이스 PE92에 대해 실험한 결과 정인식률 97.56%를 얻었다.

  • PDF

선분정합에 의한 흘림체 온라인 한글 인식 (A Cursive On-Line Hangul Recognition Based on the Line Segment Matching)

  • 권오성;권영빈
    • 인지과학
    • /
    • 제3권2호
    • /
    • pp.271-289
    • /
    • 1992
  • 본 논문에서는 자소간 츨림의 형태를 허용하는 온라인 한글 인식 시스템을 제안하고 있다.한글의 인식은 자소 분할의 어려움과 후보문자의 증가에 따른 정합과정의 복잡도 증가라는 두 가지의 커다란 문제점을 갖고 있다.그러므로 본 논문에서는 이중 획분할 방법을 제안하고 이러한 획분할을 통하여 얻어진 선분들을 효율적으로 정합하는 인식 시스템의 구현을 설명하고 있다.또한,제안하는 방법이 흘림체 한글 인식에 적합하게 동작하는 것을 실험을 통하여 입증하였다.

한글 문자 데이터베이스 PHD08 구축 (Construction of Printed Hangul Character Database PHD08)

  • 함대성;이득용;정인숙;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제8권11호
    • /
    • pp.33-40
    • /
    • 2008
  • 문자 인식의 응용이 형식 문서의 인식 같은 고전적인 영역을 벗어나 웹 문서나 자연 영상의 문자 인식으로 확장되고 있다. 이러한 새로운 응용에서는 명조나 고딕같은 표준 글꼴뿐만 아니라 다양한 모양의 글꼴을 사용하는 것이 보편적이다. 기존의 데이터베이스들은 주로 표준 글꼴을 대상으로 제작되어 새로운 응용에 사용하는데 한계를 안고 있다. 본 논문에서는 완성형 2350자 각각을 대상으로 9종류의 글꼴에 대해 글꼴 크기, 품질, 해상도를 달리하여 243개의 이미지 샘플을 생성하였다. 또한 이들 샘플 각각에 대해 이진 임계치와 회전 각도를 달리하여 변형된 샘플을 얻었다. 이러한 과정으로 각 글자마다 2,187개의 샘플을 생성하였으며, 총 5,139,450개의 샘플을 갖는 인쇄체 한글 데이터베이스를 구축하였다. 데이터베이스에 대한 특성과 상용 OCR 소프트웨어에 대한 인식 성능 등을 제시한다.