• Title/Summary/Keyword: PE92 데이터베이스

Search Result 8, Processing Time 0.037 seconds

An Overview of Hangul Handwritten Image Database PE92 (한글 필기체 영상 데이터베이스 PE92의 소개)

  • Kim, D.H.;Bang, S.Y.
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.567-575
    • /
    • 1992
  • 한글 문자인식 시스템을 개발하기 앞서 생각해야 할 것이 인식실험에 사용될 문자 데이타를 수집하는 것이다. 이 논문에서는 연구 개발자들에게 문자인식 실험에 필요한 충분한 데이타를 제공하며 필기체 문자 데이타를 표준화하여 문자인식 시스템 상호간의 성능을 객관적으로 평가하기 위하여 한글 필기체 문자 데이터베이스 PE92를 개발하였다. 여기서는 PE92 데이타베이스의 소개로서 먼저 PE92를 수집하는데 있어 고려사항들, 즉 필기자, 수집문자의 수, 수집용지의 규격, 데이타베이스의 저장, 데이타의 압축에 대하여 알아본다. 다음 PE92 데이타베이스의 규격을 알아본다.

  • PDF

Improved Handwritten Hangeul Recognition using Deep Learning based on GoogLenet (GoogLenet 기반의 딥 러닝을 이용한 향상된 한글 필기체 인식)

  • Kim, Hyunwoo;Chung, Yoojin
    • The Journal of the Korea Contents Association
    • /
    • v.18 no.7
    • /
    • pp.495-502
    • /
    • 2018
  • The advent of deep learning technology has made rapid progress in handwritten letter recognition in many languages. Handwritten Chinese recognition has improved to 97.2% accuracy while handwritten Japanese recognition approached 99.53% percent accuracy. Hanguel handwritten letters have many similar characters due to the characteristics of Hangeul, so it was difficult to recognize the letters because the number of data was small. In the handwritten Hanguel recognition using Hybrid Learning, it used a low layer model based on lenet and showed 96.34% accuracy in handwritten Hanguel database PE92. In this paper, 98.64% accuracy was obtained by organizing deep CNN (Convolution Neural Network) in handwritten Hangeul recognition. We designed a new network for handwritten Hangeul data based on GoogLenet without using the data augmentation or the multitasking techniques used in Hybrid learning.

Shape Decomposition of Handwritten Hangul Characters (필기 한글 문자의 모양 분해)

  • Park, Jeong-Seon;Hong, Gi-Cheon;O, Il-Seok
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.7
    • /
    • pp.511-523
    • /
    • 2001
  • 필기 한글의 문자나 단어 인식에 있어 패턴을 구성하는 획 성분을 추출하는 작업은 매우 중요하다. 세선화와 직선근사에 기반한 고전적인 방법은 원래 패턴을 크게 왜곡한다는 단점을 가지고 있다. 우리는 이러한 문제점을 해결하기 위하여 한글 패턴에 적합한 모양 분해 알고리즘을 제안한다. 한글 패턴은 T-접점과 B-접점이라는 두가지 모양 특징을 중심으로 분할할 수 있다고 관찰에 근거하여 알고리즘을 설계하였다. 또한 세 개 이상의 획이 복잡한 형태로 만나는 결합 지점을 강전하게 처리하는 방법도 제시한다. 제안한 알고리즘을 PE92 데이터베이스에 적용한 결과를 제시한다.

  • PDF

Neural Network-based Recognition of Handwritten Hangul Characters in Form's Monetary Fields (전표 금액란에 나타나는 필기 한글의 신경망-기반 인식)

  • 이진선;오일석
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.5 no.1
    • /
    • pp.25-30
    • /
    • 2000
  • Hangul is regarded as one of the difficult character set due to the large number of classes and the shape similarity among different characters. Most of the conventional researches attempted to recognize the 2,350 characters which are popularly used, but this approach has a problem or low recognition performance while it provides a generality. On the contrary, recognition of a small character set appearing in specific fields like postal address or bank checks is more practical approach. This paper describes a research for recognizing the handwritten Hangul characters appearing in monetary fields. The modular neural network is adopted for the classification and three kinds of feature are tested. The experiment performed using standard Hangul database PE92 showed the correct recognition rate 91.56%.

  • PDF

Performance Improvement Strategies on Minimum Distance Classification for Large-Set handwritten Character Recognition (대용량 필기 문자인식을 위한 최소거리 분류법의 성능 개선 전략)

  • Kim, Soo-Hyung
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.10
    • /
    • pp.2600-2608
    • /
    • 1998
  • This paper proposes an algorithm for off line recognition of handwritten characters, especially effective for large-set characters such as Korean and Chinese characters. The algorithm is based on a minimum distance dlassification method which is simple and easy to implement but suffers from low recognition performance. Two strategies have been developed to improve its performance; one is multi-stage pre-classification and the other is candicate reordering. Effectiveness of the algorithm has been proven by and experimet with the samples of 574 classes in a handwritten Korean character catabase named PE02, where 86.0% of recognition accuracy and 15 characters per second of processing speed have been obtained.

  • PDF

Two-pass Shape Decomposition Algorithm for Handwritten Hangul Patterns (필기 한글 패턴을 위한 두 단계 모양 분해 알고리즘)

  • 박정선;오일석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.464-466
    • /
    • 1999
  • 필기 한글 문자 인식을 위해서는 패턴을 구성하는 획 성분을 분석하는 작업이 필수적이다. 기존 인식 방법들은 세선화와 직선 근사에 기반한 방법을 사용하였다. 하지만 세선화는 필기 패턴을 크게 왜곡하는 단점을 안고 있기 때문에 새로운 방법론의 필요성이 대두되고 있다. 본 논문에서는 필기 한글 패턴의 영역-기반 모양 분해 알고리즘을 제안한다. 외곽선 분석을 이용한 기존의 한 단계 알고리즘의 한계를 지적하고, 이 한계를 극복할 수 있는 두 단계 알고리즘을 기술한다. 첫 번째 단계에서는 우세점을 찾아 B접점과 T접점을 탐지한다. 두 번째 단계에서는 볼록 헐(convex hull) 연산을 적용하여 미분할된 부분에 대해 두 번째 분할 작업을 수행한다. PE92 데이터베이스에 대해 실험 한 결과는 세선화 방법보다 우수함을 보인다.

  • PDF

Character Recognition for Fast Handwritten Korean Address Reading (고속 필기 한글 주소 인식을 위한 낱자 인식)

  • Jeong, Seon-Hwa;Lim, Kil-Taek;Song, Jae-Gwan;Nam, Yun-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.589-592
    • /
    • 2001
  • 본 논문에서는 고속 필기 한글 주소 인식을 위한 낱자 인식기를 제안한다. 인식 대상은 우편번호 여섯 자리에 할당된 주소에 출현 빈도가 높은 필기 한글 469 자이다. 제안된 방법은 낱자 인식 기법을 채택하고 있으며, 인식률과 처리속도를 향상시키기 위하여 2 단계 인식 전략을 채택하였다. 인식기로는 다층퍼셉트론, 최소거리분류기, Subspace 방법을 고려한다. 다층퍼셉트론은 비교적 높은 인식률과 처리속도를 보유하지만 출력값이 확률이 아님으로써 후처리를 필요로 하는 시스템에서 사용하기 어렵다. 최소거리분류기는 간단한 알고리즘으로 처리속도가 높고 확률을 출력하는 장점을 갖지만 인식률이 낮아 활용되기 어렵다. 또한 Subspace 방법은 인식률이 높고 확률을 출력하지만 처리속도가 매우 느리다는 단점이 있다. 따라서 제안방법에서는 처리속도가 높은 인식기 - 다층퍼셉트론, 최소거리분류기 - 를 사용하여 선인식을 수행한 후, 이 결과를 활용하여 인식 대상을 제한한 후 Subspace 방법을 사용하여 정확하게 인식하는 전략을 도입함으로써, 높은 인식결과를 유지하면서 처리속도를 높이고 후처리에 적합하도록 하였다. PE92 데이터베이스를 사용하여 실험한 결과 제안방법이 한글 469 자에 대하여 비교적 높은 인식률과 처리속도를 갖음을 알 수 있었다.

  • PDF

Phoneme Segmentation Method of Handwrittem Hangul Based on Vowel Structure and Heuristic Rules (모음 구조와 경험적인 규칙을 이용한 필기된 한글의 자소 분리 방법)

  • Gwak, Hu-Geun;Choe, Yeong-U;Jeong, Gyu-Sik
    • The KIPS Transactions:PartB
    • /
    • v.8B no.1
    • /
    • pp.10-19
    • /
    • 2001
  • 기존의 필기된 한글의 자소 분리 방법은 일반적으로 다음과 같은 단점을 가진다 : 1) 자소 분리가 주로 세선화된 이미지에 적용되어 세선화 결과에 크게 의존하며, 2) 자소가 접촉되었을 때 명확한 자소 분리 특징점이 발생하는 단순한 접촉만을 대상으로 자소 분리 방법이 개발되어, 특징점이 없거나 특징점이 틀리게 찾아지는 경우처럼 복잡한 접촉에서는 자소 분리 오류가 쉽게 발생한다는 것이다. 본 논문에서는 이러한 단점을 보완하고자 세선화를 하지 않은 이미지에서 자소 분리를 수행하며, 자소가 접촉된 경우 명확한 분리 특징점이 발생하는 경우뿐만 아니라, 특징점이 없거나 특징점이 틀리게 찾아지는 경우에도 자소 분리를 원활하게 수행할 수 있는 방법을 제안한다. 본 논문에서는 자소의 접촉을 유형별로 나누고 각 유형에 대하여 모음의 구조와 상대적인 위치 정보, 접촉의 형태 및 경험적인 규칙들을 사용하여 자소를 분리한다. 제안된 자소 분리 방법은 다음과 같은 순서로 적용된다 : 1) 입력된 낱자 이미지에서 모음을 추적한다 ; 2) 모음의 관점에서 접촉 후 발생하는 특징점의 추출이 명확한가를 판단한다 ; 3) 각 경우에 대한 접촉 유형을 확인한다 ; 4) 접촉 유형에 따른 자소 분리 방법을 적용한다. 필기된 한글 데이터베이스 PE92를 사용한 분리 실험에서 89.5%의 높은 분리율을 얻어서 제안된 방법의 유효성을 확인할 수 있었다.

  • PDF