• 제목/요약/키워드: Hangul Graphemes

검색결과 6건 처리시간 0.018초

Handwritten Hangul Graphemes Classification Using Three Artificial Neural Networks

  • Aaron Daniel Snowberger;Choong Ho Lee
    • Journal of information and communication convergence engineering
    • /
    • 제21권2호
    • /
    • pp.167-173
    • /
    • 2023
  • Hangul is unique compared to other Asian languages because of its simple letter forms that combine to create syllabic shapes. There are 24 basic letters that can be combined to form 27 additional complex letters. This produces 51 graphemes. Hangul optical character recognition has been a research topic for some time; however, handwritten Hangul recognition continues to be challenging owing to the various writing styles, slants, and cursive-like nature of the handwriting. In this study, a dataset containing thousands of samples of 51 Hangul graphemes was gathered from 110 freshmen university students to create a robust dataset with high variance for training an artificial neural network. The collected dataset included 2200 samples for each consonant grapheme and 1100 samples for each vowel grapheme. The dataset was normalized to the MNIST digits dataset, trained in three neural networks, and the obtained results were compared.

한글 자소의 필기 특징 분석 (Handwriting Feature Analysis of Korean Alphabets)

  • 권오성
    • 정보교육학회논문지
    • /
    • 제4권2호
    • /
    • pp.129-139
    • /
    • 2001
  • 한글 필기의 효과적인 지도를 위해서는 학습자들의 필기샘플을 수집하고, 이를 분석하는 작업이 필요하다. 필기 수집은 교육대학교에 재학 중인 예비교사를 대상으로 하였고, 분석은 글자와 자소 단위로 나누어 수행하였다. 분석은 주로 글자의 획수, 필기 방향, 자소 사이의 위치 관계, 글자의 폭과 높이의 비를 주된 형태 특징 요소를 사용하였다. 본 논문의 분석 자료는 국어과 필기 지도를 위한 참고 자료로 사용될 뿐 아니라 한글 자형 및 정보화 연구에도 긴요히 사용될 수 있을 것이다.

  • PDF

다중 신경망을 이용한 인식단위 결합 기반의 인쇄체 문자인식 (Machine Printed Character Recognition Based on the Combination of Recognition Units Using Multiple Neural Networks)

  • 임길택;김호연;남윤석
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.777-784
    • /
    • 2003
  • 본 논문에서는 다중 신경망을 이용한 인식단위 결합 기반의 인쇄체 문자인식 방법을 제안한다. 입력 문자영상은 한글 문자 형식 6가지와 한글 이외의 기타 문자 형식의 전체 7가지 형식으로 분류되어 인식된다. 한글 문자는 2단계의 MLP 신경망 인식기에 의해 인식된다. 첫째 단계에서는 한글 문자를 자소의 조합 형태에 따라 2개 또는 3개의 인식단위로 나누고, 각 인식단위에서 추출된 방향각도 특징 벡터를 입력으로 하는 MLP 신경망으로 1차 인식한다. 둘째 단계에서는 첫째 단계의 인식단위별 MLP 신경망 인식기의 인식양상 특징을 추출하고 다른 MLP 신경망에 입력하여 최종 한글 문자인식을 한다. 한글 이외의 기타 문자의 인식을 위해서는 단일 MLP 신경망을 사용한다. 인식 실험에서는 실제 우편물 50,000통 영상으로부터 추출한 문자영상 데이터베이스를 이용하였는데, 실험 결과 본 논문에서 제안한 방법이 매우 우수함을 알 수 있었다.

선분정합에 의한 흘림체 온라인 한글 인식 (A Cursive On-Line Hangul Recognition Based on the Line Segment Matching)

  • 권오성;권영빈
    • 인지과학
    • /
    • 제3권2호
    • /
    • pp.271-289
    • /
    • 1992
  • 본 논문에서는 자소간 츨림의 형태를 허용하는 온라인 한글 인식 시스템을 제안하고 있다.한글의 인식은 자소 분할의 어려움과 후보문자의 증가에 따른 정합과정의 복잡도 증가라는 두 가지의 커다란 문제점을 갖고 있다.그러므로 본 논문에서는 이중 획분할 방법을 제안하고 이러한 획분할을 통하여 얻어진 선분들을 효율적으로 정합하는 인식 시스템의 구현을 설명하고 있다.또한,제안하는 방법이 흘림체 한글 인식에 적합하게 동작하는 것을 실험을 통하여 입증하였다.

자소간의 흘림을 허용하는 연속형 온라인 필기 인식 시스템의 구현 (Implementation of An On-Line Continuous Recognition System for Cursive Handwriting)

  • 권오성;권영빈
    • 전자공학회논문지B
    • /
    • 제31B권9호
    • /
    • pp.166-177
    • /
    • 1994
  • In this paper, an implemenation of on-line continuous recognizer for cursive Hangul handwriting is explained. For the Hangul recognition system, we propose a high speed string matching. The editing process in our proposed string matching is accomplished by single editing path. And the matching results are stored in a heap structure and we decide the user comfortibility of unceasing writing during recognition owing to the high speed matching. In the experimental result, a recongition rate of 86.36% at 1.75 second/character over 21,076 characters collected from 50 persons are abtained. And it is shown that the proposed recognition system is operated properly for the on-line recognition for cursive handwring between graphemes.

  • PDF

수정된 Neocognitron을 사용한 필기체 한글인식 (Study on the Neural Network for Handwritten Hangul Syllabic Character Recognition)

  • 김은진;백종현
    • 인지과학
    • /
    • 제3권1호
    • /
    • pp.61-78
    • /
    • 1991
  • 본 논문은 역행 통로(backward path)를 가진 수정된 Neocognitron 을 한글 음절 인식을 위해 적용한 결과에 관한 것이다. Fukushima의 논문에서 Neocognitron이 $19{\times}19$ 크기의 필기체 숫자를 인식할 수있다고 논술하였다. 본 논문에서는 스캐너 또는 마우스를 이용하여 필기체 한글 문자 또는 그 일부의 $61{\times}61$ 영상을 입력하였다. 수정된 Neocognitron은 3쌍의 Us, Uc층으로 구성되어있다. 본 신경회로망에서 마지막 인식층인 Uc층은 $5{\times}5$ 크기의 세포로 된 24개의 명(plane)으로 구성되어 있는데, 각각의 세포들은 동시에 주의력(attention)을 받아들이느 자소(grapheme)의 존재와 입력층에서의 상대적 위치를 구별할 수 있다. 본 신경회로망은 10개의 단모음 자소, 14개의 단자음 자소와 그들의 공간적 특징을 가지고 학습시켰다. 쉽게 학습되지 않는 패턴들은 여러번 학습시켰다. 왜곡, 잡음, 크기변화, 변형, 회전 등을 갖는 개개의 자소를 분류할 수 있도록 학습된 신경망을 한글 음절의 인식을 위해 사용하였으며, 음절자내의 영상 분할 작업을 위해 선택적 주의력 기법을 사용하였다. 입력문자에 대한 초기 표본 실험에서 본 모형은 필기체 한글 음절자의 시험패턴중 79%를 정확하게 인식하였다. 이 연구결과는 Neocognitron이 입력 영상을 인식가능한 부분으로 분할함으로써 큰크기의 분자 집합을 갖는 필기체 문자를 인식할수 있는 강력한 모형임을 시사해준다. 똑같은 접근 방법이 구조나 자소가 아주 복잡한 한자의 인식에도 적용될 수 있다고 본다. 그러나, 모의실험에서 처리시간에 있어 매우 심한 병목현상을 보여 주었다. 모형의 실질적인 사용을 위해서는 신경칩으로서의 구현이 선결되어야 할 것이다. 또, 복모음, 복자음으로 구성된 한글 음절자 인식을 위하여 모형에 대한 더 깊은 연구가 수행되어질 필요가 있다. 두개의 단자모사이의 이웃지역을 정확히 인식하는 것은 이렇나 작업을 위해 매우 중요한 일이 될 것이다.