Study on the Neural Network for Handwritten Hangul Syllabic Character Recognition

수정된 Neocognitron을 사용한 필기체 한글인식

  • Published : 1991.03.01

Abstract

This paper descibes the study of application of a modified Neocognitron model with backward path for the recognition of Hangul(Korean) syllabic characters. In this original report, Fukushima demonstrated that Neocognitron can recognize hand written numerical characters of $19{\times}19$ size. This version accepts $61{\times}61$ images of handwritten Hangul syllabic characters or a part thereof with a mouse or with a scanner. It consists of an input layer and 3 pairs of Uc layers. The last Uc layer of this version, recognition layer, consists of 24 planes of $5{\times}5$ cells which tell us the identity of a grapheme receiving attention at one time and its relative position in the input layer respectively. It has been trained 10 simple vowel graphemes and 14 simple consonant graphemes and their spatial features. Some patterns which are not easily trained have been trained more extrensively. The trained nerwork which can classify indivisual graphemes with possible deformation, noise, size variance, transformation or retation wre then used to recongnize Korean syllabic characters using its selective attention mechanism for image segmentation task within a syllabic characters. On initial sample tests on input characters our model could recognize correctly up to 79%of the various test patterns of handwritten Korean syllabic charactes. The results of this study indeed show Neocognitron as a powerful model to reconginze deformed handwritten charavters with big size characters set via segmenting its input images as recognizable parts. The same approach may be applied to the recogition of chinese characters, which are much complex both in its structures and its graphemes. But processing time appears to be the bottleneck before it can be implemented. Special hardware such as neural chip appear to be an essestial prerquisite for the practical use of the model. Further work is required before enabling the model to recognize Korean syllabic characters consisting of complex vowels and complex consonants. Correct recognition of the neighboring area between two simple graphemes would become more critical for this task.

본 논문은 역행 통로(backward path)를 가진 수정된 Neocognitron 을 한글 음절 인식을 위해 적용한 결과에 관한 것이다. Fukushima의 논문에서 Neocognitron이 $19{\times}19$ 크기의 필기체 숫자를 인식할 수있다고 논술하였다. 본 논문에서는 스캐너 또는 마우스를 이용하여 필기체 한글 문자 또는 그 일부의 $61{\times}61$ 영상을 입력하였다. 수정된 Neocognitron은 3쌍의 Us, Uc층으로 구성되어있다. 본 신경회로망에서 마지막 인식층인 Uc층은 $5{\times}5$ 크기의 세포로 된 24개의 명(plane)으로 구성되어 있는데, 각각의 세포들은 동시에 주의력(attention)을 받아들이느 자소(grapheme)의 존재와 입력층에서의 상대적 위치를 구별할 수 있다. 본 신경회로망은 10개의 단모음 자소, 14개의 단자음 자소와 그들의 공간적 특징을 가지고 학습시켰다. 쉽게 학습되지 않는 패턴들은 여러번 학습시켰다. 왜곡, 잡음, 크기변화, 변형, 회전 등을 갖는 개개의 자소를 분류할 수 있도록 학습된 신경망을 한글 음절의 인식을 위해 사용하였으며, 음절자내의 영상 분할 작업을 위해 선택적 주의력 기법을 사용하였다. 입력문자에 대한 초기 표본 실험에서 본 모형은 필기체 한글 음절자의 시험패턴중 79%를 정확하게 인식하였다. 이 연구결과는 Neocognitron이 입력 영상을 인식가능한 부분으로 분할함으로써 큰크기의 분자 집합을 갖는 필기체 문자를 인식할수 있는 강력한 모형임을 시사해준다. 똑같은 접근 방법이 구조나 자소가 아주 복잡한 한자의 인식에도 적용될 수 있다고 본다. 그러나, 모의실험에서 처리시간에 있어 매우 심한 병목현상을 보여 주었다. 모형의 실질적인 사용을 위해서는 신경칩으로서의 구현이 선결되어야 할 것이다. 또, 복모음, 복자음으로 구성된 한글 음절자 인식을 위하여 모형에 대한 더 깊은 연구가 수행되어질 필요가 있다. 두개의 단자모사이의 이웃지역을 정확히 인식하는 것은 이렇나 작업을 위해 매우 중요한 일이 될 것이다.

Keywords