A Study on the Recognition of Handwritten Mixed Documents

필기체 혼합 문서 인식에 관한 연구

  • Published : 1994.06.01

Abstract

This paper proposes an effective recognition system which recognizes the mixed document consisting of handwritten korean/alphanumeric texts and graphic images. In the preprocessing step, an input image is binarized by the proposed thresholding scheme, then graphic and character regions are separated by using connected components and chain codes. Separated Korean characters are merged based on partial recognition and their character types and sized. In the character recognition step, we use the branch and bound algorithm based on DP matching costs to recognize Korean characters. Also we recognize alphanumeric characters using several robust features. Finally we use a dictionary and information of a recognition step to correct wrong recognition results. Computer simulation with several test documents shows what the proposed algorithm recognized effectively handwritten mixed texts.

본 논문에서는 그래픽을 포함한 필기체 한글화 영숫자로 구성된 혼합문서 인식시스팀을 제안하였다. 전처리 과정에서 제안한 국부적응 이진화 알고리듬으로 이진화를 수행하며, 연결요소와 체인코드를 이용하여 그래픽 영역을 분리하고 한글의 문자유형, 크기 그리고 수직모음의 부분적인 인식을 이용하여 개별문자를 분리한다. 인식단계에서는 DP 정합 비용함수값에 따른 brach and bound 알고리듬을 이용하여 한글 문자를 인식하며, 또한 몇 개의 안정한 특징값을 이용하여 영숫자를 인식하였다. 또한 인식단계에서의 정보와 단어사전의 정합을 통하여 인식기의 오류를 정정하였다. 컴퓨터 모의실험을 통하여 제안한 시스팀이 그래픽을 포함한 필기체 한글과 영숫자를 효과적으로 인식함을 보였다.

Keywords