Machine-printed Numeral Recognition using Weighted Template Matching with Chain Code Trimming

체인 코드 트리밍과 가중 원형 정합을 이용한 인쇄체 숫자 인식

  • Jung, Min-Chul (Department of Computer Engineering, School of Engineering, Sangmyung University)
  • 정민철 (상명대학교 컴퓨터시스템공학과)
  • Published : 2007.12.31

Abstract

This paper proposes a new method of weighted template matching for machine-printed numeral recognition. The proposed weighted template matching, which emphasizes the feature of a pattern using adaptive Hamming distance on local feature areas, improves the recognition rate while template matching processes an input image as one global feature. Template matching is vulnerable to random noises that generate ragged outlines of a pattern when it is binarized. This paper offers a method of chain code trimming in order to remove ragged outlines. The method corrects specific chain codes within the chain codes of the inner and the outer contour of a pattern. The experiment compares confusion matrices of both the template matching and the proposed weighted template matching with chain code trimming. The result shows that the proposed method improves fairly the recognition rate of the machine-printed numerals.

본 논문에서는 인쇄체 숫자를 인식하기 위해 가중 원형 정합(weighted template matching) 방법을 제안한다. 원형 정합은 입력 영상 전체를 하나의 전역적인 특징으로 처리하는데 반해, 제안된 가중 원형 정합은 패턴의 특징이 나타나는 국부적인 영역에 해밍 거리(Hamming distance)의 가중치를 두어 패턴 특징을 강조하여 숫자 패턴의 인식률을 높인다. 또한 원형 정합은 영상을 이진화(binarization)할 때 발생되는 패턴의 윤곽선을 울퉁불퉁하게 만드는 랜덤 노이즈에 취약하다. 이러한 랜덤 노이즈를 제거하기 위해 본 논문에서는 체인 코드 트리밍(chain code trimming)방법을 제안한다. 체인 코드 트리밍은 패턴의 외부 윤곽선과 내부 윤곽선의 체인 코드 분석을 통해 특정 유형의 체인 코드를 제거, 교정함으로써 이루어진다. 실험에서는 기존의 원형 정합을 사용했을 때와 체인 코드 트리밍을 한 후 가중 원형 정합을 사용했을 때의 혼돈 행렬(confusion matrix)을 서로 비교한다. 실험 결과는 본 논문에서 제안한 방법에 의해 인쇄체 숫자의 인식률이 크게 향상된 것을 보인다.

Keywords