On-line Recognition of Cursive Korean Characters Based on Hidden Markov Model and Level Building

은닉 마르코프 모델과 레벨 빌딩 알고리즘을 이용한 흘림체 한글의 온라인 인식

  • 김상균 (인제대학교 전산학과) ;
  • 김경현 (경북대학교 컴퓨터공학과) ;
  • 이종국 (안동대학교 컴퓨터공학과) ;
  • 이재욱 (동서대학교 컴퓨터공학과) ;
  • 김항준 (경북대학교 컴퓨터공학과)
  • Published : 1996.09.01

Abstract

In this paper, we propose a novel recognition model of on-line cursive Korean characters using HMM(Hidden Markov Model) and level building algorithm. The model is constructed as a form of recognition network with HMM for graphemes and Korean combination rules. Though the network is so flexible as to accomodate variability of input patterns, it has a problem of recognition speed caused by 11, 172 search paths. To settle the problem, we modify the level building algorithm to be adapted directly to the Korean combination rules and apply it to the model. The modified algorithm is efficient network search procedure time complexity of which depends on the number of HMMs for each grapheme, not the number of paths in the extensive recognition network. A test with 15, 000 hand written characters shows recognition rat 90% and speed of 0.72 second per character.

자소 단위의 HMM을 설계하고 製字 원리에 따라 연결한 한글 인식 네트워크에서 인식속도는 많은 경로수로 인해 상당히 느려진다. 본 논문에서는 탐색 속도를 개선 하기 위해 최적의 네트워크 탐색 방법인 레벨 빌딩 알고리즘을 수정, 적용한 온라인 한글 인식 모델을 제안한다. 한글 인식을 위한 레벨 빌딩은 초성·중성·종성 순의 정해진 필기 한글 구조를 반영한 syntax-directed 레벨 빌딩 탐색 알고리즘으로, 전체 11,172개의 경로를 가지는 방대한 크기의 인식 네트워크 탐색에 서 시간복잡 도가 경로수에 비의존적이고 노드 수 득, 개별 자소 HMM의 수에만 의존하는 효율적인 탐색 방법이다. 제한된 방법의 효용성을 입증하기 위한 인식 실험에서 KAIST의 온라인 한글 데이터, 15,000자를 대상으로 한 자당 0.72초의 인식속도를 보였다.

Keywords