대용량 온라인 필기 한자 인식을 위한 구조 코드 및 HMM 기반의 클러스터링 방법

Clustering Method based on Structure Code and HMM for Huge Class On-line Handwritten Chinese Character Recognition

  • 김광섭 (강원대학교 컴퓨터정보통신공학과) ;
  • 하진영 (강원대학교 컴퓨터정보통신공학과)
  • Kim, Kwang-Seob (Dept. of Computer Engineering, Kangwon National University) ;
  • Ha, Jin-Young (Dept. of Computer Engineering, Kangwon National University)
  • 발행 : 2008.06.30

초록

본 논문에서는 은닉 마르코프 모델(HMM)을 기반한 대용량의 필기 한자 인식의 문제점인 시스템 리소스의 한계와 인식에 소요되는 많은 시간을 단축하기 위해 구조코드와 HMM에 최적화 된 클러스터링 알고리즘을 제안한다. 제안하는 클러스터링 알고리즘의 기본 개념은 훈련된 HMM를 대상으로 하고, HMM의 파라미터 수가 동일한 클래스에 대해서 클러스터를 구성하는 것이다. 또한 인식에 소요되는 시간을 줄이기 위해 2단계 클러스터모델 구조를 사용한다. 총 98,639 종류의 일본 한자를 대상으로 한 실험에서 평균 0.92 sec/char 인식 속도와 30순위 후보인식률 96.03%를 보임으로서 대용량 필기 한자 인식을 위한 좋은 방안이 될 것이라 기대한다.

키워드