Grapheme Segmentation Method for Low Quality Printed Hangul Text Recognition

저해상도 인쇄체 한글 영상 인식을 위한 자소 분할 방법

  • Lee Seong-Hun (Department of Computer Science, Korea Advanced Institute of Science and Technology) ;
  • Cho Kyu-Tae (Department of Computer Science, Korea Advanced Institute of Science and Technology) ;
  • Kim Jin-Sik (Department of Computer Science, Korea Advanced Institute of Science and Technology) ;
  • Kim Jin-Hyung (Department of Computer Science, Korea Advanced Institute of Science and Technology) ;
  • Jung Cheol-Kon (Samsung Advanced Institute of Technology (SAIT)) ;
  • Kim Sang-Kyun (Samsung Advanced Institute of Technology (SAIT)) ;
  • Moon Young-Su (Samsung Advanced Institute of Technology (SAIT)) ;
  • Kim Ji-Yeun (Samsung Advanced Institute of Technology (SAIT))
  • 이성훈 (한국과학기술원 전산학과) ;
  • 조규태 (한국과학기술원 전산학과) ;
  • 김진식 (한국과학기술원 전산학과) ;
  • 김진형 (한국과학기술원 전산학과) ;
  • 정철곤 (삼성종합기술원 컴퓨팅랩) ;
  • 김상균 (삼성종합기술원 컴퓨팅랩) ;
  • 문영수 (삼성종합기술원 컴퓨팅랩) ;
  • 김지연 (삼성종합기술원 컴퓨팅랩)
  • Published : 2006.06.01

Abstract

본 논문에서는 저해상도 한글 영상을 자소 단위로 분리하는 방법을 제안한다. 비디오 자막이나 저해상도 스캔 영상의 경우 자소간 획이 접촉되거나 잡영이 많이 포함되어 기존의 자소 분할 방법으로는 한계가 있다. 한자 문자열을 문자 단위로 분할하는데 사용된 비선형 분할 경로 알고리즘을 한글 낱자 영상에 적용하여 자소 단위로 분할한다. 기존의 분할 경로 알고리즘을 한글 자소 분할에 효과적으로 적용하기 위해서 우세점 탐지 알고리즘을 이용하여 자소간 접촉점을 찾고 이를 바탕으로 생성된 분할 경로에 따라 여러 개의 자소 후보 영상이 생성된다. 자소 영상을 자소 인식기로 인식한 결과 높은 인식률을 보이는 것을 실험을 통하여 확인하였다.

Keywords