A Character Recognition on Complex Color Documents

복잡한 컬러 문서에 대한 문자인식

  • 양철용 (경북대학교 컴퓨터 공학과 인공지능 연구실) ;
  • 김갑기 (경북대학교 컴퓨터 공학과 인공지능 연구실) ;
  • 김진욱 (경북대학교 컴퓨터 공학과 인공지능 연구실) ;
  • 김항준 (경북대학교 컴퓨터 공학과 인공지능 연구실)
  • Published : 2000.08.01

Abstract

최근 수많은 인쇄된 문서들이 HTML과 같은 디지털 문서로 바뀌고 있으며 이를 자동으로 변환해 주는 문자인식 기술에 대한 관심이 증가하고 있다. 본 논문에서는 그림과 글자가 공존하는 문서에서 자동으로 문자영역을 추출해서 문자를 인식하는 방법을 제안한다. 우선 입력문서는 유사한 칼라로 이루어진 영역들로 나누어진 뒤 휴리스틱 룰에 의해 문자후보 영역과 비 문자 영역으로 나누어진다. 그 다음 이들 문자후보영역들은 문자인식기를 이용하여 문자 혹은 문자의 일부분으로 인식된다. 제안된 방법으로 여러 문서들에 대하여 실험한 결과를 보이며 그 성능을 평가한다.

Keywords