Restoration of Character String Stained with Line in Various Kinds of Form Documents

다양한 서식 문서에서 선에 의해 훼손된 문자열 복원

  • 이창현 (연세대학교 컴퓨터과학과) ;
  • 이관용 (연세대학교 컴퓨터과학과) ;
  • 김경환 (서강대학교 전자공학과) ;
  • 최영우 (숙명여자대학교 전산학과) ;
  • 이일병 (연세대학교 컴퓨터과학과)
  • Published : 1999.10.01

Abstract

현 사회에서 사용하고 있는 문서들은 양식을 가지고 있는 서식문서가 대부분이며, 이러한 양식을 가지고 있는 서식문서는 사회가 발전함에 따라 전자 문서로의 변경이 요구되고 있다. 그러나 서식문서를 전자 문서로 바꾸는 작업은 쉬운 일이 아니며, 이 작업을 위해 문자인식 기술이 요구된다. 특히 서식문서에서 문자의 인식률을 높이기 위해서는 문서양식의 라인과 겹쳐진 문자에 대하여 라인제거 및 문자 복원이 필수적이며, 또한 대부분의 서식 문서의 양식에 기입하는 내용은 문자열로 구성되어 있으므로 문자복원에 있어서 낱자 단위의 문자복원이 아닌 문자열 단위의 문자복원이 필요하다. 본 논문에서는 다양한 서식문서에서 라인과 겹쳐진 문자 영상에 대해 문자열 단위의 라인제거 및 복원하는 방법을 제안한다.

Keywords