A Study on Extraction of Character String in Document Image Using Morphology

Morphology를 이용한 문서화상내의 문자열 추출에 관한 연구

  • 장희돈 (광운대학교 전자계산기공학과) ;
  • 김동현 (광운대학교 전자계산기공학과) ;
  • 김석태 (부산수산대학교 정보통신공학과) ;
  • 남궁재찬 (광운대학교 전자계산기공학과)
  • Published : 1993.01.01

Abstract

This paper presents the segmentation of sentence area and diagram area from docwnent image. For extracting the sentence area, we perform the Dilation, basic operation of Morphology, to the document image and obtain the smeared document image. After the smeared docwnent image is blocked, we determine the writing form by the vertical and horizontal characteristics of the document image and calculate the skew from it. And then, we relocate the document image and extract the chatacter string from the relocated docwnent. 11 document images of three classes are considered and the character string has been well extracting from 11 document images.

본 논문은 문서화상으로 부터 문장영역과 도형영역을 분리해 내는 연구이다. 문자영역을 추출하기 위하여 문서화상에 대해 Morphology의 기본연산인 Dilation을 행해 문자를 융합하고 블럭화를 행한 후 문서 화상의 서식을 판정하고 판정된 문자열 서식에 따라 문서화상에서 기울기를 구하여 문서를 보정하며 보정된 문서에서 문자열을 추출하였다. 3개 종류 11개 데이타를 대상으로 실험한 결과 문자열이 대부분 추출됨을 알 수 있었다.

Keywords