Water flow model에 기반한 문서영상 이진화 방법의 속도 개선

Speed-up of Document Image Binarization Method Based on Water Flow Model

  • 오현화 (경북대학교 전자전기공학부) ;
  • 김도훈 (경북대학교 전자전기공학) ;
  • 이재용 (삼성 SDI PDP 본) ;
  • 김두식 (한국전자통신연구원 우정기술연구센) ;
  • 임길택 (경주대학교 컴퓨터멀티미디어공학) ;
  • 진성일 (경북대학교 전자전기공학부)
  • 발행 : 2004.07.01

초록

본 논문에서는 water flow model의 개념을 적용한 문서영상 이진화 방법의 속도를 개선하는 방법을 제안한다. 제안한 방법은 문서영상에서 문자 주위를 관심영역(region of interest: ROI)으로 추출하고 3차원 영상지형에서 물이 뿌려지는 영역을 관심영역 이내로 제한한다. 국부 계곡에 누적되는 물의 양은 계곡의 깊이와 경사를 이용하여 자동으로 결정된다. 그리고 계곡의 최저 지점뿐만 아니라 그 주위에도 가중치를 부여하여 물을 누적함으로써 관심영역에 해당하는 영상지형에 물을 붓는 과정을 한번만 수행하여 충분한 양의 물이 계곡에 채워지도록 한다. 계곡에 형성된 연못의 깊이는 배경과 문자의 밝기 차에 따라 다양하므로 연못의 깊이를 기준으로 문자 분리를 위한 임계치를 적응적으로 결정한다. 실제 문서영상에 대한 실험에서 제안한 방법의 수행속도가 water flow model에 기반 한 이진화 방법과 비교하여 월등히 향상되었으며 이진화 품질도 매우 우수함을 보였다.

This paper proposes a method to speed up the document image binarization using a water flow model. The proposed method extracts the region of interest (ROI) around characters from a document image and restricts pouring water onto a 3-dimensional terrain surface of an image only within the ROI. The amount of water to be filed into a local valley is determined automatically depending on its depth and slope. The proposed method accumulates weighted water not only on the locally lowest position but also on its neighbors. Therefore, a valley is filed enough with only one try of pouring water onto the terrain surface of the ROI. Finally, the depth of each pond is adaptively thresholded for robust character segmentation, because the depth of a pond formed at a valley varies widely according to the gray-level difference between characters and backgrounds. In our experiments on real document images, the Proposed method has attained good binarization performance as well as remarkably reduced processing time compared with that of the existing method based on a water flow model.

키워드

참고문헌

  1. H. Cheng and Z. Fan, 'Background Identification Based Segmentation and Multilayer Three Representation of Document Images,' in Proc. of Int'l Conf. on Image Processing, vol. 3, pp. 1005-1008, 2002 https://doi.org/10.1109/ICIP.2002.1039145
  2. G. Leedham, S. Varma, A. Patankar, and V. Govindaraju, 'Separating Text and Background in Degraded Document Images-A Comparison of Global Thresholding Techniques for Multi-Stage Thresholding,' in Proc. of the Eighth Int'l Workshop on Frontiers in Handwritten Recognition,' pp. 244-249, 2002 https://doi.org/10.1109/IWFHR.2002.1030917
  3. J. Sauvola and M. Pietikainen, 'Adaptive Document Image Binarization,' Pattern Recognition, vol. 33, pp. 225-236, 2000 https://doi.org/10.1016/S0031-3203(99)00055-2
  4. N. Otsu, 'A Threshold Selection Method from Gray-Scale Histogram,' IEEE Trans. Systems, Man, and Cybernetics, vol. SMC-8, pp. 62-66, 1978
  5. J.N. Kapur, P.K. Sahoo, and A.K.C. Wang, 'A New Method for Gray-Level Picture Thresholding Using Entropy of the Histogram,' Graphical Models and Image Processing, vol. 29, pp. 273-285, 1985 https://doi.org/10.1016/0734-189X(85)90125-2
  6. J. Kitter and J. lllingworth, 'On Threshold Selection Using Clustering Criteria,' IEEE Trans. Systems, Man, and Cybernetics, vol. SMC-15, pp. 652-655, 1985 https://doi.org/10.1109/TSMC.1985.6313443
  7. L. O'Gorman, 'Binarization and Multithresholding of Document Image Using Connectivity,' Graphical Models and Image Processing, vol. 56, no. 6, pp. 494-506, 1994 https://doi.org/10.1006/cgip.1994.1044
  8. I.-K. Kim, D.-W. Jung, and R.-H. Park, 'Document Image Binarization Based on Topographic Analysis Using a Water Flow Model,' Pattern Recognition, vol. 35, pp. 265-277, 2002 https://doi.org/10.1016/S0031-3203(01)00027-9
  9. S. Rodtook and Y. Rangsanseri, 'Adaptive Thres holding of Document Images Based on Laplacian Sign,' in Proc. of Int'l Conf. on Information Technology: Coding and Computing, pp. 501-505, 2001 https://doi.org/10.1109/ITCC.2001.918846
  10. 박성호, 장대근, 황찬식, '1차원 메디안 필터 기반문서영상 영역해석,' 전자공학회논문지, 제40권 SP편, 제3호, 10-18쪽, 2003년 5월
  11. Y. Liu and S.N. Srihari, 'Document Image Binarization Based on Texture Features,' IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 19, no. 5, pp. 540-544, 1997 https://doi.org/10.1109/34.589217
  12. J.S. Weszka and A. Rosenfeld, 'Histogram Modification for Threshold Selection,' IEEE Trans. Systems, Man, and Cybernetics, vol. SMC-9, no. 1, pp. 38-52, 1979