초록
본 논문에서는 water flow model의 개념을 적용한 문서영상 이진화 방법의 속도를 개선하는 방법을 제안한다. 제안한 방법은 문서영상에서 문자 주위를 관심영역(region of interest: ROI)으로 추출하고 3차원 영상지형에서 물이 뿌려지는 영역을 관심영역 이내로 제한한다. 국부 계곡에 누적되는 물의 양은 계곡의 깊이와 경사를 이용하여 자동으로 결정된다. 그리고 계곡의 최저 지점뿐만 아니라 그 주위에도 가중치를 부여하여 물을 누적함으로써 관심영역에 해당하는 영상지형에 물을 붓는 과정을 한번만 수행하여 충분한 양의 물이 계곡에 채워지도록 한다. 계곡에 형성된 연못의 깊이는 배경과 문자의 밝기 차에 따라 다양하므로 연못의 깊이를 기준으로 문자 분리를 위한 임계치를 적응적으로 결정한다. 실제 문서영상에 대한 실험에서 제안한 방법의 수행속도가 water flow model에 기반 한 이진화 방법과 비교하여 월등히 향상되었으며 이진화 품질도 매우 우수함을 보였다.
This paper proposes a method to speed up the document image binarization using a water flow model. The proposed method extracts the region of interest (ROI) around characters from a document image and restricts pouring water onto a 3-dimensional terrain surface of an image only within the ROI. The amount of water to be filed into a local valley is determined automatically depending on its depth and slope. The proposed method accumulates weighted water not only on the locally lowest position but also on its neighbors. Therefore, a valley is filed enough with only one try of pouring water onto the terrain surface of the ROI. Finally, the depth of each pond is adaptively thresholded for robust character segmentation, because the depth of a pond formed at a valley varies widely according to the gray-level difference between characters and backgrounds. In our experiments on real document images, the Proposed method has attained good binarization performance as well as remarkably reduced processing time compared with that of the existing method based on a water flow model.