Automatic Title Detection by Spatial Feature and Projection Profile for Document Images

공간 정보와 투영 프로파일을 이용한 문서 영상에서의 타이틀 영역 추출

  • 박효진 (영남대학교 컴퓨터공학과) ;
  • 김보람 (영남대학교 컴퓨터공학과) ;
  • 김욱현 (영남대학교 컴퓨터공학과)
  • Received : 2010.04.15
  • Accepted : 2010.07.29
  • Published : 2010.07.30

Abstract

This paper proposes an algorithm of segmentation and title detection for document image. The automated title detection method that we have developed is composed of two phases, segmentation and title area detection. In the first phase, we extract and segment the document image. To perform this operation, the binary map is segmented by combination of morphological operation and CCA(connected component algorithm). The first phase provides segmented regions that would be detected as title area for the second stage. Candidate title areas are detected using geometric information, then we can extract the title region that is performed by removing non-title regions. After classification step that removes non-text regions, projection is performed to detect a title region. From the fact that usually the largest font is used for the title in the document, horizontal projection is performed within text areas. In this paper, we proposed a method of segmentation and title detection for various forms of document images using geometric features and projection profile analysis. The proposed system is expected to have various applications, such as document title recognition, multimedia data searching, real-time image processing and so on.

본 논문은 형태 처리기법과 연결요소 분석을 이용한 문서 영상의 분할과 구조적인 특징과 투영 프로파일 분석을 이용하여 문서영상에서 제목영역 추출방안을 제안한다. 문서 영상의 처리는 영상 분할과 제목 추출, 두 단계로 이루어진다. 영상 분할의 단계에서는 문서 영상을 구성요소 영역들로 나눈다. 영상 분할이 끝나면 분할된 영역들을 대상으로 구조적인 정보를 이용하여 제목이 될 후보 영역을 추출한다. 제목이 아닌 영역을 제거하여 제목 후보영역을 추출하고 난 후 투영 프로파일을 분석하여 제목 영역을 최종적으로 추출한다. 본 논문에서 제시된 투영 프로파일 분석을 이용한 제목 추출 방법은 다양한 문서 영상의 분할 및 제목 추출 결과를 보였으며, 문서 제목 인식, 멀티미디어 데이터 검색, 실시간 영상처리와 같은 다양한 응용분야에 활용될 것으로 기대된다.

Keywords

References

  1. F. M. Wahi K. Y. Wong, and R. G. Casey, "Block segmentation and text extraction in mixed text/image documents," Computer Graphics and Image Processing, vol. 22, pp.375-390, Feb. 1982.
  2. Y. Y. Tang, C. D. Yan, and C. Y. Suen, "Document Processing for Automatic Knowledge Acquition," IEEE Trans. on Knowledge and Data Engineering, Vol. 6, No. 1, pp.3-21, Feb. 1994. https://doi.org/10.1109/69.273022
  3. D. Wang and S. N. Srihari, "Classification of newspaper image blocks using texture analysis," Computer Vision, Graphics, and Image Processing, vol. 47, pp.327-352, Jan. 1989. https://doi.org/10.1016/0734-189X(89)90116-3
  4. 곽희규, "문서 영상의 단어 단위 분할 및 단어 영상의 속성 추출에 관한 연구," 전남대학교 대학원 전산통계학과 학위논문, 2001.
  5. 서정, 김보람, 오준택, 김욱현, "텍스쳐 기반 BP 신경망을 이용한 위성영상의 도로영역 추출", 한국신호처리시스템학회논문지, v.10, no.3, pp.164-169, 2009.
  6. B. Wang, XF. Li, F. Liu, FQ. Hu, "Color text image binarization based on binary texture analysis", Pattern Recognition Letters, vol. 26, pp.1650-1657, Aug. 2005 https://doi.org/10.1016/j.patrec.2004.12.006
  7. N. Otsu, "A threshold selection method from gray level histograms," IEEE Trans. on Syst. Man Cybern. vol.9, no.1, pp.62-66, 1979
  8. S. Nomura, K. Yamanaka, T. Shiose, H. Kawakami, O. Katai, "Morphological preprocessing method to thresholding degraded word images", Pattern Recognition Letters, vol. 30, pp.729-744, Jun. 2009 https://doi.org/10.1016/j.patrec.2009.03.008
  9. B. R. Kim, J. T. Oh, W. H. Kim, "Segmentation and Contents Classification of Document Images Using Local Entropy and Texture-based PCA Algorithm", Korea Information Processing Society, 2009.
  10. K. Jung, JH. Han, "Hybrid approach to efficient text extraction in complex color images", Pattern Recognition Letters, vol. 25, pp.679-699, Apr. 2009.
  11. Yi Xiao, Hong Yan, "Location of title and author regions in document images based on the Delaunay triangulation", Image and Vision Computing, Vol. 22, pp.679-699, 2004.