DOI QR코드

DOI QR Code

문서 영상의 그림 영역에서 통계적 분석을 이용한 단어 영상 추출

Word Image Decomposition from Image Regions in Document Images using Statistical Analyses

  • 정창부 (호남대학교 인터넷소스트웨어학과) ;
  • 김수형 (전남대학교 전자컴퓨터공학부)
  • 발행 : 2006.12.31

초록

본 논문에서는 문서 영상의 그림 영역에서 통계적 분석을 통한 단어 영상을 추출하는 방법을 제안한다. 제안 방법은 그림 영역의 구성 요소를 문자 성분과 그래픽 성분으로 분류하기 위하여 연결요소에 대한여 통계적 분석 방법인 상자그림 분석을 적용하고, 분류된 문자 성분들에 대하여 지역적 밀집도를 분석하여 문자 영역을 추출한다. 추출된 문자 영역에서 투영 히스토그램 분석을 통하여 문자열을 추출하고, 문자열을 단어단위 영상으로 분리하기 위하여 투영 히스토그램 분석과 갭 군집화, 특수 기호 검출 등을 수행한다. 제안 방법은 임계값의 사용 대신에 그림 영역의 구성 요소들에 대하여 통계적 분석을 수행하기 때문에 그림의 형태 변화에 민감하지 않으며, 지역적 밀집도 분석으로 보다 정확한 문자 영역을 추출하였다. 또한 제안 방법의 응용 분야인 주제어 검색을 위한 오프라인의 전처리에 해당하는 문서 영상의 단어단위 영상 추출에 적용하여 제안 방법에 대한 연구의 필요성을 제시하였다.

This paper describes the development and implementation of a algorithm to decompose word images from image regions mixed text/graphics in document images using statistical analyses. To decompose word images from image regions, the character components need to be separated from graphic components. For this process, we propose a method to separate them with an analysis of box-plot using a statistics of structural components. An accuracy of this method is not sensitive to the changes of images because the criterion of separation is defined by the statistics of components. And then the character regions are determined by analyzing a local crowdedness of the separated character components. finally, we devide the character regions into text lines and word images using projection profile analysis, gap clustering, special symbol detection, etc. The proposed system could reduce the influence resulted from the changes of images because it uses the criterion based on the statistics of image regions. Also, we made an experiment with the proposed method in document image processing system for keyword spotting and showed the necessity of studying for the proposed method.

키워드

참고문헌

  1. LA Fletcher and R. Kasturi, 'A Robust Algorithm for Text String Separation from Mixed Text/Graphics Images,' IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 10, No.6, pp. 910-918, 1988 https://doi.org/10.1109/34.9112
  2. K Tombre, S. Tabbone, L. Pelissier, B. Larniroy, and P. Dosch, 'Text/Graphics Separation Revisited,' LNCS Vol. 2423, pp. 200-211, 2002
  3. Z. Lu, 'Detection of Text Regions From Digital Engineering Drawings,' IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No.4, pp. 910-918, April 1998 https://doi.org/10.1109/34.677283
  4. O. Shiku, K. Kawasue, and A. Nakamura, 'A Method for Character String Extraction Using Local and Global Segment Crowdedness,' Proc. International Conference on Pattern Recognition, Vol. 2, pp. 1077-1080, 1998 https://doi.org/10.1109/ICPR.1998.711879
  5. C.L. Tan and P.O. Ng, 'Text Extraction using Pyramid,' Pattern Recognition, Vol. 31, No.1, pp. 63-72, 1998. https://doi.org/10.1016/S0031-3203(97)00026-5
  6. 김석태, 이대원, 박찬용, 남궁재찬, '연결특성함수를 이용한 문서화상에서의 영역 분리와 문자열 추출,' 한국통신학회 논문지, Vol. 22, No. 11, pp. 2531-2542, 1997
  7. H.C. Park, S.Y. Ok, Y.J. Yu, and H.G. Cho, 'A word extraction algorithm for machine-printed documents using a 3D neighborhood graph model,' International Journal of Document Analysis and Recognition, Vol. 4, pp. 115-130, 2001 https://doi.org/10.1007/PL00010903
  8. 심정욱, 손영숙, 백장선, 수리통계학, 자유아카데미, 제4판, 2003
  9. 정창부, 김수형, '투영 프로파일, Gap 및 특수 기호를 이용한 텍스트 영역의 이절 단위 분할,' 정보과학회논문지: 소프트웨어 및 응용, 제31권, 제9호, pp. 1121-1130, 2004