Skew Correction of Business Card Images for PDA Application

PDA 응용을 위한 명함 영상의 회전 보정

  • 박준효 (삼성전자㈜ TN총괄 무선사업부) ;
  • 장익훈 (경운대학교 디지털전자정보공학부) ;
  • 김남철 (경북대학교 전자전기컴퓨터학부)
  • Published : 2003.12.01

Abstract

We present an efficient algorithm for skew correction of business card images obtained by a PDA (personal digital assistant) camera. The proposed method is composed of four parts: block adaptive binarization (BAB), stripe generation, skew angle calculation, and image rotation. In the BAB, an input image is binarized block by block so as to lessen the effect of irregular illumination and shadow over the input image. In the stripe generation, character string clusters are generated merging adjacent characters and their strings, and then only clusters useful for skew angle calculation are output as stripes. In the skew angle calculation, the direction angles of the stripes are calculated using their central moments and then the skew angle of the input image is determined averaging the direction angles. In the image rotation, the input image is rotated by the skew angle. Experimental results shows that the proposed method yields skew correction rates of about 93% for test images of several types of business cards acquired by a PDA under various surrounding conditions.

본 논문에서는 PDA에 장착된 카메라를 사용하여 획득한 명함 영상에 대한 회전 보정 알고리듬을 제안한다. 제안된 방법은 크게 블록적응 이진화부, 스트라이프 생성부, 회전각 계산부, 그리고 영상 회전부로 구성된다. 블록적응 이진화부에서는 입력 영상의 불균일한 조명이나 그림자의 영향을 감소시키기 위하여 입력 영상을 블록별로 이진화한다. 스트라이프 생성부에서는 인접한 문자와 이들로 이루어진 문자열들을 병합하여 문자열 클러스터를 생성하고, 생성된 클러스터 중에서 회전각 계산에 유용한 것들을 스트라이프로 분류한다. 회전각 계산부에서는 스트라이프들의 방향각을 중심 모멘트를 이용하여 계산하고 이들 방향각을 평균하여 입력 영상의 회전각으로 결정한다. 영상 회전부에서는 입력 영상을 계산된 회전각 만큼 회전시킨다. 실험결과 제안된 방법은 여러 종류의 명함을 다양한 주변 여건에서 PDA로 획득한 시험 영상에 대하여 약 93%의 회전 보정률을 보였다.

Keywords

References

  1. H. K. Kwag, S. H. Kim, S. H. Jeong, and G. S. Lee, 'Efficient skew estimation and correction algorithm for document images," Image and Vision Computing, vol. 20, pp. 25-35, Jan. 2002 https://doi.org/10.1016/S0262-8856(01)00071-3
  2. A. Dengel, 'ANASTASIL: A system for low-level and high-level geometric analysis of printed documents,' Structured Document Image AnaIysis, H. S. Baird et aL Eds., New York: Springer-Verlag, 1992
  3. D. X. Le, G. Thoma, and H. Weschler, 'Automated page orientation and skew angle detection for binary document images,' Pattern Recognition, vol. 27, PP. 1325-1344, Oct. 1994 https://doi.org/10.1016/0031-3203(94)90068-X
  4. Avanindra and S. Chaudhuri, 'Robust detection of skew in document images," IEEE Trans. linage Processing, vol. 6, pp. 344-349, Feb. 1997 https://doi.org/10.1109/83.551708
  5. H. Yan, 'Skew correction of document images using interline cross-correlation," CVGIP: Graphical Modets and Image Processing, vol. 55, pp. 538-543, Nov. 1993 https://doi.org/10.1006/cgip.1993.1041
  6. G. Ciadilla et al., 'An experimental system for office document handling and text recognition,' in Proc. Int. Conf. Pattern Recognition, 1988, pp. 739-743
  7. W. Postl, "Detection of linear oblique structures and skew scan in digitized documents,' in Proc. Int. Conf. Pattern Recognition, 1986, pp. 687-689
  8. N. Otsu, 'A threshold selection method from gray-level histograms,' IEEE Trans. Syst., Man, Cybern., vol. SMC-9, pp. 62-66, Jan. 1979
  9. 김종흔, 장익훈, 김남철, '블록 분류를 이용한 명함 영상에서의 블러링 판단,' 대한전자 공학회 2003번도 하계종합학술대회 논문집 IV, 2003년 7월, pp. 1707-1710
  10. R. C. Gonzalez and R. E. Wbods, Digital Image Processing, Upper Saddle River, NJ: Prentice-Hall, 2002
  11. L. G. Shapiro and G. C. Stockman, Computer Vision, Upper Saddle River, NJ: Prentice-Hall, 2001
  12. B. Jahne, H. HauBecker. and P. GeiBler, Handbook of Computer Vision and Apptications, San Dieso, CA: Academic Press, 1999