Region Analysis of Business Card Images Acquired in PDA Using DCT and Information Pixel Density

DCT와 정보 화소 밀도를 이용한 PDA로 획득한 명함 영상에서의 영역 해석

  • 김종흔 (LG전자㈜ 영상제품연구소) ;
  • 장익훈 (경운대학교 디지털전자공학) ;
  • 김남철 (경북대학교 전자전기컴퓨터학부)
  • Published : 2004.08.01

Abstract

In this paper, we present an efficient algorithm for region analysis of business card images acquired in a PDA by using DCT and information pixel density. The proposed method consists of three parts: region segmentation, information region classification, and text region classification. In the region segmentation, an input business card image is partitioned into 8 f8 blocks and the blocks are classified into information and background blocks using the normalized DCT energy in their low frequency bands. The input image is then segmented into information and background regions by region labeling on the classified blocks. In the information region classification, each information region is classified into picture region or text region by using a ratio of the DCT energy of horizontal and vertical edge components to that in low frequency band and a density of information pixels, that are black pixels in its binarized region. In the text region classification, each text region is classified into large character region or small character region by using the density of information pixels and an averaged horizontal and vertical run-lengths of information pixels. Experimental results show that the proposed method yields good performance of region segmentation, information region classification, and text region classification for test images of several types of business cards acquired by a PDA under various surrounding conditions. In addition, the error rates of the proposed region segmentation are about 2.2-10.1% lower than those of the conventional region segmentation methods. It is also shown that the error rates of the proposed information region classification is about 1.7% lower than that of the conventional information region classification method.

본 논문에서는 PDA에 장착된 카메라를 사용하여 획득한 명함 영상에 대한 효율적인 영역 해석 알고리듬을 제안한다. 제안된 방법은 크게 영역 분할, 정보 영역 분류, 문자 영역 분류의 3개 과정으로 구성된다. 영역 분할에서는 입력 명함 영상을 8${\times}$8 크기의 블록으로 나누고 각 블록을 저주파 대역에서의 정규화 된 DCT 계수의 에너지를 이용하여 정보 블록과 배경 블록으로 분류한 다음, 블록에 대한 영역 라벨링을 통하여 정보 영역과 배경 영역으로 분할한다. 정보 영역 분류에서는 각 정보 영역을 블록 신호의 수평, 수직 방향 에지 성분과 저주파 대역에서의 DCT 계수의 에너지 비와 이진화 된 정보 영역 내에서의 흑화소인 정보 화소의 밀도를 이용하여 문자 영역과 배경 영역으로 분류한다. 문자 영역 분류에서는 분류된 문자 영역을 정보 화소의 밀도와 평균 런 길이를 이용하여 다시 큰 문자와 작은 문자 영역으로 분류한다. 실험결과 제안된 영역 해석 방법은 여러 종류의 명함을 다양한 주변 여건에서 PDA로 획득한 시험 영상에 대하여 정보 영역과 배경 영역을 잘 분할하고, 정보 영역을 문자 영역과 그림 영역으로 잘 분류하며, 다시 문자 영역을 큰 문자와 작은 문자 영역으로 잘 분류함을 보였다 그리고 제안된 영역 분할 방법과 정보 영역 분류 방법은 기존의 방법들보다 각각 약 2.2-10.1%와 7.7%의 에러율 향상을 보였다.

Keywords

References

  1. Proc. IEEE ICDAR'95 Page segmentation and classification utilising bottom-up approach D. Drivas;A. Amin
  2. Proc. IEEE ICADAR'95 Page segmentation and classification using fast feature extraction and connectivity analysis J. Sauvola;M. Pietikainen
  3. Proc.IEEE 1st Int. Conf. Knowledge-Based Intelligent Electronic Systems v.1 Document segmentation and classification with top-down approach H. Wang;S.Z. Li;S. Ragupathi
  4. SPIE v.1349 Transform coding of digital image using variable block DCT with adaptive thresholding and quantization C.T. Chen https://doi.org/10.1117/12.23515
  5. SPIE v.1258 Segmentation of document images P.J. Bones;T.C. Griffin;C.M. Carey-Smith https://doi.org/10.1117/12.19949
  6. Proc. IEEE Twenty-Eight Asilomar Conf. Signals, Systems and Computers v.2 Text segmentation in mixed-mode images N. Chaddha;R. Sharma;A.Agrawal;A. Gupta
  7. IEEE Trans. Pattern Anal. Machine Intell. v.15 The document spectrum for page layout analysis L. O'Gorman https://doi.org/10.1109/34.244677
  8. Proc. IEEE ICIPS'97 v.2 An efficient method for page segmentation X. Li;W.G. Oh;S.Y. Ji;K.A. Moon;H.J. Kim
  9. IEEE Trans.Pattern Anal. Machine Intell. v.23 Parameter-free geometric document layout analysis S. W. Lee;D. S. Ryu https://doi.org/10.1109/34.969115
  10. Proc. IEEE Int. Symp. Intelligent Multimedia, Video and Speech Processing Page segmentation and content classification for automatic document image processing S. K. Yip;Z. Chi
  11. 한국통신학회 논문지 v.28 no.12C PDA 응용을 위한 명함 영상의 회전 보정 박준효;장익훈;김남철
  12. IEEE Trans. Syst., Man, Cybern. v.SMC-9 A threshold selection method from gray-level histograms N. Otsu