Font Classification of English Printed Character using Non-negative Matrix Factorization

NMF를 이용한 영문자 활자체 폰트 분류

  • 이창우 (경북대학교 컴퓨터공학과) ;
  • 강현 (경북대학교 컴퓨터공학과) ;
  • 정기철 (숭실대학교 미디어학부) ;
  • 김항준 (경북대학교 컴퓨터공학과)
  • Published : 2004.03.01

Abstract

Today, most documents are electronically produced and their paleography is digitalized by imaging, resulting in a tremendous number of electronic documents in the shape of images. Therefore, to process these document images, many methods of document structure analysis and recognition have already been proposed, including font classification. Accordingly, the current paper proposes a font classification method for document images that uses non-negative matrix factorization (NMF), which is able to learn part-based representations of objects. In the proposed method, spatially total features of font images are automatically extracted using NMF, then the appropriateness of the features specifying each font is investigated. The proposed method is expected to improve the performance of optical character recognition (OCR), document indexing, and retrieval systems, when such systems adopt a font classifier as a preprocessor.

최근 대부분의 문서들이 전자적으로 생성되고 많은 고문서들이 이미지 형태로 전자화되고 있다. 이미지 형태의 전자 문서들은 정보 추출과 데이터베이스화에 많은 어려움이 있기 때문에, 이러한 문서를 효율적으로 관리하고 검색하기 위한 문서구조분석 방법과 문자 인식을 위한 많은 연구가 필요하다. 본 논문은 폰트의 구분 특성(font discrimination features)들이 폰트이미지의 공간적으로 지역적인 특징들에 기반함을 가정한 방법으로써, 객체의 부분기반 표현들을 학습할 수 있는 NMF(non-negative matrix factorization) 알고리즘을 사용하여 폰트를 자동으로 분류하는 방법이다. 제안된 방법은 부분기반의 비지도 학습 방법(part-based unsupervised learning technique)을 이용하여 전체의 폰트 이미지들로부터 각 폰트들의 구분 특징인 부분을 학습하고, 학습된 부분들을 특징으로 사용하여 폰트를 분류하는 방법이다. 실험결과에서 폰트 이미지들의 공간적으로 국부적인 특징들이 조사되고, 그 특징들이 폰트의 식별을 위한 적절성을 보인다. 제안된 방법이 기존의 문자인식, 문서 검색 시스템들의 전처리기로 사용되면, 그 시스템들의 성능을 향상시킬 것으로 기대된다.

Keywords

References

  1. G. Nagy, 'Twenty Years of Document Image Analysis in PAMI,' IEEE Transaction on Pattern Analysis and Machine Intelligence, vol. 22, no. 1, pp. 38-62, 2000 https://doi.org/10.1109/34.824820
  2. S. Khoubyari, J. J. Hull, 'Font and function word identification in document recognition,' Computer Vision and Image Understanding, vol. 63, no. 1, pp. 66-74, 1996 https://doi.org/10.1006/cviu.1996.0005
  3. H. Shi, T. Pavlidis, 'Font Recognition and Contextual Processing for More Accurate Text Recognition,' Proceedings of Document Analysis and Recognition '97, pp. 39-44, 1997 https://doi.org/10.1109/ICDAR.1997.619810
  4. A. Zramdini, R. Ingold, 'Optical Font Re cognition Using Typographical Features,' IEEE Transaction on Pattern Analysis and Machine Intelligence, vol. 20, no. 8, pp. 877-882, 1998 https://doi.org/10.1109/34.709616
  5. Y. Zhu, T. Tan, Y. Wang, 'Font Recognition Based on Global Texture Analysis,' IEEE Transaction on Pattern Analysis and Machine Intelligence, vol. 23, no. 10, pp. 1192-1200, 2001 https://doi.org/10.1109/34.954608
  6. D. D. Lee, H. S. Seung, 'Learning the Parts of Objects by Non-Negative Matrix Factorization,' Nature 401, pp. 788-791, 1999 https://doi.org/10.1038/44565
  7. H. S. Seung, 'Derivation of the objective function (Eq.2),' http://jounalclub.mit.edu
  8. D. D. Lee, H. S. Seung, 'Algorithms for non-negative matrix factorization,' In Advances in Neural Information Processing Systems, 13, pp. 556-562, 2001
  9. Y. Lu, 'Machine printed character segmentation - an overview,' Pattern Recognition, vol. 28, no. 1, pp. 67-80, 1995 https://doi.org/10.1016/0031-3203(94)00068-W
  10. J. H. Bae, K. Jung, J. W. Kim, H. J. Kim, 'Segmentation of Touching Characters Us ing an MLP,' Pattern Recognition Letters, vol. 19, no. 8, pp, 701-709, 1998 https://doi.org/10.1016/S0167-8655(98)00048-8
  11. K. lung, 'Neural network-based Text Location in Color Images,' Pattern Recognition Letters, vol. 22, no. 14, pp, 1503-1515, 2001 https://doi.org/10.1016/S0167-8655(01)00096-4
  12. B. Yu, A. K. lain, 'A Robust And Fast Skew Detection Algorithm for Generic Documents,' Pattern Recognition, vol 29, no. 10, pp. 1599-1629, 1996 https://doi.org/10.1016/0031-3203(96)00020-9
  13. C. W. Lee, H. Kang, K. Jung, H. J. Kim, 'Font Classification Using NMF,' Lecture Notes in Computer Science 2756, pp. 470 -477, 2003
  14. I. Biederman, 'Recognition-by-components: A theory of human understanding,' Pyschological Review, vol. 94, no. 2, pp, 115-147, 1987 https://doi.org/10.1037/0033-295X.94.2.115
  15. L. Shams, Development of Visual Shape Primitives, PhD thesis, University of Southern California, 1999
  16. M. Weber, M. Welling, and P. Perona, 'Un supervised learning of models for recognition,' In Proc. of 6th European Conference of Computer Vision, 2000
  17. A. K. Jain and D. Zongker, 'Representation and Recognition of Handwritten Digits Using Defromable Templates,' IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 19, no. 12, pp. 1386-1391, 1997 https://doi.org/10.1109/34.643899