Hangul Component Decomposition in Outline Fonts

한글 외곽선 폰트의 자소 분할

  • Koo, Sang-Ok (School of Computer Science and Engineering, Kyungpook National University) ;
  • Jung, Soon-Ki (School of Computer Science and Engineering, Kyungpook National University)
  • 구상옥 (경북대학교 IT대학 컴퓨터학부) ;
  • 정순기 (경북대학교 IT대학 컴퓨터학부)
  • Received : 2011.08.30
  • Accepted : 2011.09.09
  • Published : 2011.12.01

Abstract

This paper proposes a method for decomposing a Hangul glyph of outline fonts into its initial, medial and final components using statistical-structural information. In a font family, the positions of components are statistically consistent and the stroke relationships of a Hangul character reflect its structure. First, we create the component histograms that accumulate the shapes and positions of the same components. Second, we make pixel clusters from character image based on pixel direction probabilities and extract the candidate strokes using position, direction, size of clusters and adjacencies between clusters. Finally, we find the best structural match between candidate strokes and predefined character model by relaxation labeling. The proposed method in this paper can be used for a study on formative characteristics of Hangul font, and for a font classification/retrieval system.

본 논문은 한글 외곽선 폰트를 입력으로 글자의 초성, 중성, 종성 요소(컴포넌트)를 통계적-구조적 정보를 이용하여 분할하는 방법을 제안한다. 한 폰트 내에서 한글 컴포넌트는 통계적으로 일정한 위치에 나타나며, 각 컴포넌트를 이루는 획 간의 관계는 그 컴포넌트의 구조적 특징을 나타낸다. 우리는 먼저 각 컴포넌트의 위치를 저장하는 컴포넌트 히스토그램을 생성하여 컴포넌트 위치에 관한 통계 정보를 저장하였다. 그리고 글자의 구조적 정보를 반영하기 위해 픽셀의 방향성 확률을 기반으로 픽셀클러스터를 만들고, 클러스터의 위치, 방향 및 크기, 클러스터간 인접성 정보를 이용하여 후보 획을 추출하였다. 마지막으로 릴렉세이션 레이블링을 통해 후보 획 집합과 미리 정의된 글자 모델 간의 가장 적합한 구조적 매치를 구하였다. 본 논문에서 제안한 컴포넌트 분할방법은 한글 폰트의 조형적 특징에 관한 연구 및 이를 활용한 폰트분류 빛 폰트검색에 활용될 수 있다.

Keywords

References

  1. I. Biederman, "Recognition-by-Components: A Theory of Human Image Understanding," Psychological Rev., vol. 94, no. 2, pp. 115-147, Apr. 1987. https://doi.org/10.1037/0033-295X.94.2.115
  2. K.W. Kang and J.H. Kim, "Utilization of Hierarchical, Stochastic Relationship Modeling for Hangul Character Recognition," IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 26, no. 9, pp. 1185-1196, Sep. 2004. https://doi.org/10.1109/TPAMI.2004.74
  3. J. Zeng and Z.Q. Liu, "Markov Random Field-Based Statistical Character Structure Modeling for Handwritten Chinese Character Recognition," IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 30, no. 5, pp. 767-780, May 2008. https://doi.org/10.1109/TPAMI.2007.70734
  4. Apple Computer, Inc. The TrueType Font Format Specification, Version 1.0, 1990.
  5. Microsoft Typography, http://www.microsoft.com/typography/.
  6. D.E. Knuth, "METAFONT: The Program," Addison Wesley, 1986.
  7. Bitstream Inc., "Stroke-Based Fonts : Compact, High-Quality Chinese, Japanese, and Korean Fonts for Embedded Systems," Technical Paper of Bitstream Inc., 2005.
  8. E.J.Jakubiak, R.N. Perry, S.F. Frisken, "An Improved Representation for Stroke-based Fonts," ACM SIGGRAPH, Article 137, July 2006. (ACM Press, TR2006-119)
  9. 넥서스폰트 (NexusFont), http://xiles.net/downloads/#NexusFont.
  10. P. F. Felzenszwalb and D. P. Huttenlocher, "Distance Transforms of Sampled Functions," Cornell Computing and Information Science Technical Report TR2004-1963, 2004.
  11. M. Turk, A. Pentland, "Eigenfaces for recognition," Journal of Cognitive Neuroscience, vol. 3, no. 1, pp. 71-86, 1991. https://doi.org/10.1162/jocn.1991.3.1.71
  12. M. Solli and R. Lenz, FyFont: Find-your-Font in Large Font Databases, In Proceedings of the 15th Scandinavian conference on Image analysis, pp. 432-441, 2007.