DOI QR코드

DOI QR Code

Character Region Extraction Based on Texture and Depth Features

질감과 깊이 특징 기반의 문자영역 추출

  • 장석우 (안양대학교 디지털미디어학과) ;
  • 박영재 (숭실대학교 컴퓨터학부) ;
  • 허문행 (안양대학교 디지털미디어학과)
  • Received : 2012.11.14
  • Accepted : 2013.02.06
  • Published : 2013.02.28

Abstract

In this paper, we propose a method of effectively segmenting character regions by using texture and depth features in 3D stereoscopic images. The suggested method is mainly composed of four steps. The candidate character region extraction step extracts candidate character regions by using texture features. The character region localization step obtains only the string regions in the candidate character regions. The character/background separation step separates characters from background in the localized character areas. The verification step verifies if the candidate regions are real characters or not. In experimental results, we show that the proposed method can extract character regions from input images more accurately compared to other existing methods.

본 논문에서는 3차원의 입체영상으로부터 질감과 깊이 특징을 활용하여 영상 내에 존재하는 문자를 효과적으로 분할하는 방법을 제안한다. 제안된 문자 분할 방법은 크게 후보 문자영역 추출 단계, 문자영역 지역화 단계, 문자와 배경영역 분리 단계, 그리고 후보 문자영역 검증 단계의 네 가지 단계로 구성된다. 후보 문자영역 추출 단계에서는 입력된 영상에서 질감 특징을 이용해 문자영역이 존재하는 후보 영역을 분할하고, 문자영역 지역화 단계에서는 후보 문자영역 중에서 문자열만을 형성하는 영역을 추출한다. 그리고 문자와 배경 분리 단계에서는 지역화된 문자영역을 문자와 배경으로 분리하며, 후보 문자영역 검증 단계에서는 거리 특징을 활용하여 추출된 문자영역이 비 문자영역을 포함하지 않고 문자영역만을 포함하고 있는지를 최종적으로 검증한다. 실험에서는 제안된 방법을 여러 가지 영상에 적용하여 테스트 해 보았으며, 제안된 방법이 기존의 방법에 비해 보다 정확하게 문자영역을 추출함을 확인하였다.

Keywords

References

  1. K.-J. Ahn and G.-Y. Kim, "Determing Intensity Value of Characters and Backgrounds on Caption," In Proc. of the Conference of the Korea Society of Computer and Information, Vol. 18, No. 2, pp. 125-128, 2010.
  2. X. Qian, G. Liu, H. Wang, and R. Su, "Text Detection, Localization, and Tracking in Compressed Video," Signal Processing: Image Communication, Vol. 22, No. 9. pp. 752-768. Oct. 2007. DOI: http://dx.doi.org/10.1016/j.image.2007.06.005
  3. M. R. Lyu, J. Song, and M. Cai. "A Comprehensive Method for Multilingual Video Text Detection, Localization, and Extraction," IEEE Transactions on Circuits and Systems for Video Technology, Vol. 15, No. 2, pp. 243-255, Feb. 2005. DOI: http://dx.doi.org/10.1109/TCSVT.2004.841653
  4. W. Kim and C. Kim, "A New Approach for Overlay Text Detection from Complex Video Scene," Journal of the Korean Society of Broadcast Engineers, Vol. 13, No. 4, pp. 544-553, Jul. 2008. DOI: http://dx.doi.org/10.5909/JBE.2008.13.4.544
  5. W. Kim and C. Kim, "A New Approach for Overlay Text Detection and Extraction from Complex Video Scene," IEEE Transactions on Image Processing, Vol. 18, No. 2, pp. 401-411, Feb. 2009. DOI: http://dx.doi.org/10.1109/TIP.2008.2008225
  6. P. P. Roy, U. Pal, J. Llados, and M. Delalandre, "Multi-oriented Touching Text Character Segmentation in Graphical Documents Using Dynamic Programming," Pattern Recognition, Vol. 45, No. 5, pp. 1972-1983, May 2012. DOI: http://dx.doi.org/10.1016/j.patcog.2011.09.026
  7. K.-J. An, S.-I. Joo, G.-Y. Kim, and H.-I. Choi, "An Improved Method for Detecting Caption in Image Using DCT-Coefficient and Transition- map Analysis," Journal of the Korea Society of Computer and Information, Vol. 16, No. 4, pp. 61-71, Apr. 2011. DOI: http://dx.doi.org/10.9708/jksci.2011.16.4.061
  8. O. Strauss and F. Comby, "Variable Structuring Element-based Fuzzy Morphological Operations for Single Viewpoint Omnidirectional Images," Pattern Recognition, Vol. 40, No. 12, pp. 3578- 3596, Dec. 2007. DOI: http://dx.doi.org/10.1016/j.patcog.2007.05.003
  9. A. Jama and S. Rakshit, "Augmenting Graph Cut with TV-L Approach for Robust Stereo Matching," In Proc. of the International Conference on Image Information Processing, pp. 1-6, 2011. DOI: http://dx.doi.org/10.1109/ICIIP.2011.6108868
  10. N. Otsu, "A Threshold Selection Method from Gray-Level Histogram," IEEE Transactions on Systems, Man and Cybernetics, Vol. 9, No. 1, pp. 62-66, 1979. DOI: http://dx.doi.org/10.1109/TSMC.1979.4310076
  11. J. Song, M. Cai, and M. R. Lyu., "A Robust Statistic Method for Classifying Color Polarity of Video Text," In Proc. of the International Conference on Multimedia and Expo, Vol. 1, pp. 385-388, 2003.
  12. http://www.irislink.com