DOI QR코드

DOI QR Code

색 분산 특징을 이용한 텍스트 추출에서의 손실된 분산 복원

Variance Recovery in Text Detection using Color Variance Feature

  • 최영우 (숙명여자대학교 컴퓨터과학과) ;
  • 조은숙 (숙명여자대학교 컴퓨터과학과)
  • 발행 : 2009.10.31

초록

본 논문은 자연이미지에 포함된 텍스트 영역을 찾기 위한 방법으로서 기존에 제안한 색 분산 특징을 이용한 방법에서 분산이 제대로 추출되지 않는 문자 획들에 대한 복원 방법을 제안한다. 이전의 색 분산 특징을 이용한 추출방법에서는 고정된 크기의 수평 및 수직 분간 추출 윈도우를 사용함으로서 문자 획이 두껍거나 긴 경우에는 색 분산이 제대로 추출되지 않는 단점이 있었다. 따라서 본 논문에서는 미 추출된 색 분산을 연결요소 외곽사각형의 기하학적인 정보와 경험적인(Heuristic) 지식을 함께 이용하여 복원하는 방법을 제안한다. 제안한 방법은 다양한 종류의 디지털 카메라와 휴대폰 카메라를 이용해서 취득한 문서 유형의 이미지와 간판, 거리 표지판 등의 자연이미지를 사용하여 테스트 하였으며, 특히 큰 글자를 포함하는 자연이미지에 대해서도 텍스트 추출의 정확성이 향상된 것을 확인할 수 있었다.

This paper proposes a variance recovery method for character strokes that can be missed in applying the previously proposed color variance approach in text detection of natural scene images. The previous method has a shortcoming of missing the color variance due to the fixed length of horizontal and vertical windows of variance detection when the character strokes are thick or long. Thus, this paper proposes a variance recovery method by using geometric information of bounding boxes of connected components and heuristic knowledge. We have tested the proposed method using various kinds of document-style and natural scene images such as billboards, signboards, etc captured by digital cameras and mobile-phone cameras. And we showed the improved text detection accuracy even in the images of containing large characters.

키워드

참고문헌

  1. S. M. Lucas, A Panaretos, L. Sosa, A Tang, S. Wong and R. Young, "ICDAR 2003 Robust Reading Competition," International Conference on Document Analysis and Recognition(ICDAR), Vol. 2, pp. 682-687, August 2003.
  2. S. M. Lucas, "ICDAR 2005 Text Locating Competition Results," Proceeding of International Conference on Document Analysis and Recognition, Vol. 1. pp. 80-84, August 2005.
  3. J. Ohya, A. Shio. S. Akamatsu, "Recognizing Characters in Scene images," IEEE Transactions Pattern Analysis and Machine Intelligence, PAMI-16(2), pp. 67-82, February 1994.
  4. Anil K. Jain, Bin Yu, "Automatic Text Location in Images and Video Frames," Pattern Recognition, Vol. 31. No. 12, pp. 2055-2076, December 1998. https://doi.org/10.1016/S0031-3203(98)00067-3
  5. N. Ezaki. M. Bulacu and L. Schomaker, "Text Detection from Natural Scene Images: Towards a System for Visually Impaired Persons," Proceedings of 17th International Conference on Pattern Recognition, Vol. II, pp. 683-686, August 2004.
  6. Premnath Dubey, "Edge Based Text Detection for Multi-purpose Application," The 8th International Conference on Signal Processing, Volume 4, pp. 16-20, June 2006.
  7. 박종천, 황동국, 이우람, 전병민, "문지-에지 맵의 패턴 히스토그램을 이용한 자연이미지에서 텍스트 영역 추출", 한국산학기술학회논문지 제 7권 제 6호, 1167-1174쪽. 2006년 12윌.
  8. Zongyi Liu, Sudeep Sarkar. "Robust outdoor text detection using text intensity and shape features," 19th International Conference on Pattern Recognition, pp. 1-4, December 2008.
  9. Y. Zhong, K. Karu and A K. Jain, "Locating Text in Complex Color Images," Pattern Recognition. Vol. 28. No. 10, pp. 1523-1535, October 1995, https://doi.org/10.1016/0031-3203(95)00030-4
  10. Hao Wang, "Automatic Character Location and Segmentation in Color Scene Images," Proceedings of International Conference on Image Analysis and Processing, pp. 2-7, September 2001.
  11. 배경숙, 장대근, 정연구, 소정, "색기반 이진화를 이용한 장면 텍스트 추출과 써포트 벡터머신을 이용한 텍스트 영역 검증." 영상처리 및 이해에 관한 워크숍 발표 논문집, 368-373쪽, 2005년 1월,
  12. 김지수, 김수형, 한숭완, 남택용, 손화정, 오성열, "색상 레이어를 이용한 스팸메일 영상에서의 텍스트 영역 추출", 한국정보처리학회논문지B, 제 13권, 제 4호, 409-416쪽, 2006년.8월.
  13. 송영자, 최영우, "카메라 획득 영상에서의 색 분산 및 개선된 K-means 색 병합을 이용한 텍스트 영역 추출 및 이진화," 한국정보처리학회논문지B 제 13-B권 제 3호, 205-214쪽,2006년 6월.
  14. Toan N. Dinh..Ionghvun Park, Gueesang Lee, "Korean Text Detection and Binarization in Color Signboards," IEEE International. Conference on Advanced Language Processing and Web Information Technology, pp. 235-240, July 2008.
  15. Rafael C, Gonzalez and Richard E, Woods, Digital Image Processing, Addison Wesley. 1993.
  16. D. H. Ballard and C, M. Brown, "Computer Vision," Prentice-Hall, 1982,