초록
본 논문은 자연이미지에 포함된 텍스트 영역을 찾기 위한 방법으로서 기존에 제안한 색 분산 특징을 이용한 방법에서 분산이 제대로 추출되지 않는 문자 획들에 대한 복원 방법을 제안한다. 이전의 색 분산 특징을 이용한 추출방법에서는 고정된 크기의 수평 및 수직 분간 추출 윈도우를 사용함으로서 문자 획이 두껍거나 긴 경우에는 색 분산이 제대로 추출되지 않는 단점이 있었다. 따라서 본 논문에서는 미 추출된 색 분산을 연결요소 외곽사각형의 기하학적인 정보와 경험적인(Heuristic) 지식을 함께 이용하여 복원하는 방법을 제안한다. 제안한 방법은 다양한 종류의 디지털 카메라와 휴대폰 카메라를 이용해서 취득한 문서 유형의 이미지와 간판, 거리 표지판 등의 자연이미지를 사용하여 테스트 하였으며, 특히 큰 글자를 포함하는 자연이미지에 대해서도 텍스트 추출의 정확성이 향상된 것을 확인할 수 있었다.
This paper proposes a variance recovery method for character strokes that can be missed in applying the previously proposed color variance approach in text detection of natural scene images. The previous method has a shortcoming of missing the color variance due to the fixed length of horizontal and vertical windows of variance detection when the character strokes are thick or long. Thus, this paper proposes a variance recovery method by using geometric information of bounding boxes of connected components and heuristic knowledge. We have tested the proposed method using various kinds of document-style and natural scene images such as billboards, signboards, etc captured by digital cameras and mobile-phone cameras. And we showed the improved text detection accuracy even in the images of containing large characters.