Abstract
With the popularization of the mobile phone with a built-in camera, there are a lot of effort to provide useful information to users by detecting and recognizing the text in the video which is captured by the camera in mobile phone, and there is a need to detect the text regions in such mobile phone video. In this paper, we propose a method to detect the text regions in the mobile phone video. We employ morphological operation as a preprocessing and obtain binarized image using modified k-means clustering. After that, candidate text regions are obtained by applying connected component analysis and general text characteristic analysis. In addition, we increase the precision of the text detection by examining the frequency of the candidate regions. Experimental results show that the proposed method detects the text regions in the mobile phone video with high precision and recall.
최근 카메라가 탑재된 휴대전화가 널리 보급되면서 휴대전화로 촬영한 동영상에서 문자영역을 검출하고 인식하여 사용자에게 유용한 정보를 제공하는 기능에 대한 연구가 활발히 이루어지고 있다. 따라서 휴대전화로 촬영된 동영상에서 문자 영역을 검출하기 위한 방법이 필요하다. 이를 위해 형태학적 연산을 이용하여 전처리를 수행한 다음, 전처리를 수행한 영상에 대해 변형된 k-means 군집화를 이용하여 이진영상을 얻어낸 후, 연결 요소 (Connected component) 분석 및 문자 특성을 이용한 방법들을 적용하여 문자후보 영역을 검출하고, 일정 시간 내 문자 후보 영역의 검출 빈도를 조사하여 문자 영역 검출의 정확도를 높이는 방법을 제안한다. 휴대전화 동영상을 대상으로 한 실험 결과를 통해 제안하는 방법은 정확도와 회수율이 모두 뛰어난 효과적인 문자 영역 검출 방법임을 확인할 수 있다.