카메라 문서 영상의 이진화 및 기울어짐 보정 방법

A Method for Thresholding and Correction of Skew in Camera Document Images

  • 발행 : 2005.07.10

초록

카메라 영상은 조명에 매우 민감하다. 그 결과 문자 인식을 매우 어렵게 만든다. 또한 카메라로 획득한 문서 영상을 대상으로 문자인식을 수행할 경우 비네팅현상이 발생하며 카메라와 피사체간의 위치와 각도의 불일치에 의해 기학적 왜곡이 발생한다. 비네팅 효과에 의한 문자분리의 어려움과 기하학적 왜곡으로 인한 문자모양의 변형으로 인해 실제로 사용이 가능한 카메라 문자인식 기술의 개발이 쉽지 않았다. 본 논문에서는 양선형 변환을 이용하여 카메라로 획득한 문서영상의 기하학적 왜곡을 보정함으로써 문자인식 성능을 향상시킬 수 있는 방법을 제안한다. 기존에는 카메라의 위치정보 없이 기하하적 왜곡을 보정하기 어려웠으나 제안한 방법은 이진화한 문서영상을 대상으로 문자와 문자줄을 추출하여 상하로는 문자줄의 배열방향을, 좌우로는 문자획의 기울어진 각도를 측정함으로써 문서영상 자체만으로 기하하적 왜곡보정이 가능하다.

Camera image is very sensitive to illumination that result in difficulties for recognizing character. Also Camera captured document images have not only skew but also vignetting effect and geometric distortion. Vignetting effect make it difficult to separate characters from the document images. Geometric distortion, occurred by the mismatch of angle and center position between the document image and the camera, make the shape of characters to be distorted, so that the character recognition is more difficult than the case of using scanner. In this paper, we propose a method that can increase the performance of character recognition by correcting the geometric distortion of document images using a linear approximation which changes the quadrilateral region to the rectangle one. The proposed method also determine the quadrilateral transform region automatically, using the alignment of character lines and the skewed angles of characters located in the edges of each character line. Proposed method, therefore, can correct the geometric distortion without getting positional information from camera.

키워드