Word Spotting Algorithms Using SIFT in Document Images

SIFT를 이용한 문서 영상에서의 단어 검색 알고리즘

  • Lee, Duk-Ryong (Division of Computer Science and Engineering, Chonbuk National University) ;
  • Jeon, Hyo-Jong (Division of Computer Science and Engineering, Chonbuk National University) ;
  • Oh, Il-Seok (Division of Computer Science and Engineering, Chonbuk National University)
  • 이득용 (전북대학교 컴퓨터공학부) ;
  • 전효종 (전북대학교 컴퓨터공학부) ;
  • 오일석 (전북대학교 컴퓨터공학부)
  • Published : 2011.06.29

Abstract

본 논문에서는 문서 영상에서 글자 분할 및 인식이 필요 없는 단어 검색 알고리즘을 제안한다. 글자 분할을 하지 않고 검색하기 위해 영상 검색에 사용되는 SIFT특징을 이용하였다. 제안하는 알고리즘은 사용자가 입력한 질의어를 질의 영상으로 변환하고, 질의 영상에서 SIFT특징을 추출한다. 추출된 특징은 문서영상에서 추출한 특징과 매칭을 통해 매칭점 쌍을 생성한다. 생성된 매칭점 쌍들을 군집화 조건에 따라 군집화 한다. 군집화는 질의 영상과 지리적 분포가 유사하게 군집화 되도록 설계되었다. 생성된 군집은 군집에 포함된 특징점의 개수가 많을수록 질의 영상과 유사하다. 따라서 N개 이상의 원소를 가지는 군집을 결과로 출력한다. 실험한 결과 제안하는 알고리즘의 가능성을 확인할 수 있었다.

Keywords