Weighted N-Gram Indexing for Image Search Engine

영상검색엔진을 위한 가중치 N-Gram색인 방법

  • 이상열 (대구대학교 컴퓨터정보공학과) ;
  • 정성호 (포항1대학 컴퓨터정보처) ;
  • 황병곤 (대구대학교 컴퓨터정보공학과)
  • Published : 2002.11.01

Abstract

멀티미디어 검색 시스템들은 아직까지 내용 기반에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

Keywords