Abstract
In this paper, we propose a new salient region detection method in an image. The algorithm is based on the characteristics of human's bottom-up visual attention. Several features known to influence human visual attention like color, intensity and etc. are extracted from the each regions of an image. These features are then converted to importance values for each region using its local competition function and are combined to produce a saliency map, which represents the saliency at every location in the image by a scalar quantity, and guides the selection of attended locations, based on the spatial distribution of saliency region of the image in relation to its Perceptual importance. Results shown indicate that the calculated Saliency Maps correlate well with human perception of visually important regions.
본 논문에서는 영상 입력 장치로 입력되는 영상 내의 수많은 정보 중에서 지각적으로 중요하다고 여겨지는 현저한(salient) 영역만을 탐지해내는 새로운 방법을 제안한다. 제안하는 방법은 인간이 가지고 있는 시각적 주의 기능에 기본 바탕을 두고 있으며, 영상을 구성하고 있는 정보의 특징에 기반을 두고 있다. 가장 먼저 인간의 시각적 주의 기능에 영향을 미친다고 알려져 있는 몇 가지 특징들이 입력되는 영상의 모든 영역에 걸쳐 추출되어 각각의 특징에 해당되는 특징지도들로 형성된다. 이렇게 형성된 각각의 특징지도들을 구성하고 있는 특징 값들은 이들 각각의 국부적인 경쟁력 특성에 의하여 영상의 각 영역에서의 중요도를 나타내는 값으로 변환되어 중요도지도를 형성하게 된다. 이러한 중요도지도들은 모두 통합되어 하나의 현저함지도를 생성하게 된다. 현저함지도는 영상 내 각 장소의 현저함 정도를 미리 계산된 특징들의 공간적 중요도 측정치에 따른 스칼라 값으로 표시함으로써 영상 내에서 가장 현저한 영역을 찾을 수 있도록 가이드 한다. 제안하는 방법에 의해 시스템을 구성하여 실험한 결과, 인간이 중요하다고 여겨지는 주요 영역을 만족스럽게 탐지해 냄을 알 수 있었다.