• 제목/요약/키워드: Saliency Map

검색결과 101건 처리시간 0.021초

스테레오 영상 기반의 객체 탐지 및 객체의 3차원 위치 추정 (Object Detection and 3D Position Estimation based on Stereo Vision)

  • 손행선;이선영;민경원;서성진
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권4호
    • /
    • pp.318-324
    • /
    • 2017
  • 본 항공기에 스테레오 카메라를 장착하여 영상 기반의 비행 객체 탐지 및 탐지된 객체의 3차원 위치를 추정하는 방법을 제시하였다. 구름 사이에 존재할 수 있는 원거리의 작은 객체를 탐지하기 위한 방법으로 PCT 기반의 Saliency Map을 생성하여 이용하였으며, 이렇게 탐지된 객체는 좌우 스테레오 영상에서 매칭을 수행하여 스테레오 시차(Disparity)를 추출하였다. 정확한 Disparity를 추출하기 위하여 비용집적(Cost Aggregation) 영역을 탐지 객체에 맞추어 가변되도록 가변 영역으로 사용하였으며, 본 논문에서는 Saliency Map에서 객체의 존재 영역으로 검출된 결과를 사용하였다. 좀 더 정밀한 Disparity를 추출하기 위하여 Sub-pixel interpolation 기법을 사용하여 Sub-pixel 레벨의 실수형 Disparity를 추출하였다. 또한 이에 카메라 파라미터를 적용하여 실제 탐지된 비행 객체의 3차원 공간 좌표를 생성하여 객체의 공간위치를 추정하는 방법을 제시하였다. 이는 향후 자율비행체의 영상기반 객체 탐지 및 충돌방지 시스템에 활용될 수 있을 것으로 기대된다.

다중 객체가 존재하는 ERP 영상에서 행동 인식 모델 성능 향상을 위한 전처리 기법 (Preprocessing Technique for Improving Action Recognition Performance in ERP Video with Multiple Objects)

  • 박은수;김승환;류은석
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.374-385
    • /
    • 2020
  • 본 논문에서 Equirectangular Projection(ERP) 영상으로 행동 인식을 할 때의 문제점들을 해결할 수 있는 전처리 기법을 제안한다. 본 논문에서 제안하는 전처리 기법은 사람 객체를 행동의 주체 즉, Object of Interest(OOI)로 가정하고, OOI의 주변 영역을 ROI로 가정한다. 전처리 기법은 3개의 모듈로 이루어져 있다. I) 객체 인식 모델로 영상 내 사람 객체를 인식한다. II) 입력 영상에서 saliency map을 생성한다. III) 인식된 사람 객체와 saliency map을 이용하여 행동의 주체를 선정한다. 이후 행동 인식 모델에 선정된 행동의 주체 boundary box를 입력하여 행동 인식 성능을 높인다. 제안하는 전처리기법을 사용한 데이터를 행동 인식 모델에 입력한 방법의 성능과 원본 ERP 영상을 입력한 방법의 성능을 비교하였을 때 최대 99.6%의 성능 향상을 보이며, OOI가 감지되는 프레임만을 추출하였을 때 행동 관련 영상 요약의 효과도 볼 수 있다.

웨이블릿 부밴드의 상호 정보량을 이용한 세일리언시 검출 (Saliency Detection using Mutual Information of Wavelet Subbands)

  • 문상환;이호상;문용호;엄일규
    • 전자공학회논문지
    • /
    • 제54권6호
    • /
    • pp.72-79
    • /
    • 2017
  • 본 논문에서는 웨이블릿 부밴드의 상호 정보량을 이용한 새로운 세일리언시 검출 방법을 제시한다. 본 논문의 방법은 웨이블릿 고주파 계수에 대한 승수와 가우시안 블러링을 이용하여 중간 세일리언시 지도를 형성한다. 웨이블릿 방향에 따른 세 개의 중간 세일리언시 지도를 방향별로 결합한 후 최소 엔트로피를 가지는 주 방향성 성분을 찾는다. 최소 엔트로피를 가지는 부밴드를 중심으로 각 부밴드의 상호 정보량을 구하고, 이를 이용한 가중치를 계산하고, Minkowski 합을 이용하여 최종 세일리언시를 검출한다. CAT2000 및 ECSSD 데이터베이스 대한 실험 결과, 본 논문의 방법은 기존 방법과 비교하여 적은 계산시간으로 ROC 및 AUC 관점에서 우수한 검출 결과를 보였다.

깊이맵 생성 알고리즘의 합성곱 신경망 구현 (Implementing a Depth Map Generation Algorithm by Convolutional Neural Network)

  • 이승수;김홍진;김만배
    • 방송공학회논문지
    • /
    • 제23권1호
    • /
    • pp.3-10
    • /
    • 2018
  • 깊이맵은 현재 다양한 분야에서 활용되고 있다. 이러한 깊이맵을 인공 신경망으로 생성하는 연구가 최근 관심을 받고 있다. 본 논문에서는 기존의 기 제작된 깊이맵 생성 알고리즘을 합성곱 신경망으로 구현할 수 있는지에 대한 타당성을 검증한다. 먼저 깊이맵은 관심맵과 운동 히스토리 영상의 가중치 합으로 얻는다. 실험영상과 깊이맵을 합성곱 신경망의 입력과 출력으로 하여, 신경망을 학습시킨다. 정성적, 정량적 실험 결과는 제안한 합성곱 신경망이 깊이맵 생성 방법을 대체할 수 있다는 것을 보여준다.

Bottle Label Segmentation Based on Multiple Gradient Information

  • Chen, Yanjuan;Park, Sang-Cheol;Na, In-Seop;Kim, Soo-Hyung;Lee, Myung-Eun
    • International Journal of Contents
    • /
    • 제7권4호
    • /
    • pp.24-29
    • /
    • 2011
  • In this paper, we propose a method to segment the bottle label in images taken by mobile phones using multi-gradient approaches. In order to segment the label region of interest-object, the saliency map method and Hough Transformation method are first applied to the original images to obtain the candidate region. The saliency map is used to detect the most salient area based on three kinds of features (color, orientation and illumination features). The Hough Transformation is a technique to isolated features of a particular shape within an image. Therefore, we utilize it to find the left and right border of the bottle. Next, we segment the label based on the gradient information obtained from the structure tensor method and edge method. The experimental results have shown that the proposed method is able to accurately segment the labels as the first step of product label recognition system.

차폐영역 정보와 그리드 메쉬 기반의 영상 워핑을 이용한 다시점 영상 생성 (Multi-view Image Generation using Grid-mesh based Image Domain Warping and Occlusion Region Information)

  • 임종명;엄기문;신홍창;이광순;허남호;유지상
    • 방송공학회논문지
    • /
    • 제18권6호
    • /
    • pp.859-871
    • /
    • 2013
  • 본 논문에서는 스테레오 영상에서 얻은 다양한 특징들과 차폐영역에 대한 정보들을 활용하여 그리드 메쉬(grid-mesh) 기반의 영상워핑 기법을 통해 다시점 영상을 생성하는 방법을 제안한다. 제안된 기법에서는 먼저 주어진 스테레오 영상에서 영상 특징 지도(image saliency map), 직선 성분(line segments) 그리고 변이 특징 지도(disparity saliency map)를 추출하고, 추출된 특징들에 대하여 품질을 향상시키는 과정을 거친다. 이 과정은 두 가지 단계로 나뉘는데, 먼저 차폐영역에 대한 정보를 활용하여 객체의 경계 부근에서 추출된 변이 특징 지도의 신뢰도를 향상시킨다. 다음으로 스테레오 영상에서의 시간적 일관성(temporal consistency)에 대한 정보를 활용하여 추출된 영상 특징들의 시간적 일관성을 높인다. 이렇게 품질이 향상된 특징 성분들을 활용하여 그리드 메쉬 기반의 영상 워핑 기법을 통해 다시점 영상을 생성한다. 실험 결과를 통해 제안된 기법으로 생성한 다시점 영상의 주관적 화질 측면에서 기존의 다시점 영상 생성 기법들보다 우수한 것을 확인할 수 있었다.

A Saliency-Based Focusing Region Selection Method for Robust Auto-Focusing

  • Jeon, Jaehwan;Cho, Changhun;Paik, Joonki
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제1권3호
    • /
    • pp.133-142
    • /
    • 2012
  • This paper presents a salient region detection algorithm for auto-focusing based on the characteristics of a human's visual attention. To describe the saliency at the local, regional, and global levels, this paper proposes a set of novel features including multi-scale local contrast, variance, center-surround entropy, and closeness to the center. Those features are then prioritized to produce a saliency map. The major advantage of the proposed approach is twofold; i) robustness to changes in focus and ii) low computational complexity. The experimental results showed that the proposed method outperforms the existing low-level feature-based methods in the sense of both robustness and accuracy for auto-focusing.

  • PDF

인체의 상향식 선택적 주의 집중 시각 기능을 모방한 능동 스테레오 감시 시스템의 개발 (Development of Active Stereo Surveillance System with the Human-like Visual Selective Attention)

  • 정범수;이민호
    • 센서학회지
    • /
    • 제13권2호
    • /
    • pp.144-151
    • /
    • 2004
  • In this paper, we propose an active stereo surveillance system with human-like convergence function. The proposed system uses a bottom-up saliency map model with the human-like selective attention visual function to select an interesting region in each camera. and this system compares the landmarks whether the selective region in each camera finds a same region. If the left and right cameras successfully find a same landmarks, the implemented vision system focuses on the landmark. Using the motor encoder information, we can automatically obtain the depth information and resultantly construct a depth map using the depth information. Computer simulation and experimental results show that the proposed convergence method is very effective to implement the active stereo surveillance system.

Building Change Detection Using Deep Learning for Remote Sensing Images

  • Wang, Chang;Han, Shijing;Zhang, Wen;Miao, Shufeng
    • Journal of Information Processing Systems
    • /
    • 제18권4호
    • /
    • pp.587-598
    • /
    • 2022
  • To increase building change recognition accuracy, we present a deep learning-based building change detection using remote sensing images. In the proposed approach, by merging pixel-level and object-level information of multitemporal remote sensing images, we create the difference image (DI), and the frequency-domain significance technique is used to generate the DI saliency map. The fuzzy C-means clustering technique pre-classifies the coarse change detection map by defining the DI saliency map threshold. We then extract the neighborhood features of the unchanged pixels and the changed (buildings) from pixel-level and object-level feature images, which are then used as valid deep neural network (DNN) training samples. The trained DNNs are then utilized to identify changes in DI. The suggested strategy was evaluated and compared to current detection methods using two datasets. The results suggest that our proposed technique can detect more building change information and improve change detection accuracy.

이동로봇의 물체인식을 위한 질의 기반 시각 집중 알고리즘 (Query-based Visual Attention Algorithm for Object Recognition of A Mobile Robot)

  • 류광근;이상훈;서일홍
    • 전자공학회논문지SC
    • /
    • 제44권1호
    • /
    • pp.50-58
    • /
    • 2007
  • 본 논문에서는 로봇이 태스크와 관련된 부분에 시각 집중을 하도록 하기 위해서 기존의 상향식 주목 알고리즘을 확장한 질의 기반 시각 집중 알고리즘을 제안한다. 질의 기반 시각 집중 알고리즘은 로봇이 수행 할 태스크와 관련한 물체를 질의하면 그 물체의 속성을 분석하여 여러 종류의 도드라짐(Conspicuity) 영상 지도에 적용될 가중치 값을 작성한다. 그리고 가중치를 이용하여 도드라짐 영상 지도를을 합성한 Saliency 영상 지도를 작성하여 기존의 주목 알고리즘과 비교 평가를 수행하였다. 여기서는 일예로서 질의 물체의 속성을 색으로 사용하였다.