• 제목/요약/키워드: Multi Object Detection

검색결과 227건 처리시간 0.026초

다중스펙트럼을 이용한 횡단보도 보행자 검지에 관한 연구 (A study on the detection of pedestrians in crosswalks using multi-spectrum)

  • 김정훈;최두현;이종선;이동화
    • 한국산업정보학회논문지
    • /
    • 제27권1호
    • /
    • pp.11-18
    • /
    • 2022
  • 주간 및 야간의 보행자 감지를 위해서는 다중 스펙트럼 활용이 필수적이다. 본 논문에서는 교통사고의 위험성이 높은 교차로에서 횡단보도 근처의 보행자를 24시간 검출하기 위해 컬러 카메라 및 열화상 적외선 카메라를 사용하였다. 보행자 탐지를 위해서 YOLO v5 객체 검출기를 사용하였으며 컬러 이미지와 열화상 이미지를 동시에 사용하여 감지 성능을 향상 시켰다. 제안된 시스템은 실제 횡단보도 현장에서 확보한 주·야간 다중 스펙트럼(색상 및 열화상) 보행자 데이터 셋에서 Iou 0.5 기준 0.94 mAP의 높은 성능을 보였다.

Activity Object Detection Based on Improved Faster R-CNN

  • Zhang, Ning;Feng, Yiran;Lee, Eung-Joo
    • 한국멀티미디어학회논문지
    • /
    • 제24권3호
    • /
    • pp.416-422
    • /
    • 2021
  • Due to the large differences in human activity within classes, the large similarity between classes, and the problems of visual angle and occlusion, it is difficult to extract features manually, and the detection rate of human behavior is low. In order to better solve these problems, an improved Faster R-CNN-based detection algorithm is proposed in this paper. It achieves multi-object recognition and localization through a second-order detection network, and replaces the original feature extraction module with Dense-Net, which can fuse multi-level feature information, increase network depth and avoid disappearance of network gradients. Meanwhile, the proposal merging strategy is improved with Soft-NMS, where an attenuation function is designed to replace the conventional NMS algorithm, thereby avoiding missed detection of adjacent or overlapping objects, and enhancing the network detection accuracy under multiple objects. During the experiment, the improved Faster R-CNN method in this article has 84.7% target detection result, which is improved compared to other methods, which proves that the target recognition method has significant advantages and potential.

Oriented object detection in satellite images using convolutional neural network based on ResNeXt

  • Asep Haryono;Grafika Jati;Wisnu Jatmiko
    • ETRI Journal
    • /
    • 제46권2호
    • /
    • pp.307-322
    • /
    • 2024
  • Most object detection methods use a horizontal bounding box that causes problems between adjacent objects with arbitrary directions, resulting in misaligned detection. Hence, the horizontal anchor should be replaced by a rotating anchor to determine oriented bounding boxes. A two-stage process of delineating a horizontal bounding box and then converting it into an oriented bounding box is inefficient. To improve detection, a box-boundary-aware vector can be estimated based on a convolutional neural network. Specifically, we propose a ResNeXt101 encoder to overcome the weaknesses of the conventional ResNet, which is less effective as the network depth and complexity increase. Owing to the cardinality of using a homogeneous design and multi-branch architecture with few hyperparameters, ResNeXt captures better information than ResNet. Experimental results demonstrate more accurate and faster oriented object detection of our proposal compared with a baseline, achieving a mean average precision of 89.41% and inference rate of 23.67 fps.

3차원 객체 탐지를 위한 어텐션 기반 특징 융합 네트워크 (Attention based Feature-Fusion Network for 3D Object Detection)

  • 유상현;강대열;황승준;박성준;백중환
    • 한국항행학회논문지
    • /
    • 제27권2호
    • /
    • pp.190-196
    • /
    • 2023
  • 최근 들어, 라이다 기술의 발전에 따라 정확한 거리 측정이 가능해지면서 라이다 기반의 3차원 객체 탐지 네트워크에 대한 관심이 증가하고 있다. 기존의 네트워크는 복셀화 및 다운샘플링 과정에서 공간적인 정보 손실이 발생해 부정확한 위치 추정 결과를 발생시킨다. 본 연구에서는 고수준 특징과 높은 위치 정확도를 동시에 획득하기 위해 어텐션 기반 융합 방식과 카메라-라이다 융합 시스템을 제안한다. 먼저, 그리드 기반의 3차원 객체 탐지 네트워크인 Voxel-RCNN 구조에 어텐션 방식을 도입함으로써, 다중 스케일의 희소 3차원 합성곱 특징을 효과적으로 융합하여 3차원 객체 탐지의 성능을 높인다. 다음으로, 거짓 양성을 제거하기 위해 3차원 객체 탐지 네트워크의 탐지 결과와 이미지상의 2차원 객체 탐지 결과를 결합하는 카메라-라이다 융합 시스템을 제안한다. 제안 알고리즘의 성능평가를 위해 자율주행 분야의 KITTI 데이터 세트를 이용하여 기존 알고리즘과의 비교 실험을 수행한다. 결과적으로, 차량 클래스에 대해 BEV 상의 2차원 객체 탐지와 3차원 객체 탐지 부분에서 성능 향상을 보였으며 특히 Voxel-RCNN보다 차량 Moderate 클래스에 대하여 정확도가 약 0.47% 향상되었다.

차량 검출을 위한 다중객체추적 알고리즘 (Multi-Object Tracking Algorithm for Vehicle Detection)

  • 이근후;김규영;박홍민;박장식;김현태;유윤식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.816-819
    • /
    • 2011
  • 터널 내에서의 사고 유발 요소는 CCTV 카메라를 이용하여 검출하여 조기에 대응함으로써 차량의 정체뿐만 아니라 인적 물적 피해를 최소화하기 위하여 영상인식시스템이 도입되고 있다. 본 논문에서는 터널 내에서 여러 차량을 추적하는 알고리즘을 제안한다. 제안하는 알고리즘은 Adaboost 알고리즘을 이용하여 차량을 검출하고 검출된 차량(객체)에 대하여 템플릿 매칭 기법을 이용하여 차량을 추적한다. 컴퓨터 시뮬레이션을 통하여 제안하는 알고리즘이 여러 차량을 추적하는데 유용한 것을 확인 하였다.

  • PDF

다중 분기 트리와 ASSL을 결합한 오픈 셋 물체 검출 (Open set Object Detection combining Multi-branch Tree and ASSL)

  • 신동균;민하즈 우딘 아흐메드;김진우;이필규
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.171-177
    • /
    • 2018
  • 최근 많은 이미지 데이터 셋들은 일반적인 특성을 추출하기 위한 다양한 데이터 클래스와 특징을 가지고 있다. 하지만 이러한 다양한 데이터 클래스와 특징으로 인해 해당 데이터 셋으로 훈련된 물체 검출 딥러닝 모델은 데이터 특성이 다른 환경에서 좋은 성능을 내지 못하는 단점을 보인다. 이 논문에서는 하위 카테고리 기반 물체 검출 방법과 오픈셋 물체 검출 방법을 이용하여 이를 극복하고, 강인한 물체 검출 딥러닝 모델을 훈련하기 위해 능동 준지도 학습 (Active Semi-Supervised Learning)을 이용한 다중 분기 트리 구조를 제안한다. 우리는 이 구조를 이용함으로써 데이터 특성이 다른 환경에서 적응할 수 있는 모델을 가질 수 있고, 나아가 이 모델을 이용하여 이전의 모델보다 높은 성능을 확보 할 수 있다.

HOG 특징과 다중 프레임 연산을 이용한 보행자 탐지 (Pedestrian Detection using HOG Feature and Multi-Frame Operation)

  • 서창진;지홍일
    • 전기학회논문지P
    • /
    • 제64권3호
    • /
    • pp.193-198
    • /
    • 2015
  • A large number of vision applications rely on matching keypoints across images. Pedestrian detection is under constant pressure to increase both its quality and speed. Such progress allows for new application. A higher speed enables its inclusion into large systems with extensive subsequent processing, and its deployment in computationally constrained scenarios. In this paper, we focus on improving the speed of pedestrian detection using HOG(histogram of oriented gradient) and multi frame operation which is robust to illumination changes in cluttering images. The result of our simulation indicates that the detection rate and speed of the proposed method is much faster than that of conventional HOG and differential images.

다양한 화소기반 변화탐지 결과와 등록오차를 이용한 객체기반 변화탐지 (Object-based Change Detection using Various Pixel-based Change Detection Results and Registration Noise)

  • 정세정;김태헌;이원희;한유경
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.481-489
    • /
    • 2019
  • 다시기 위성 영상을 이용한 변화탐지 분석은 인간 활동의 변화를 직접 반영하는 지표이다. 변화탐지는 크게 화소 기반 변화탐지(PBCD: Pixel-Based Change Detection)와 객체 기반 변화탐지(OBCD: Object-Based Change Detection)로 구분한다. 화소 기반 변화탐지는 알고리즘이 간단하고 비교적 쉽게 정량적 분석이 가능해 전통적으로 많이 쓰여온 기법이나 고해상도 영상에서의 화소 기반 변화탐지는 오탐지나 노이즈(noise)가 발생하기 때문에 고해상도 영상에서의 활용도가 떨어진다. 또한, 고해상도 다시기 영상은 취득 당시 센서의 자세나 지형적 특성으로 인해 영상 등록(image registration)을 수행한 이후에도 지형적 불일치가 발생한다. 등록오차(registration noise)라고 불리는 이 지형 불일치는 고해상도 다시기 영상 활용을 위한 공간정보 추출 시 정확도를 떨어뜨리는 방해요인으로 작용한다. 이에 본 연구에서는 등록오차를 고려한 고해상도 영상의 객체 기반 변화탐지를 수행하였다. 이 때, 다양한 화소 기반 변화탐지 결과를 모두 고려한 객체 기반 변화탐지 결과를 도출하였으며 이 과정에서 분할 영상(segmentation image)과의 major voting을 적용하였다. 제안 기법과 화소 기반 변화탐지 결과, 그리고 화소 기반 변화탐지 결과를 객체 기반 변화탐지로 확장한 결과의 비교를 통해 제안 기법의 우수성을 평가하였다.

개인정보보호를 위한 다중 유형 객체 탐지 기반 비식별화 기법 (Multi-type object detection-based de-identification technique for personal information protection)

  • 길예슬;이효진;류정화;이일구
    • 융합보안논문지
    • /
    • 제22권5호
    • /
    • pp.11-20
    • /
    • 2022
  • 인터넷과 웹 기술이 모바일 장치 중심으로 발전하면서 이미지 데이터는 사람, 텍스트, 공간 등 다양한 유형의 민감정보를 담고 있다. 이러한 특성과 더불어 SNS 사용이 증가하면서 온라인 상의 개인정보가 노출되고 악용되는 피해 규모가 커지고 있다. 그러나 개인정보보호를 위한 다중 유형 객체 탐지 기반의 비식별화 기술에 관한 연구는 미흡한 상황이다. 이에 본 논문은 기존의 단일 유형 객체 탐지 모델을 병렬적으로 이용하여 다중 유형의 객체를 탐지 및 비식별화하는 인공지능 모델을 제안한다. Cutmix 기법을 통해 사람과 텍스트 객체가 함께 존재하는 이미지를 생성하여 학습 데이터로 구성하고, 사람과 텍스트라는 다른 특징을 가진 객체에 대한 탐지 및 비식별화를 수행하였다. 제안하는 모델은 두 가지 객체가 동시에 존재할 때 0.724의 precision과 0.745의 mAP@.5 를 달성한다. 또한, 비식별화 수행 후 전체 객체에 대해 mAP@.5 가 0.224로, 0.4 이상의 감소폭을 보였다.

AANet: Adjacency auxiliary network for salient object detection

  • Li, Xialu;Cui, Ziguan;Gan, Zongliang;Tang, Guijin;Liu, Feng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권10호
    • /
    • pp.3729-3749
    • /
    • 2021
  • At present, deep convolution network-based salient object detection (SOD) has achieved impressive performance. However, it is still a challenging problem to make full use of the multi-scale information of the extracted features and which appropriate feature fusion method is adopted to process feature mapping. In this paper, we propose a new adjacency auxiliary network (AANet) based on multi-scale feature fusion for SOD. Firstly, we design the parallel connection feature enhancement module (PFEM) for each layer of feature extraction, which improves the feature density by connecting different dilated convolution branches in parallel, and add channel attention flow to fully extract the context information of features. Then the adjacent layer features with close degree of abstraction but different characteristic properties are fused through the adjacent auxiliary module (AAM) to eliminate the ambiguity and noise of the features. Besides, in order to refine the features effectively to get more accurate object boundaries, we design adjacency decoder (AAM_D) based on adjacency auxiliary module (AAM), which concatenates the features of adjacent layers, extracts their spatial attention, and then combines them with the output of AAM. The outputs of AAM_D features with semantic information and spatial detail obtained from each feature are used as salient prediction maps for multi-level feature joint supervising. Experiment results on six benchmark SOD datasets demonstrate that the proposed method outperforms similar previous methods.