• Title/Summary/Keyword: Fast R-CNN

Search Result 24, Processing Time 0.031 seconds

금속 표면의 결함 검출을 위한 영역 기반 CNN 기법 비교 (Comparison of Region-based CNN Methods for Defects Detection on Metal Surface)

  • 이민기;서기성
    • 전기학회논문지
    • /
    • 제67권7호
    • /
    • pp.865-870
    • /
    • 2018
  • A machine vision based industrial inspection includes defects detection and classification. Fast inspection is a fundamental problem for many applications of real-time vision systems. It requires little computation time and localizing defects robustly with high accuracy. Deep learning technique have been known not to be suitable for real-time applications. Recently a couple of fast region-based CNN algorithms for object detection are introduced, such as Faster R-CNN, and YOLOv2. We apply these methods for an industrial inspection problem. Three CNN based detection algorithms, VOV based CNN, Faster R-CNN, and YOLOv2, are experimented for defect detection on metal surface. The results for inspection time and various performance indices are compared and analysed.

딥러닝 기반의 레일표면손상 평가 (Deep Learning-based Rail Surface Damage Evaluation)

  • 최정열;한재민;김정호
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.505-510
    • /
    • 2024
  • 철도 레일은 차륜과 레일의 접촉면인 레일 표면에서 구름 접촉 피로 균열이 상시 발생할 수 있는 조건이기 때문에 균열의 상태를 철저히 점검하고 절손을 방지하기 위한 정밀한 점검 및 진단이 필요하다. 최근 궤도 시설의 성능 평가에 대한 세부 지침에서는 궤도 성능평가를 위한 방법과 절차에 관한 필요사항을 제시하고 있다. 그러나 레일 표면 손상을 진단하고 등급을 산정하는 것은 주로 외관 조사(육안 조사)에 의존하며, 이는 점검자의 주관적인 판단에 따른 정성적인 평가에 의존할 수밖에 없는 실정이다. 따라서 본 연구에서는 Fast R-CNN을 사용하여 레일 표면 결함 검출에 대한 딥러닝 모델 연구를 수행하였다. 레일 표면 결함 이미지의 데이터 세트를 구축한 후, 모델을 테스트하였다. 딥러닝 모델의 성능평가 결과에서 mAP가 94.9%로 나타났다. Fast R-CNN의 균열 검출 효과가 높기 때문에 이 모델을 사용하면 레일표면 결함을 효율적으로 식별할 수 있을 것으로 판단된다.

적외선 카메라 영상에서의 마스크 R-CNN기반 발열객체검출 (Object Detection based on Mask R-CNN from Infrared Camera)

  • 송현철;강민식;김태은
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권6호
    • /
    • pp.1213-1218
    • /
    • 2018
  • 최근 비전분야에 소개된 Mask R-CNN은 객체 인스턴스 세분화를위한 개념적으로 간단하고 유연하며 일반적인 프레임 워크를 제시한다. 이 논문에서는 열적외선 카메라로부터 획득한 열감지영상에서 발열체인 인스턴스에 대해 발열부위의 세그멘테이션 마스크를 생성하는 동시에 이미지 내의 오브젝트 발열부분을 효율적으로 탐색하는 알고리즘을 제안한다. Mask R-CNN 기법은 바운딩 박스 인식을 위해 기존 브랜치와 병렬로 객체 마스크를 예측하기 위한 브랜치를 추가함으로써 Faster R-CNN을 확장한 알고리즘이다. Mask R-CNN은 훈련이 간단하고 빠르게 실행하는 고속 R-CNN에 추가된다. 더욱이, Mask R-CNN은 다른 작업으로 일반화하기 용이하다. 본 연구에서는 이 R-CNN기반 적외선 영상 검출알고리즘을 제안하여 RGB영상에서 구별할 수 없는 발열체를 탐지하였다. 실험결과 Mask R-CNN에서 변별하지 못하는 발열객체를 성공적으로 검출하였다.

Caltech 보행자 감지를 위한 Scale-aware Faster R-CNN (Scale-aware Faster R-CNN for Caltech Pedestrian Detection)

  • 바트후;주마벡;조근식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.506-509
    • /
    • 2016
  • We present real-time pedestrian detection that exploit accuracy of Faster R-CNN network. Faster R-CNN has shown to success at PASCAL VOC multi-object detection tasks, and their ability to operate on raw pixel input without the need to design special features is very engaging. Therefore, in this work we apply and adjust Faster R-CNN to single object detection, which is pedestrian detection. The drawback of Faster R-CNN is its failure when object size is small. Previously, small sized object problem was solved by Scale-aware Network. We incorporate Scale-aware Network to Faster R-CNN. This made our method Scale-aware Faster R-CNN (DF R-CNN) that is both fast and very accurate. We separated Faster R-CNN networks into two sub-network, that is one for large-size objects and another one for small-size objects. The resulting approach achieves a 28.3% average miss rate on the Caltech Pedestrian detection benchmark, which is competitive with the other best reported results.

인공 위성 사진 내 선박 탐지 정확도 향상을 위한 Watershed 알고리즘 기반 RoI 축소 기법 (Watershed Algorithm-Based RoI Reduction Techniques for Improving Ship Detection Accuracy in Satellite Imagery)

  • 이승재;윤지원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권8호
    • /
    • pp.311-318
    • /
    • 2021
  • 해상 안보, 국제 동향 파악 등 다양한 이유로 해상 사진에서 선박을 탐지하고자하는 연구는 지속되어 왔다. 인공지능의 발달로 인해 사진 및 영상 내 객체 탐지를 위한 R-CNN 모델이 등장하였고 객체탐지의 성능이 비약적으로 상승하였다. R-CNN 모델을 이용한 해상 사진에서의 선박 탐지는 인공위성 사진에도 적용되기 시작하였다. 하지만 인공위성 사진은 넓은 지역을 투사하기 때문에 선박 외에도 차량, 지형, 건물 등 다양한 객체들이 선박으로 인식되는 경우가 있다. 본 논문에서는 R-CNN계열 모델을 이용한 인공위성 사진에서의 선박 탐지의 성능을 개선하기 위한 새로운 방법론을 제안한다. 표지자 기반 watershed 알고리즘을 통해 육지와 바다를 분리하고 morphology 연산을 수행하여 RoI를 한 차례 더 특정한 뒤 특정된 RoI에 R-CNN 계열 모델을 사용하여 선박을 탐지하여 오탐을 줄인다. 해당 방법을 이용하여 Faster R-CNN을 사용하였을 경우, Faster R-CNN만을 사용했을 때에 비해 오탐률을 80% 줄일 수 있었다.

협업 계층을 적용한 합성곱 신경망 기반의 이미지 라벨 예측 알고리즘 (Image Label Prediction Algorithm based on Convolution Neural Network with Collaborative Layer)

  • 이현호;이원진
    • 한국멀티미디어학회논문지
    • /
    • 제23권6호
    • /
    • pp.756-764
    • /
    • 2020
  • A typical algorithm used for image analysis is the Convolutional Neural Network(CNN). R-CNN, Fast R-CNN, Faster R-CNN, etc. have been studied to improve the performance of the CNN, but they essentially require large amounts of data and high algorithmic complexity., making them inappropriate for small and medium-sized services. Therefore, in this paper, the image label prediction algorithm based on CNN with collaborative layer with low complexity, high accuracy, and small amount of data was proposed. The proposed algorithm was designed to replace the part of the neural network that is performed to predict the final label in the existing deep learning algorithm by implementing collaborative filtering as a layer. It is expected that the proposed algorithm can contribute greatly to small and medium-sized content services that is unsuitable to apply the existing deep learning algorithm with high complexity and high server cost.

Deep Learning Study of the 21cm Differential Brightness Temperature During the Epoch of Reionization

  • Kwon, Yungi;Hong, Sungwook E.
    • 천문학회보
    • /
    • 제45권1호
    • /
    • pp.66.2-66.2
    • /
    • 2020
  • We propose a deep learning analysis technique with a convolutional neural network (CNN) to predict the evolutionary track of the Epoch of Reionization (EoR) from the 21-cm differential brightness temperature tomography images. We use 21cmFAST, a fast semi-numerical cosmological 21-cm signal simulator, to produce mock 21-cm maps between z = 6 ~ 13. We then apply two observational effects, such as instrumental noise and limit of (spatial and depth) resolution somewhat suitable for realistic choices of the Square Kilometre Array (SKA), into the 21-cm maps. We design our deep learning model with CNN to predict the sliced-averaged neutral hydrogen fraction from the given 21-cm map. The estimated neutral fraction from our CNN model has great agreement with the true value even after coarsely smoothing with broad beam size and frequency bandwidth and heavily covered by noise with narrow beam size and frequency bandwidth. Our results show that the deep learning analyzing method has the potential to reconstruct the EoR history efficiently from the 21-cm tomography surveys in future.

  • PDF

Faster R-CNN 기반의 실시간 번호판 검출 (Real-Time License Plate Detection Based on Faster R-CNN)

  • 이동석;윤숙;이재환;박동선
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.511-520
    • /
    • 2016
  • 자동차 번호판 검출 자동화(ALPD: Automatic License Plate Detection) 시스템은 효율적인 교통 관제를 위한 핵심 기술이며, 통행료 지불 시스템, 주차장 및 교통 관리와 같은 많은 응용에 사용되어 업무의 효율을 높이고 있다. 최근까지의 ALPD에 관한 연구에서는 주로 영상처리를 위해 설계된 기존의 특징들을 추출하여 번호판 검출에 사용해왔다. 이러한 종래의 방법은 속도에 이점은 있으나, 다양한 환경 변화에 따른 성능 저하를 보였다. 본 논문에서는 전반적인 성능을 향상시키기 위하여 Faster R-CNN과 CNN으로 구성되는 두 단 구조를 활용하는 방법을 제안한다. 이를 통해 동작 속도를 향상시키고, 다양한 환경변화에 강인하도록 구성하였다. 첫 번째 단계에서는 Faster R-CNN을 적용하여 번호판 영역 후보영역들을 선별하며, 두 번째 단에서 CNN을 활용하여 후보영역들 중에서 False Positives를 제거함으로써 검출률을 향상시켰다. 이를 통해 ZFNet을 기반으로 하여 99.94%의 검출률을 달성하였다. 또한 평균 운용시간은 80ms/image로써 빠르고 강인한 실시간 번호판 검출 시스템을 구현할 수 있었다.

Road Damage Detection and Classification based on Multi-level Feature Pyramids

  • Yin, Junru;Qu, Jiantao;Huang, Wei;Chen, Qiqiang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권2호
    • /
    • pp.786-799
    • /
    • 2021
  • Road damage detection is important for road maintenance. With the development of deep learning, more and more road damage detection methods have been proposed, such as Fast R-CNN, Faster R-CNN, Mask R-CNN and RetinaNet. However, because shallow and deep layers cannot be extracted at the same time, the existing methods do not perform well in detecting objects with fewer samples. In addition, these methods cannot obtain a highly accurate detecting bounding box. This paper presents a Multi-level Feature Pyramids method based on M2det. Because the feature layer has multi-scale and multi-level architecture, the feature layer containing more information and obvious features can be extracted. Moreover, an attention mechanism is used to improve the accuracy of local boundary boxes in the dataset. Experimental results show that the proposed method is better than the current state-of-the-art methods.

비주얼 서보잉을 위한 딥러닝 기반 물체 인식 및 자세 추정 (Object Recognition and Pose Estimation Based on Deep Learning for Visual Servoing)

  • 조재민;강상승;김계경
    • 로봇학회논문지
    • /
    • 제14권1호
    • /
    • pp.1-7
    • /
    • 2019
  • Recently, smart factories have attracted much attention as a result of the 4th Industrial Revolution. Existing factory automation technologies are generally designed for simple repetition without using vision sensors. Even small object assemblies are still dependent on manual work. To satisfy the needs for replacing the existing system with new technology such as bin picking and visual servoing, precision and real-time application should be core. Therefore in our work we focused on the core elements by using deep learning algorithm to detect and classify the target object for real-time and analyzing the object features. We chose YOLO CNN which is capable of real-time working and combining the two tasks as mentioned above though there are lots of good deep learning algorithms such as Mask R-CNN and Fast R-CNN. Then through the line and inside features extracted from target object, we can obtain final outline and estimate object posture.