• 제목/요약/키워드: YOLO v3

검색결과 49건 처리시간 0.027초

고밀도 그리드 모델과 앵커모델을 이용한 동적 객체검지 향상에 관한 연구 (A Study on Improvement of Dynamic Object Detection using Dense Grid Model and Anchor Model)

  • 윤보른;이선우;최경호;이상민;권장우
    • 한국ITS학회 논문지
    • /
    • 제17권3호
    • /
    • pp.98-110
    • /
    • 2018
  • 본 논문은, 동적인 객체의 인식률 향상을 위해 고밀도 그리드 모델과 앵커 모델을 제안하였다. 두 가지 실험은 수행하여 제안하는 CNN 모델들을 제안하였다. 첫 번째 실험에 있어서, YOLO-v2모델을 KITTI 데이터 셋에 적용시켜 보았고, 고밀도 그리드 모델과 앵커 모델을 기존 YOLO-v2와 비교하였다. 실험에 있어서, 본 논문에서 제안하는 두 가지 모델은 기존의 YOLO-v2모델에 비하여 '어려움' 난이도의 자동차 검지에 있어서 6.26%에서 10.99%까지 우수한 성능을 나타낸 것을 확인하였다. 두 번째 실험에 있어서는 새로운 데이터 셋을 학습하였고, 두 가지 모델은 기존의 YOLO-v2모델보다 22.4%까지 '어려움' 난이도의 자동차 인식률 향상이 있음을 확인할 수 있었다.

가상 데이터를 활용한 번호판 문자 인식 및 차종 인식 시스템 제안 (Proposal for License Plate Recognition Using Synthetic Data and Vehicle Type Recognition System)

  • 이승주;박구만
    • 방송공학회논문지
    • /
    • 제25권5호
    • /
    • pp.776-788
    • /
    • 2020
  • 본 논문에서는 딥러닝을 이용한 차종 인식과 자동차 번호판 문자 인식 시스템을 제안한다. 기존 시스템에서는 영상처리를 통한 번호판 영역 추출과 DNN을 이용한 문자 인식 방법을 사용하였다. 이러한 시스템은 환경이 변화되면 인식률이 하락되는 문제가 있다. 따라서, 제안하는 시스템은 실시간 검출과 환경 변화에 따른 정확도 하락에 초점을 맞춰 1-stage 객체 검출 방법인 YOLO v3를 사용하였으며, RGB 카메라 한 대로 실시간 차종 및 번호판 문자 인식이 가능하다. 학습데이터는 차종 인식과 자동차 번호판 영역 검출의 경우 실제 데이터를 사용하며, 자동차 번호판 문자 인식의 경우 가상 데이터만을 사용하였다. 각 모듈별 정확도는 차종 검출은 96.39%, 번호판 검출은 99.94%, 번호판 검출은 79.06%를 기록하였다. 이외에도 YOLO v3의 경량화 네트워크인 YOLO v3 tiny를 이용하여 정확도를 측정하였다.

딥러닝 기반 제조 공장 내 AGV 객체 인식에 대한 연구 (Object Detection of AGV in Manufacturing Plants using Deep Learning)

  • 이길원;이활리;정희운
    • 한국정보통신학회논문지
    • /
    • 제25권1호
    • /
    • pp.36-43
    • /
    • 2021
  • 본 논문에서는 제조 공장 내 AGV (Automated Guided Vehicle) 주행 중 객체 인식을 위한 YOLO v3 알고리즘의 정확도에 대해 살펴보았다. 실험을 위해 2D LiDAR 및 스테레오 카메라가 장착된 AGV를 준비하였다. AGV 주행 중 2D LiDAR를 활용한 SLAM 기법으로 지도 정보를 획득하였고 스테레오 카메라를 활용한 객체 인식이 이루어졌다. 그리고 YOLO v3 알고리즘 기반의 학습 정도에 따른 재현율, AP, mAP 등을 측정하였다. 실험 결과, 4000장의 train data 와 500장의 test data 로 훈련된 YOLO v3 알고리즘에 AGV에 장착된 스테레오 카메라의 시점과 높이에서 획득한 1200장의 이미지를 추가로 학습할 경우 mAP가 약 10% 향상되었다. 정밀도(precision) 와 재현율 역시 각각 6.8%와 16.4% 향상되었다.

객체탐지모델 YOLO의 버전별 특성 비교 연구 (A comparative study on the characteristics of each version of object detection model YOLO)

  • 김준용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.75-78
    • /
    • 2023
  • 본 논문은 객체탐지 모델 중 주류를 이루고 있는 YOLO의 v1부터 v8까지의 특성을 비교 분석하여 각각의 버전에 최적화할 수 있는 모델에 대한 연구이다. 연구 결과 v1, v2는 정확성이 최우선인 모델에 적합하다. 반면, v3, v4는 속도가 우선인 모델에 적합하다. 또한 v5, v6는 정확도와 속도 사이의 균형이 필요한 모델에 적합하다는 결론을 얻었다. v7, v8은 메모리 및 컴퓨팅 성능에 제약이 있는 경우 주로 적용이 가능하며, 적은 연산과 저 메모리 사용으로 객체를 탐지하여 포즈추정이나 객체 추적 등을 적용할 모델에 적합하다는 결과를 확인하였다.

  • PDF

YOLO v3 라이브러리를 이용한 CCTV 저장공간 확보 모델 제안 (Proposal of CCTV Storage Space Securing Model using YOLO v3 Library)

  • 김성익;김황래
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.105-106
    • /
    • 2022
  • 본 논문에서는 YOLO v3 라이브러리를 이용하여 CCTV 저장 공간을 확보하는 모델을 제안한다. 사회안전망을 구축하기 위해 CCTV 설치가 확대되고, 그에 따라 많은 CCTV가 운영됨에 있어 저장 공간이 부족한 현상이 늘고 있다. 이에 본 논문에서는 학습된 데이터 셋을 활용하여 CCTV 영상파일의 프레임을 확인하여 움직임이 있는 객체가 있는지 판단하고, 움직임이 감지되는 프레임 영상을 저장한다. 제안 모델을 적용하여 테스트 한 결과 원본 데이터 크기보다 결과 데이터 크기가 85% 감소됨을 확인하였다. 인적이 드문 곳에 설치된 CCTV의 경우 제안 모델을 적용할 경우, 저장 공간의 관리 및 운영이 용이해질 것으로 기대할 수 있다.

  • PDF

YOLO, EAST: 신경망 모델을 이용한 문자열 위치 검출 성능 비교 (YOLO, EAST : Comparison of Scene Text Detection Performance, Using a Neural Network Model)

  • 박찬용;임영민;정승대;조영혁;이병철;이규현;김진욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.115-124
    • /
    • 2022
  • 본 논문에서는 최근 다양한 분야에서 많이 활용되고 있는 YOLO와 EAST 신경망을 이미지 속 문자열 탐지문제에 적용해보고 이들의 성능을 비교분석 해 보았다. YOLO 신경망은 일반적으로 이미지 속 문자영역 탐지에 낮은 성능을 보인다고 알려졌으나, 실험결과 YOLOv3는 문자열 탐지에 비교적 약점을 보이지만 최근 출시된 YOLOv4와 YOLOv5의 경우 다양한 형태의 이미지 속에 있는 한글과 영문 문자열 탐지에 뛰어난 성능을 보여줌을 확인하였다. 따라서, 이들 YOLO 신경망 기반 문자열 탐지방법이 향후 문자 인식 분야에서 많이 활용될 것으로 전망한다.

A model to secure storage space for CCTV video files using YOLO v3

  • Seong-Ik, Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.65-70
    • /
    • 2023
  • 본 논문에서는 YOLO v3를 이용한 CCTV 저장공간 확보 모델을 제안한다. CCTV는 방범, 화재예방, 감시 등 재난·재해 및 안전을 위해 사회 곳곳에 설치·운영되며, 개수의 증가와 화질의 개선이 함께 이뤄지고 있다. 이로 인해 영상파일의 개수와 크기가 증가하면서 기존의 저장공간으로는 이를 감당하기 어려움을 느끼고 있다. 이를 해소하기 위해 CCTV 영상 속의 특정 객체를 YOLO v3를 이용하여 탐지하여 해당 프레임만을 저장하여 불필요한 프레임을 삭제하는 모델을 제안하여 영상파일의 크기를 줄임으로써 저장공간을 확보하고, 그로 인해 더 오랜 기간 영상을 저장·관리할 수 있도록 하였다. 제안 모델 적용 후 평균 94.9% 영상파일의 크기가 절감됨을 확인하였으며, 제안 모델을 적용하기 전보다 약 20배의 보관 기간이 증가했음을 확인할 수 있었다.

NVIDIA Jetson TX1 기반의 사람 표정 판별을 위한 YOLO 모델 FPS 향상 방법 (YOLO Model FPS Enhancement Method for Determining Human Facial Expression based on NVIDIA Jetson TX1)

  • 배승주;최현준;정구민
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.467-474
    • /
    • 2019
  • 본 이 논문에서는 NVIDIA Jetson TX1에서 YOLO v2 모델의 정확도를 유지하면서 FPS를 개선하는 방법을 제안한다. 일반적으로, 딥러닝 모델에서는 연산량을 줄여 처리 속도를 높이기 위해 파라미터들을 실수형에서 정수형으로 변환하여 정수 연산을 통해 속도를 높이거나 네트워크의 깊이를 감소시키는 방법을 사용한다. 그러나 이 방법들은 인식 정확도가 떨어질 수 있다. 이 논문에서는 YOLO v2 모델을 이용해 표정인식기를 개발하고 정확도 유지 시키기 위해 정수 연산이나 네트워크 깊이 감소를 사용하는 대신, 다음 세 가지 방법을 통해 연산량 및 메모리 소모를 줄인다. 첫 번째, $3{\times}3$ 필터를 $1{\times}1$ 필터로 교체하여 각 Layer 당 매개 변수 수를 9 분의 1로 줄인다. 두 번째, TensorRT의 추론 가속 기능 중 CBR (Convolution-Add Bias-Relu)을 통해 연산량을 줄이고, 마지막으로 TensorRT를 사용하여 반복되는 동일한 연산구조를 가진 레이어를 통합하여 메모리 소비를 줄인다. 시뮬레이션 결과, 기존 YOLO v2 모델에 비해 정확도는 1 % 감소했지만 FPS는 기존 3.9 FPS에서 11 FPS로 282%의 속도 향상을 보였다.

딥러닝 알고리즘을 활용한 출입자 통계와 마스크 착용 판별 인공지능 시스템 (Development of AI Systems for Counting Visitors and Check of Wearing Masks Using Deep Learning Algorithms)

  • 조원영;박승렬;김현수;윤태진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.285-286
    • /
    • 2020
  • 전 세계적으로 유행하는 COVID-19(코로나19)로 인해 사람들은 대면 접촉을 피하게 되었고, 전염성이 높은 이유로 마스크의 착용이 의무화되고 있고, 이를 검사하는 업무가 증가하고 있다. 그래서, 인공지능 기술을 통해 업무를 도와줄 수 있는 출입자 통계와 출입자 마스크 착용 검사를 할 수 있는 시스템이 필요하다. 이를 위해 본 논문에서는 딥러닝 알고리즘을 활용한 출입자 통계와 마스크 착용 판별 시스템을 제시한다. 또한, 실시간 영상인식에 많이 활용되고 있는 YOLO-v3와 YOLO-v4, YOLO-Tiny 알고리즘을 데스크탑 PC와 Nvidia사의 Jetson Nano에 적용하여 알고리즘별 성능 비교를 통해 적합한 방법을 찾고 적용하였다.

  • PDF

ANALYSIS OF THE FLOOR PLAN DATASET WITH YOLO V5

  • MYUNGHYUN JUNG;MINJUNG GIM;SEUNGHWAN YANG
    • Journal of the Korean Society for Industrial and Applied Mathematics
    • /
    • 제27권4호
    • /
    • pp.311-323
    • /
    • 2023
  • This paper introduces the industrial problem, the solution, and the results of the research conducted with Define Inc. The client company wanted to improve the performance of an object detection model on the floor plan dataset. To solve the problem, we analyzed the operational principles, advantages, and disadvantages of the existing object detection model, identified the characteristics of the floor plan dataset, and proposed to use of YOLO v5 as an appropriate object detection model for training the dataset. We compared the performance of the existing model and the proposed model using mAP@60, and verified the object detection results with real test data, and found that the performance increase of mAP@60 was 0.08 higher with a 25% shorter inference time. We also found that the training time of the proposed YOLO v5 was 71% shorter than the existing model because it has a simpler structure. In this paper, we have shown that the object detection model for the floor plan dataset can achieve better performance while reducing the training time. We expect that it will be useful for solving other industrial problems related to object detection in the future. We also believe that this result can be extended to study object recognition in 3D floor plan dataset.