DOI QR코드

DOI QR Code

Method for reducing computational amount in video object detection

비디오 Object Detection에서의 연산량 감소를 위한 방법

  • KIM, Do-Young (Dept. of Electronicand Information Engineering, Seoul National University of Scienceand Technology) ;
  • Kang, In-Yeong (Dept. of InformationTechnologyManagement for Business, Seoul National University of Scienceand Technology) ;
  • Kim, Yeonsu (Dept. of ComputerScienceand Engineering, Seoul National University of Scienceand Technology) ;
  • Choi, Jin-Won (Dept. of Mechanical System Design Engineering, Seoul National University of Scienceand Technology) ;
  • Park, Goo-man (Dept. of Electronicand IT Media Engineering, Seoul National University of Scienceand Technology)
  • 김도영 (서울과학기술대학교 전기정보공학과) ;
  • 강인영 (서울과학기술대학교 ITM학과) ;
  • 김연수 (서울과학기술대학교 컴퓨터공학과) ;
  • 최진원 (서울과학기술대학교 기계시스템디자인공학과) ;
  • 박구만 (서울과학기술대학교 전자미디어 IT 공학과)
  • Published : 2021.11.04

Abstract

현재 단일 이미지에서 Object Detection 성능은 매우 좋은 편이다. 하지만 동영상에서는 처리 속도가 너무 느리고 임베디드 시스템에서는 real-time이 힘든 상황이다. 연구 논문에서는 하이엔드 GPU에서 다른 기능 없이 YOLO만 구동했을 때 real-time이 가능하다고 하지만 실제 사용자들은 상대적으로 낮은 사양의 GPU를 사용하거나 CPU를 사용하기 때문에 일반적으로는 자연스러운 real-time을 하기가 힘들다. 본 논문에서는 이러한 제한점을 해결하고자 계산량이 많은 Object Detection model 사용을 줄이는 방안은 제시하였다. 현재 Video영상에서 Object Detection을 수행할 때 매 frame마다 YOLO모델을 구동하는 것에서 YOLO 사용을 줄임으로써 계산 효율을 높였다. 본 논문의 알고리즘은 카메라가 움직이거나 배경이 바뀌는 상황에서도 사용이 가능하다. 속도는 최소2배에서 ~10배이상까지 개선되었다.

Keywords

Acknowledgement

이 논문은 2021년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임 (No.2021-0-00751, 0.5mm 급 이하 초정밀 가시·비가시 정보 표출을 위한 다차원 시각화 디지털 트윈 프레임워크 기술 개발)