DOI QR코드

DOI QR Code

Analysis of CNN Inference Using Xilinx DPU

Xilinx DPU를 사용한 CNN 추론 분석

  • Kim, Chaeyoung (Dept of Semiconductor System Engineering, Korea University) ;
  • Suh, Taeweon (Dept of Computer Science and Engineering, Korea University)
  • 김채영 (고려대학교 반도체시스템공학과) ;
  • 서태원 (고려대학교 컴퓨터학과)
  • Published : 2019.10.30

Abstract

지능형 IoT 애플리케이션들을 효과적으로 사용하기 위해서는 추론 엔진을 Edge device로 포팅하는 것이 필수적이다. 그러나 컴퓨팅 자원이 제한적인 Edge 환경에서 computational cost가 상당히 큰 CNN 추론을 실시간으로 하는 것은 쉽지 않다. 이에, CNN 추론의 하드웨어 가속화의 필요성이 제기되어 활발한 연구가 진행되고 있으며, Xilinx, Intel 등에서도 하드웨어 가속화를 도와주는 툴을 개발하여 지속적으로 업그레이드하고 있다. 본 연구에서는 CIFAR-10 데이터베이스의 테스트 이미지 10,000개를 Xilinx 사의 CNN 추론 엔진인 DPU를 사용하여 Zynq UltraScale+ 보드에서 추론해보고, DPU 아키텍처에 따른 결과를 비교·분석했다. 병렬처리 수준을 높게 한 DPU는 그렇지 않은 DPU보다 소비전력 및 자원 사용량이 3배 이상 높았지만, 1.65배 좋은 성능을 보여 Trade-off 관계를 확인할 수 있었다.

Keywords