DOI QR코드

DOI QR Code

Development and Study of Cloud-Edge AI Inference Service Based on Microservices

마이크로서비스 기반의 클라우드 엣지 AI 추론 서비스 개발 및 연구

  • Seo, Ji-Hyun (Electronics and Telecommunications Research Institute (ETRI)) ;
  • Jang, Su-min (Electronics and Telecommunications Research Institute (ETRI)) ;
  • Cha, Jae-geun (Electronics and Telecommunications Research Institute (ETRI)) ;
  • Choi, Hyun-hwa (Electronics and Telecommunications Research Institute (ETRI)) ;
  • Kim, Dae-won (Electronics and Telecommunications Research Institute (ETRI)) ;
  • Kim, Sun-wook (Electronics and Telecommunications Research Institute (ETRI))
  • Published : 2022.05.17

Abstract

최근 딥러닝을 이용한 영상 분석은 자율주행, 감시카메라 등 다양한 서비스에 필수적으로 활용되고 있으며 실시간 처리 및 보안 요소를 만족하기 위해 기존의 클라우드 컴퓨팅 방식의 단점을 개선한 클라우드 엣지 컴퓨팅 방식을 적용하는 사례가 크게 증가하고 있다. 하지만 사용자 및 단말과 가까운 위치에서 딥러닝 추론을 진행하는 클라우드 엣지 서버는 클라우드 서버와 비교하여 컴퓨팅 자원이 충분하지 않을 경우가 많으며 기존의 딥러닝 모델을 그대로 클라우드 엣지 환경에 적용하는 것은 자원 활용 측면에서 여러가지 문제점들을 갖고 있다. 따라서 본 논문에서는 마이크로서비스 구조를 통해 자원을 보다 유연하게 활용할 수 있도록 개선된 딥러닝 모델로 대규모의 클라이언트 요청을 처리 가능한 동영상 데이터 추론 서비스인 G-Edge AI 추론 서비스 개발에 대해 설명한다.

Keywords

Acknowledgement

본 연구는 2020년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행되었음 (2020-0-00116, 10msec 미만의 서비스 응답 속도를 보장하는 초저지연 지능형 클라우드 엣지 SW 플랫폼 핵심 기술 개발)