DOI QR코드

DOI QR Code

Comparative Analysis of Computation Times Based on the Number of Containers for CPU-Intensive Tasks in the Kubeflow Environment

Kubeflow 환경에서 CPU 집약적인 작업을 위한 컨테이너 수에 따른 연산 시간 비교 및 분석

  • HyunSeung Jung (Dept. of Computer Science and Engineering, Korea University) ;
  • Taeshin Kang (Dept. of Computer Science and Engineering, Korea University) ;
  • Heonchang Yu (Dept. of Computer Science and Engineering, Korea University) ;
  • Jihun Kang (Dept. of Computer Science and Engineering, Korea University)
  • 정현승 (고려대학교 대학원 컴퓨터학과) ;
  • 강태신 (고려대학교 대학원 컴퓨터학과) ;
  • 유헌창 (고려대학교 대학원 컴퓨터학과) ;
  • 강지훈 (고려대학교 대학원 컴퓨터학과)
  • Published : 2023.11.02

Abstract

머신 러닝의 수요가 증가함에 따라, 머신 러닝 워크플로우의 배포 수요도 증가했다. Kubeflow를 통해 머신 러닝 배포를 편리하게 할 수 있으며, Kubeflow Pipelines에서는 하나의 작업을 여러 컨테이너로 분산시켜서 연산하는 것이 가능하다. 하지만 컨테이너 수를 많이 늘릴수록 반드시 성능이 향상되는 것은 아니다. 따라서, 본 연구에서는 성능 향상의 한계를 제공하는 원인을 분석하기 위해서, Kubeflow에서 CPU 집약적인 작업을 여러 컨테이너로 분산시켜서 연산을 수행하였다. 컨테이너 수에 따른 연산 완료 시간을 비교 및 분석한 결과, 컨테이너 수가 증가할수록 연산 속도 향상이 빨라지나, 어느 시점을 지나면 속도가 다시 완만하게 줄어드는 현상을 확인하였다. 이는 리소스 제한으로 인해 모든 컨테이너가 동시에 스케줄링 되지 못한 것이 가장 큰 원인으로 분석하였다.

Keywords

Acknowledgement

이 논문은 2023년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(2022R1I1A1A01063551) 이 논문은 2023년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임 (No.2022-0-01198, 융합보안대학원(고려대학교))