A Performance Analysis of Model Training Due to Different Batch Sizes in Synchronous Distributed Deep Learning Environments

Yerang Kim;HyungJun Kim;Heonchang Yu;

doi:10.3745/PKIPS.y2023m11a.79

Annual Conference of KIPS (한국정보처리학회:학술대회논문집)

2023.11a
/
Pages.79-80
/
2023
/
2005-0011(pISSN)
/
2671-7298(eISSN)

Korea Information Processing Society (한국정보처리학회)

DOI QR Code

A Performance Analysis of Model Training Due to Different Batch Sizes in Synchronous Distributed Deep Learning Environments

동기식 분산 딥러닝 환경에서 배치 사이즈 변화에 따른 모델 학습 성능 분석

Yerang Kim (Dept. of Computer Science and Engineering, Korea University) ;
HyungJun Kim (Dept. of Computer Science and Engineering, Korea University) ;
Heonchang Yu (Dept. of Computer Science and Engineering, Korea University)

김예랑 (고려대학교 정보대학 컴퓨터학과) ;
김형준 (고려대학교 정보대학 컴퓨터학과) ;
유헌창 (고려대학교 정보대학 컴퓨터학과)

Published : 2023.11.02

https://doi.org/10.3745/PKIPS.y2023m11a.79 Citation PDF

Download PDF

⟨ Previous Next ⟩

Abstract

동기식 분산 딥러닝 기법은 그래디언트 계산 작업을 다수의 워커가 나누어 병렬 처리함으로써 모델 학습 과정을 효율적으로 단축시킨다. 배치 사이즈는 이터레이션 단위로 처리하는 데이터 개수를 의미하며, 학습 속도 및 학습 모델의 품질에 영향을 미치는 중요한 요소이다. 멀티 GPU 환경에서 작동하는 분산 학습의 경우, 가용 GPU 메모리 용량이 커짐에 따라 선택 가능한 배치 사이즈의 상한이 증가한다. 하지만 배치 사이즈가 학습 속도 및 학습 모델 품질에 미치는 영향은 GPU 활용률, 총 에포크 수, 모델 파라미터 개수 등 다양한 변수에 영향을 받으므로 최적값을 찾기 쉽지 않다. 본 연구는 동기식 분산 딥러닝 환경에서 실험을 통해 최적의 배치 사이즈 선택에 영향을 미치는 주요 요인을 분석한다.

Keywords

Acknowledgement

본 연구는 과학기술정보통신부 및 정보통신기획평가원의 ICT혁신인재4.0 사업의 연구결과로 수행되었음(IITP-2023-RS-2022-00156439) 본 연구는 과학기술정보통신부 및 정보통신기획평가원의 대학ICT연구센터지원사업의 연구결과로 수행되었음 (IITP-2018-0-01405)

Annual Conference of KIPS (한국정보처리학회:학술대회논문집)

A Performance Analysis of Model Training Due to Different Batch Sizes in Synchronous Distributed Deep Learning Environments

동기식 분산 딥러닝 환경에서 배치 사이즈 변화에 따른 모델 학습 성능 분석

Abstract

Keywords

Acknowledgement

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)