Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)
- 2019.05a
- /
- Pages.493-495
- /
- 2019
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
Design of Rotary Inverted Pendulum System Using Distributed A3C Algorithm
분산 A3C를 활용한 회전식 도립 진자 시스템 설계
- Kwon, Do-Hyung (Korea University of Technology and Education) ;
- Lim, Hyun-Kyo (Korea University of Technology and Education) ;
- Kim, Ju-Bong (Korea University of Technology and Education) ;
- Han, Youn-Hee (Korea University of Technology and Education)
- 권도형 (한국기술교육대학교 창의융합공학협동과정) ;
- 임현교 (한국기술교육대학교 창의융합공학협동과정) ;
- 김주봉 (한국기술교육대학교 컴퓨터공학과) ;
- 한연희 (한국기술교육대학교 컴퓨터공학과)
- Published : 2019.05.10
Abstract
제어 분야의 가장 기초적인 시스템인 Rotary Inverted Pendulum 을 제어하기 위하여, 본 논문에서는 강화학습에서 Deep Q-Network 과 함께 대표적인 알고리즘으로 알려진 Asynchronous Advantage Actor-Critic 을 활용하여 다중 디바이스 제어를 설계한다. Deep Q-Network 알고리즘을 활용한 기존 연구와 동일한 방식으로 실 세계의 물리 에이전트와 가상 환경을 맵핑시키며, 스위치를 통하여 로컬 에이전트와 글로벌 네트워크 간 통신을 구성한다. 본 논문에서는 분산 Asynchronous Advantage Actor-Critic 을 이용함으로써 실 세계의 다중 에이전트 제어를 위한 강화 학습의 활용 가능성을 조명한다.
Keywords