Area-Based Q-learning for Multiple Robots Control

다수 로봇 제어를 위한 면적 기반 Q-learning

  • Yoon Han-Ul (School of Electrical and Electronics Engineering, Chung-Ang University) ;
  • Jang In-Hoon (School of Electrical and Electronics Engineering, Chung-Ang University) ;
  • Sim Kwee-Bo (School of Electrical and Electronics Engineering, Chung-Ang University)
  • 윤한얼 (중앙대학교 전자전기 공학부) ;
  • 장인훈 (중앙대학교 전자전기 공학부) ;
  • 심귀보 (중앙대학교 전자전기 공학부)
  • Published : 2005.04.01

Abstract

본 논문에서는 다수개의 로봇을 효율적으로 제어하기 위한 면적기반 Q-learning에 대해 논한다. 각 로봇은 $60^{\circ}$의 각을 이루도록 배치된 6개 센서를 가지고 있고 이를 통해 자신과 주변환경 사이의 거리를 센싱한다. 다음으로, 이 획득된 거리 데이터들로부터 6방향의 면적을 계산하여, 이후의 진행에 있어 보다 넓은 행동 반경을 보장해주는 영역으로 이동한다. 이 이동을 어떤 상태에서 다른 상태로의 전이로 간주, 이동 후 다시 6방향의 면적을 계산하여 이전 상태에서 현재 상태로의 행동에 대한 Q-Value를 업데이트 한다. 본 논문의 실험에서는 5개의 로봇을 이용해 장애물 사이에 숨어있는 물체를 찾아내는 것을 시도하였고, 3개의 서로 다른 제어 방법 - 랜덤 탐색, 면적 기반 탐색, 면적 기반 Q-learning 탐색 - 에 따른 결과를 나타내었다.

Keywords