DOI QR코드

DOI QR Code

Reinforcement Learning-based Classification Behavior Control Design of Grid Sorting System

그리드 분류 시스템의 강화 학습 기반 분류 행동 제어 설계

  • Choi, Ho-Bin (Dept. of Computer Science Engineering, KoreaTech University) ;
  • Lim, Hyun-Kyo (Dept. of Computer Science Engineering, KoreaTech University) ;
  • Kim, Ju-Bong (Dept. of Computer Science Engineering, KoreaTech University) ;
  • Hwang, Gyu-Young (Dept. of Computer Science Engineering, KoreaTech University) ;
  • Han, Youn-Hee (Dept. of Computer Science Engineering, KoreaTech University)
  • 최호빈 (한국기술교육대학교 컴퓨터공학과) ;
  • 임현교 (한국기술교육대학교 컴퓨터공학과) ;
  • 김주봉 (한국기술교육대학교 컴퓨터공학과) ;
  • 황규영 (한국기술교육대학교 컴퓨터공학과) ;
  • 한연희 (한국기술교육대학교 컴퓨터공학과)
  • Published : 2019.10.30

Abstract

인공지능(AI)은 최근 다양한 산업과 사회에서 패러다임을 바꾸고 있지만, 최첨단 AI 가 제조업에서는 즉각적인 성과를 보이지 못 하고 있다. 다시 말해, Industry 4.0 시점에서 기존의 접근 방법과 차별화되는 실용적인 방법론이 필요하다. 여기서 중요한 점은 '어떤' 데이터를 '어떻게' 활용하여 '어느' 부분에 적용할 것 인가이다. 제조업은 게임과 같이 가상의 캐릭터가 하나의 객체 단위로 구동되는 것이 아니라 수많은 하드웨어가 물리적으로 조합되어 연동한다. 따라서, 현실 세계에서는 물리적 마모, 고장 등으로 인해 엔지니어의 개입 없이 수천만 번 이상의 반복 학습이 불가능하다. 또, 제조업은 학습을 위한 방대한 양의 데이터를 수집하고 레이블링 하는 것이 매우 어렵다. 이 두 가지 한계를 극복할 수 있는 방법은 현실과 매우 유사한 환경을 시뮬레이션으로 재연 후 강화 학습을 사용하는 것이다. 제조 분야에서 아주 복잡한 환경 중 하나로 이송 설비가 있으며, 본 논문에서는 그리드 분류 시스템을 개발하고 강화 학습을 적용시킬 수 있는 환경을 설계한다.

Keywords