DOI QR코드

DOI QR Code

Design of PPO-based Reinforcement Learning Agents for Match-3 Game Stage Configuration

Match-3 Game 스테이지 구성을 위한 PPO 기반 강화학습 에이전트 설계

  • Hong, Jamin (Dept. of Computer Science, Korea National Open University) ;
  • Chung, Jaehwa (Dept. of Computer Science, Korea National Open University)
  • 홍자민 (한국방송통신대학교 정보과학과) ;
  • 정재화 (한국방송통신대학교 정보과학과)
  • Published : 2022.05.17

Abstract

Match-3 Game 은 스테이지 구성 및 난이도 설정이 중요한 게임이나 다양한 밸런스 요소로 인해 스테이지 구성에 중요한 요소인 난이도 설정에 많은 시간이 소요된다. 특히 게임을 플레이하는 유저가 재미를 느끼는 수준으로 난이도를 설정하는 것이 중요하며, 이를 자동화하기 위해 실제 유저의 플레이 데이터를 활용하여 사람과 유사한 수준의 자동 플레이 에이전트 개발이 진행되었다. 하지만 플레이 데이터의 확보는 쉽지 않기에 연구 방향은 플레이 데이터가 없는 강화학습으로 확장되고 있다. 스테이지 구성에 중요한 요소인 난이도를 설정하기 위함이라면 각 스테이지 간의 상대적인 난이도 차이를 파악하는 것으로 가능하다. 이를 위해 게임의 규칙을 학습한 강화학습 에이전트로 밸런스 요소의 변화에 따른 다양한 난이도의 스테이지를 50 회씩 플레이하여, 평균 획득 점수를 기준으로 스테이지 구성에 필요한 각 스테이지들의 난이도를 파악할 수 있었다.

Keywords