An Adaptive Policy for Stochastic Knapsack Problems: Parallel Rollout Approach

확률적 배낭 문제들에 대한 적응적 정책: 병렬 롤아웃 접근

  • Choi, Sang-Hee (Department of Computer Science and Engineering, Sogang University) ;
  • Chang, Hyeong-Soo (Department of Computer Science and Engineering, Sogang University)
  • Published : 2007.10.26

Abstract

본 논문에서는 "확률적 배낭(stochastic knapsack)" 문제에 대하여 잘 알려진 Complete Sharing(CS), Complete Partitioning(CP)이 트래픽 특성에 따라 성능의 차이가 나타난다는 약점과 각 정책(policy)들의 평균 성능에 대한 최적 파라미터들을 트래픽 특성에 따라 결정하여야 한다는 약점을 보완하는 모델에 근거한 "Parallel Rollout(PR)"에 기초한 적응적인 정책(adaptive policy)을 제안한다. 주어진 트래픽 모델을 병합한 확률적 배낭 문제를 마코프 결정 과정(Markov Decision Process, MDP)으로 모델링하고, 마코프 결정 과정상에서 기존의 주어진 정책들을 PR 기법을 적용, 하나의 정책으로 융합하고 그 정책이 기존의 주어진 어떤 정책보다도 성능이 같거나 더 뛰어나다는 이론적 근거를 실험을 통하여 확인한다.

Keywords