• 제목/요약/키워드: Game Agent

검색결과 153건 처리시간 0.03초

평균 필드 게임 기반의 강화학습을 통한 무기-표적 할당 (Mean Field Game based Reinforcement Learning for Weapon-Target Assignment)

  • 신민규;박순서;이단일;최한림
    • 한국군사과학기술학회지
    • /
    • 제23권4호
    • /
    • pp.337-345
    • /
    • 2020
  • The Weapon-Target Assignment(WTA) problem can be formulated as an optimization problem that minimize the threat of targets. Existing methods consider the trade-off between optimality and execution time to meet the various mission objectives. We propose a multi-agent reinforcement learning algorithm for WTA based on mean field game to solve the problem in real-time with nearly optimal accuracy. Mean field game is a recent method introduced to relieve the curse of dimensionality in multi-agent learning algorithm. In addition, previous reinforcement learning models for WTA generally do not consider weapon interference, which may be critical in real world operations. Therefore, we modify the reward function to discourage the crossing of weapon trajectories. The feasibility of the proposed method was verified through simulation of a WTA problem with multiple targets in realtime and the proposed algorithm can assign the weapons to all targets without crossing trajectories of weapons.

Proximal Policy Optimization을 이용한 게임서버의 부하분산에 관한 연구 (A Study on Load Distribution of Gaming Server Using Proximal Policy Optimization)

  • 박정민;김혜영;조성현
    • 한국게임학회 논문지
    • /
    • 제19권3호
    • /
    • pp.5-14
    • /
    • 2019
  • 게임 서버는 분산 서버를 기본으로 하고 있다. 분산 게임서버는 서버의 작업 부하를 분산하기 위한 일련의 알고리즘에 의해 각 게임 서버의 부하를 일정하게 나누어서 클라이언트들의 요청에 대한 서버의 응답시간 및 서버의 가용성을 효율적으로 관리한다. 본 논문에서는 시뮬레이션 환경에서 기존 연구 방식인 Greedy 알고리즘과, Reinforcement Learning의 한 줄기인 Policy Gradient 중 PPO(Proximal Policy Optimazation)을 이용한 부하 분산 Agent를 제안하고, 시뮬레이션 한 후 기존 연구들과의 비교 분석을 통해 성능을 평가하였다.

3차원 게임에서 객체들의 상호 작용을 디자인하기 위한 제어 기법 (A Control Method for designing Object Interactions in 3D Game)

  • 김기현;김상욱
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권3호
    • /
    • pp.322-331
    • /
    • 2003
  • 3차원 게임은 게임 시나리오의 다양한 요소에 의한 복잡도가 증가함에 따라 게임 객체들의 상호 관계를 제어하기 위한 문제점을 가진다. 그러므로, 게임 시스템은 각 게임 객체들의 응답을 조정하는 방법의 필요성을 가진다. 또한, 게임 시나리오의 결과에 따라 게임 객체들의 행동 애니메이션을 제어하기 위한 개념들도 필요하다. 사실적 게임 시뮬레이션을 생성하기 위해 시스템은 게임 객체들의 상호작용을 디자인 할 수 있는 구조를 포함해야 한다. 본 논문에서 게임 시나리오상에 게임 객체들의 상호작용 설계를 위해 동적 제어를 디자인하는 기법을 소개한다. 이 방법을 위해 특정 규칙을 이용한 의사결정이 가능한 지능적 에이전트 기반 구조로써 게임 에이전트 시스템을 제안한다. 게임 에이전트 시스템은 환경 데이터 처리, 게임 객체 시뮬레이션, 게임 객체들간의 상호작용 제어, 게임 객체들의 다양한 상호 관계를 정의할수 있는 시각 저작 인터페이스를 제공하기 위해 이용되어진다. 이들 기술들은 게임 객체의 자율성과 연관된 충돌 회피 기법 등을 처리한다. 또한, 장면의 변경으로부터 게임 객체들의 일관된 의사 결정력을 가능하게 한다. 본 논문에서는 규칙기반 행동 제어가 게임 객체의 시뮬레이션을 안내하기 위해 디자인되어졌다. 시각적 요소들로 구성된 에이전트 상태 결정 네트워크는 정보전달과 게임 객체들 사이의 현상태를 추론할 수 있다. 이들 기법들은 실시간으로 게임 객체들간의 동작 상태 변이를 체크하고 모니터링 할 수 있다. 마지막으로 간단한 사례 연구 예와 함께 제어 기법의 타당성을 제시한다.

강화학습 에이전트 시야 정보 차이에 의한 학습 성능 비교 (Comparison of Learning Performance by Reinforcement Learning Agent Visibility Information Difference)

  • 김찬섭;장시환;양성일;강신진
    • 한국게임학회 논문지
    • /
    • 제21권5호
    • /
    • pp.17-28
    • /
    • 2021
  • 인공지능 스스로가 자신을 발전시켜 최적의 문제 해결 방법을 찾는 강화학습은 여러 분야에서 활용 가치가 높은 기술이다. 특히 게임 분야는 강화학습 인공지능에 문제 해결을 위한 가상환경을 제공할 수 있다는 장점이 있으며 강화학습 에이전트는 주어진 환경에 대한 정보인 관측변수를 사용하여 자신의 상황과 환경에 대한 정보를 파악하여 환경에 대한 문제를 해결한다. 본 실험에서는 롤플레잉 게임의 인스턴트 던전 환경을 간략화하여 제작하고 에이전트에게 관측변수 중 시야에 관련된 관측변수를 다양하게 설정하였다. 실험 결과 각 설정된 변수들이 학습속도에 얼마나 영향을 주는지를 파악할 수 있었고, 이러한 결과는 롤플레잉 게임 강화학습 연구에 참고할 수 있다.

Multiple Behavior s Learning and Prediction in Unknown Environment

  • Song, Wei;Cho, Kyung-Eun;Um, Ky-Hyun
    • 한국멀티미디어학회논문지
    • /
    • 제13권12호
    • /
    • pp.1820-1831
    • /
    • 2010
  • When interacting with unknown environments, an autonomous agent needs to decide which action or action order can result in a good state and determine the transition probability based on the current state and the action taken. The traditional multiple sequential learning model requires predefined probability of the states' transition. This paper proposes a multiple sequential learning and prediction system with definition of autonomous states to enhance the automatic performance of existing AI algorithms. In sequence learning process, the sensed states are classified into several group by a set of proposed motivation filters to reduce the learning computation. In prediction process, the learning agent makes a decision based on the estimation of each state's cost to get a high payoff from the given environment. The proposed learning and prediction algorithms heightens the automatic planning of the autonomous agent for interacting with the dynamic unknown environment. This model was tested in a virtual library.

Seamless Games 에서의 부하 분산을 위한 MigAgent 시스템 설계 (Degine of MigAgent System for Load Balancing in Seamless Game)

  • 원동기;이정진;황호전;두길수;김법균;안동언;정성종
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.466-468
    • /
    • 2005
  • MMORPG enables thousands of players to play in an evolving virtual world at the same time over the internet. So, the load of this kind of games is heavier than that of any other precedents. One of load balancing methods is map-partition to divide the load of entire system which is vulnerable to delay message between clients and servers. In this paper, we propose a game architecture using MigAgent to help migration of player character between field servers and to reduce message traffic between clients and field servers.

  • PDF

An Acquisition of Strategy in Two Player Game by Coevolutionary Agents

  • Kushida, Jun-ichi;Noriyuki Taniguchi;Yukinobu Hoshino;Katsuari Kamei
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.690-693
    • /
    • 2003
  • The purpose of two player game is that a player beats an enemy. In order to win to various enemies, a learning of various strategies is indispensable. However, the optimal action to overcome the enemies will change when the game done over and again because the enemy's actions also change dynamically. Sol it is din-cult that the player aquires the optimal action and that the specific player keeps winning to various enemies. Species who have a competition relation and affect other's existence is called a coevolution. Coevolution has recently attracred considerable interest in the community of Artificial Life and Evolutionary Computation(1). In this paper, we apply Classifier System for agent team to two player game. A reward and a penalty are given to the used rules when the agent achieve specific action in the game and each team's rulebase are evaluated based on the ranking in the league. We show that all teams can acquire the optimal actions by coevolution.

  • PDF

사이보그 동료: 인간과 기계 (A Cyborg Companion: Human Being & Machine Being)

  • 김지연
    • 한국게임학회 논문지
    • /
    • 제15권3호
    • /
    • pp.51-62
    • /
    • 2015
  • 기계 또는 소프트웨어 프로그램과 같은 인공물은 단순히 도구일 뿐인가? 이미 많은 프로그램들이 인간사용자들을 안내하거나 도와주는 일을 하고 있다. 본 연구에서는 행위자(agents) 개념을 사용하여, 인간플레이어와 게임봇의 행위성에 대해 살펴볼 것이다. 게임봇은 상호작용성과 자율성은 물론이고 적응성의 단계에 진입하고 있다. 게임수행 동안, 게임봇과 인간플레이어는 서로를 구성하는 사이보그 동료이다. 그런 점에서 게임봇은 정치사회적 존재가 되고 있다. 컴퓨터 환경에서 인간행위자는 인공행위자와의 관계에서 구성되는 사이보그적 존재가 되므로, 그들은 전통적인 인간행위자와는 다르다.

게임지도에서 에이젼트 이동을 위한 경로표 활용 (Utilization of the Route Table for the Agent's Move in the Game Map)

  • 심동희;강혁
    • 한국정보처리학회논문지
    • /
    • 제7권10호
    • /
    • pp.3164-3170
    • /
    • 2000
  • 게임지도상에서 에이젼트 이동을 위한 경로탐색에 A+를 이용하는 경우에 실시간 게임진행에 지장을 주고 있다. 다른 경험적 탐색방법은 경로에 대한 최적성 보장이 없어서 문제가 된다. 이러한 문제를 해결하기 위하여 본 논문에서는 현 위치, 목표위치, 최적경로위치로 정의되는 행으로 구성되는 경로표를 제안하였다. 이 경로표를 게임개발시에 미리 작성하여 게임진행시에 이를 이용한다. 이 경로표는 목표위치로의 이동을 위한 최적의 경유위치를 가지고 있어서 최적의 경로도 보장이 되며 탐색으로 인한 시간의 부하도 없다는 장점을 가지고 있다. 그러나 경로표 저장에 메모리가 많이 소요되는 단점이 있다. 이 논문에서는 이 같은 단점을 해소하기 위해 경로표는 생략하는 방법을 이용해도 데이터압축효과를 얻을 수 있음을 보여주었다.

  • PDF

유전 프로그래밍을 이용한 추격-회피 문제에서의 게임 에이전트 학습 (Game Agent Learning with Genetic Programming in Pursuit-Evasion Problem)

  • 권오광;박종구
    • 정보처리학회논문지B
    • /
    • 제15B권3호
    • /
    • pp.253-258
    • /
    • 2008
  • 최근의 게임 플레이어들은 단순한 반복적인 조작을 벗어나 복잡한 환경 하에서 다양한 전략과 전술을 구사하여야 하는 게임을 요구하고 있다. 이러한 환경에서 게임 캐릭터를 학습시키기 위해 다양한 인공지능 기법들이 제안되었으며, 최근에는 신경망과 유전 알고리즘을 이용한 학습 방법이 연구되고 있다. 본 논문에서는 게임이론에서 널리 사용되는 추격-회피 전략의 학습을 위해 유전 프로그래밍(GP)을 사용하였다. 제안된 유전 프로그래밍은 신경망과 같은 기존의 방법에 비해 수행 속도가 빠르고, 학습의 결과를 직관적으로 이해할 수 있으며, 진화된 염색체를 추론 규칙으로 변환 가능하므로 호환성이 높다는 장점을 가지고 있다.