• 제목/요약/키워드: 로봇 축구 시뮬레이션 게임

검색결과 3건 처리시간 0.015초

분류자 시스템을 이용한 축구 로봇의 행동 전략 (Behavior strategies of Soccer Robot using Classifier System)

  • 김지윤;이동욱;심재윤;심귀보
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.19-22
    • /
    • 2002
  • 분류자 시스템은 유전자 알고리즘(Genetic Algorithm : GA)을 이용하여 새로운 규칙 집합을 발견하는 시스템이다 또 로봇 축구 시뮬레이션 게임(SimuroSot)은 시간에 따라 상태가 변화하는 동적인 시스템이다 본 논문에서는 GBML(Genetic Based Machine Learning)의 한 갈래이자 미시간 접근 방법을 기반으로 하는 Zeroth Level Classifier System(ZCS)을 SimuroSot에 적용하여 게임 전략을 구성하는 새로운 규칙의 발견과 학습에 의한 축구 로봇의 행동전략 알고리즘을 제안하고, 시뮬레이션을 통하여 본 전략의 유용성을 확인한다

  • PDF

분류자 시스템을 이용한 축구 로봇의 행동 전략 (Behavior strategies of Soccer Robot using Classifier System)

  • 심귀보;김지윤
    • 한국지능시스템학회논문지
    • /
    • 제12권4호
    • /
    • pp.289-293
    • /
    • 2002
  • 분류자 시스템(Classifier System)은 유전자 알고리즘(Genetic Algorithmsm : GA)을 이용하여 새로운 규칙 집합을 발견하는 시스템이다 또 로봇 축구 시뮬레이션 게 (SimuroSot)은 시간에 따라 상태가 변화하는 동적인 시스템이다. 본 논문에서는 GBML(Genetic Based Machine Learning)의 한 갈래이자 미시간 접근 방법을 기반으로 하는 Zeroth Level Classifier System(ZCS)을 SimuroSot에 적용하여 게임 전략을 구성하는 새로운 규칙을 발견하고 학습하도록 하고 시뮬레이션 결과를 분석함으로써 ZCS의 유용성을 확인한다.

강화 학습에 기초한 로봇 축구 에이전트의 설계 및 구현 (Design and implementation of Robot Soccer Agent Based on Reinforcement Learning)

  • 김인철
    • 정보처리학회논문지B
    • /
    • 제9B권2호
    • /
    • pp.139-146
    • /
    • 2002
  • 로봇 축구 시뮬레이션 게임은 하나의 동적 다중 에이전트 환경이다. 본 논문에서는 그러한 환경 하에서 각 에이전트의 동적 위치 결정을 위한 새로운 강화학습 방법을 제안한다. 강화학습은 한 에이전트가 환경으로부터 받는 간접적 지연 보상을 기초로 누적 보상값을 최대화할 수 있는 최적의 행동 전략을 학습하는 기계학습 방법이다. 따라서 강화학습은 입력-출력 쌍들이 훈련 예로 직접 제공되지 않는 다는 점에서 교사학습과 크게 다르다. 더욱이 Q-학습과 같은 비-모델 기반의 강화학습 알고리즘들은 주변 환경에 대한 어떤 모델도 학습하거나 미리 정의하는 것을 요구하지 않는다. 그럼에도 불구하고 이 알고리즘들은 에이전트가 모든 상태-행동 쌍들을 충분히 반복 경험할 수 있다면 최적의 행동전략에 수렴할 수 있다. 하지만 단순한 강화학습 방법들의 가장 큰 문제점은 너무 큰 상태 공간 때문에 보다 복잡한 환경들에 그대로 적용하기 어렵다는 것이다. 이런 문제점을 해결하기 위해 본 연구에서는 기존의 모듈화 Q-학습방법(MQL)을 개선한 적응적 중재에 기초한 모듈화 Q-학습 방법(AMMQL)을 제안한다. 종래의 단순한 모듈화 Q-학습 방법에서는 각 학습 모듈들의 결과를 결합하는 방식이 매우 단순하고 고정적이었으나 AMMQL학습 방법에서는 보상에 끼친 각 모듈의 기여도에 따라 모듈들에 서로 다른 가중치를 부여함으로써 보다 유연한 방식으로 각 모듈의 학습결과를 결합한다. 따라서 AMMQL 학습 방법은 큰 상태공간의 문제를 해결할 수 있을 뿐 아니라 동적인 환경변화에 보다 높은 적응성을 제공할 수 있다. 본 논문에서는 로봇 축구 에이전트의 동적 위치 결정을 위한 학습 방법으로 AMMQL 학습 방법을 사용하였고 이를 기초로 Cogitoniks 축구 에이전트 시스템을 구현하였다.