• 제목/요약/키워드: 학습강화

검색결과 1,581건 처리시간 0.026초

A Study of Collaborative and Distributed Multi-agent Path-planning using Reinforcement Learning

  • Kim, Min-Suk
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권3호
    • /
    • pp.9-17
    • /
    • 2021
  • 동적 시스템 환경에서 지능형 협업 자율 시스템을 위한 기계학습 기반의 다양한 방법들이 연구 및 개발되고 있다. 본 연구에서는 분산 노드 기반 컴퓨팅 방식의 자율형 다중 에이전트 경로 탐색 방법을 제안하고 있으며, 지능형 학습을 통한 시스템 최적화를 위해 강화학습 방법을 적용하여 다양한 실험을 진행하였다. 강화학습 기반의 다중 에이전트 시스템은 에이전트의 연속된 행동에 따른 누적 보상을 평가하고 이를 학습하여 정책을 개선하는 지능형 최적화 기계학습 방법이다. 본 연구에서 제안한 방법은 강화학습 기반 다중 에이전트 최적화 경로 탐색 성능을 높이기 위해 학습 초기 경로 탐색 방법을 개선한 최적화 방법을 제안하고 있다. 또한, 분산된 다중 목표를 구성하여 에이전트간 정보 공유를 이용한 학습 최적화를 시도하였으며, 비동기식 에이전트 경로 탐색 기능을 추가하여 실제 분산 환경 시스템에서 일어날 수 있는 다양한 문제점 및 한계점에 대한 솔루션을 제안하고자 한다.

다중 교차로에서 협력적 교통신호제어에 대한 연구 (A Study on Cooperative Traffic Signal Control at multi-intersection)

  • 김대호;정옥란
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1381-1386
    • /
    • 2019
  • 도시의 교통 혼잡 문제가 심각해지면서 지능형 교통신호제어가 활발하게 연구되고 있다. 강화학습은 교통신호제어에 가장 활발하게 사용되고 있는 알고리즘으로 최근에는 심층 강화학습 알고리즘이 관심을 끌고 있다. 또한 심층 강화학습 알고리즘이 다양한 분야에서 높은 성능을 보이면서 심층 강화학습의 확장 버전들이 빠른 속도로 등장했다. 하지만 기존 교통신호제어 연구들은 대부분 단일 교차로 환경에서 진행되었으며, 단일 교차로의 교통 혼잡만 완화하는 방법은 도시 전체의 교통 상황을 고려하지 못한다는 한계가 있다. 본 논문에서는 다중 교차로 환경에서 협력적 교통신호제어를 제안한다. 신호제어 알고리즘에는 심층 강화학습의 확장 버전들이 결합된 알고리즘을 적용했으며 다중 교차로를 효율적으로 제어하기 위해 인접한 교차로의 교통 상황을 고려하였다. 실험에서는 제안하는 알고리즘과 기존 심층 강화학습 알고리즘을 비교하였으며, 더 나아가 협력적 방법이 적용된 모델과 적용되지 않은 모델의 실험 결과를 보여줌으로써 높은 성능을 증명한다.

거리를 고려한 줄고누게임의 학습속도 개선 (An Improvement of the Learning Speed through Considered Distance on Jul-Gonu Game)

  • 신용우;정태충
    • 한국게임학회 논문지
    • /
    • 제10권1호
    • /
    • pp.105-113
    • /
    • 2010
  • 보드게임은 많은 수의 말들과 상태공간을 갖고 있다. 그래서 많은 시간동안 학습을 하여야 한다. 또한 상대방과의 대결이 1 대 1로 이루어지지 않고, 여러 말 대 여러 말로 이루어지므로 전략적인 사고가 필요하다. 그러므로 최적의 학습을 적용하여야 한다. 학습 도중에 동일한 최선 값이 있을 때, 줄고누의 문제 영역 지식을 활용한 휴리스틱을 사용해 학습의 속도 향상을 시도하였다. 강화학습을 이용한 말과 제안한 개선된 강화학습을 이용한 말을 비교하기 위해 줄고누게임을 제작하였다. 그래서 일방적으로 공격을 하는 말과 승부를 하게 하였다. 개선된 말은 거리를 고려하여 상대방 말을 공격하였다. 실험결과 개선된 강화학습을 이용한 말의 성능이 학습속도 측면에서 향상됨을 알 수 있었다.

유니티 ML-Agents를 이용한 강화 학습 기반의 지능형 에이전트 구현 (Implementation of Intelligent Agent Based on Reinforcement Learning Using Unity ML-Agents)

  • 이영호
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.205-211
    • /
    • 2024
  • 본 연구는 유니티 게임 엔진과 유니티 ML-Agents를 이용하여 강화 학습을 통해 목표 추적 및 이동을 지능적으로 수행하는 에이전트를 구현하는 데 목적이 있다. 본 연구에서는 에이전트의 효과적인 강화 학습 훈련 방식을 모색하기 위해 단일 학습 시뮬레이션 환경에서 하나의 에이전트를 트레이닝하는 방식과 다중 학습 시뮬레이션 환경에서 여러 에이전트들을 동시에 병렬 트레이닝하는 방식 간의 학습 성능을 비교하기 위한 실험을 수행하였다. 실험 결과를 통해 병렬트레이닝 방식이 싱글 트레이닝 방식보다 학습 속도 측면에서 약 4.9배 빠르고, 학습 안정성 측면에서도 더 안정적으로 효과적인 학습이 일어남을 확인할 수 있었다.

분석 피드백을 강화한 공업입지론 STEAM 콘텐츠 (STEAM Contents for Industrial Location Theory on Reinforce Analysis Feedback)

  • 강현지;고란희;이소연;강신혜;권상철;조정원
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2017년도 하계학술대회
    • /
    • pp.227-230
    • /
    • 2017
  • 전 세계적으로 과학, 기술, 공학, 예술, 수학이 융합된 STEAM교육이 강조되고 있는 가운데 우리나라도 STEAM교육의 효율성을 높여줄 수 있는 콘텐츠에 대한 관심과 적용이 늘어가고 있다. 본 논문은 "공업입지론" 내용을 바탕으로 개발된 에듀테인먼트 콘텐츠의 교육적 효과를 향상시키고자 분석 피드백 기능을 강화하였다. 강화된 분석 피드백 기능은 첫째, 학습자가 공장 선택 조건과 각 공장의 장점 확인, 둘째, 상품의 운송조건 제시, 셋째, 학습 결과에 대한 분석이다. 이에 학습자가 콘텐츠를 통해 학습하는 과정에서 분석 피드백을 제공 받아 학습에 대한 이해도 등 교육적 효과를 향상 시키고자 한다.

  • PDF

강화 학습에 의한 로봇축구 에이전트 행동 전략 (Behavior Strategies of Robot Soccer Agent by Reinforcement Learning)

  • 최소라;이승관;이영아;정태충
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.465-468
    • /
    • 2005
  • 강화 학습이란 개체가 동적인 환경에서 시행착오를 통해 자신의 최적 행동을 찾아내는 기법이다. 특히 Q-learning과 같은 비(非)모델 기반의 강화학습은 사전에 환경에 대한 모델을 필요로 하지 않으며, 다양한 상태와 행동들을 충분히 경험한다면 최적의 행동 전략에 도달할 수 있으므로 여러 분야에 적용되고 있다. 본 논문에서는 로봇의 행동을 효율적으로 제어하기 위하여 Q-learning을 이용하였다. 로봇 축구 시스템은 공과 여러 대의 로봇이 시시각각 움직이는 시변 환경이므로 모델링이 상당히 복잡하다. 공을 골대 가까이 보내는 것이 로봇 축구의 목표지만 때로는 공을 무조건 골대 방향으로 보내는 것보다 더 효율적인 전략이 있을 수도 있다. 어떤 상황에서 어떤 행동을 하여야 장기적으로 보았을 때 더 우수한지 학습을 통해 로봇 스스로가 판단해가도록 시스템을 구현하고, 학습된 결과를 분석한다.

  • PDF

강화학습에 기반한 모델로 게임의 설계 및 구현 (Design and Implementation of Othello game Based on Reinforcement Learning)

  • 이동훈;우종우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.778-780
    • /
    • 2005
  • 최근 인공지능의 기법을 도입한 게임에 관한 연구가 활발히 진행되고 있다. 특히 신경망의 역 전파 알고리즘을 적용한 게임은 구현이 용이하고 학습이 완료되면 비교적 실행이 빨라서 많은 연구가 진행되고 있지만 기본적인 학습시간이 길고 최적화에 관한 문제점이 존재하고 있다. 이러한 문제점을 개선하고자 본 논문에서는 기존의 역 전파 알고리즘과 강화학습의 Q-learning알고리즘을 모델로 게임에 적용하여 비교 분석 하였다. 실험은 단순한 min-max 알고리즘과 각각 대결하여 승수 와 승율을 중심으로 비교하였고 실험의 결과는 강화학습의 알고리즘이 역 전파 알고리즘에 비하여 비교적 우수한 결과를 제시하였다.

  • PDF

소포물 분류를 위한 그리드 타입 시스템의 강화 학습 기반 행동 제어 (Reinforcement learning-based behavior control of a grid-type system for sorting parcels)

  • 최호빈;김주봉;황규영;한연희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.585-586
    • /
    • 2020
  • 공정 데이터를 실시간으로 수집할 수 있는 스마트 팩토리의 장점을 활용하여, 일반적인 기계 학습 대신 강화 학습을 사용한다면 미리 요구되는 훈련 데이터 없이 행동 제어를 할 수 있다. 하지만, 현실 세계에서는 물리적 마모, 시간적 문제 등으로 인해 수천만 번 이상의 반복 학습이 불가능하다. 따라서, 본 논문에서는 시뮬레이터를 활용해 스마트 팩토리 분야에서 복잡한 환경 중 하나인 이송 설비에 초점을 둔 그리드 분류 시스템을 개발하고 협력적 다중 에이전트 기반의 강화 학습을 설계하여 효율적인 행동 제어가 가능함을 입증한다.

소형무인선의 자율운행을 위한 강화학습기법 적용에 관한 연구 (A study on application of reinforcement learning to autonomous navigation of unmanned surface vehicle)

  • 이희용
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2023년도 추계학술대회
    • /
    • pp.232-235
    • /
    • 2023
  • 본 연구는 해상에서 운용되는 무인선이 조타기를 사용하여 출발지점에서 지정된 목적지까지 자율적으로 이동하게 하는 강화학습기법의 적용을 위한 환경 구축과 학습 방법 그리고 학습 결과를 무인선에 적용하는 과정을 담고 있다.

  • PDF

자율주행 자동차의 주차를 위한 강화학습 활성화 함수 비교 분석 (A Comparative Analysis of Reinforcement Learning Activation Functions for Parking of Autonomous Vehicles)

  • 이동철
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권6호
    • /
    • pp.75-81
    • /
    • 2022
  • 주차 공간의 부족함을 획기적으로 해결할 수 있는 자율주행 자동차는 심층 강화 학습을 통해 큰 발전을 이루고 있다. 심층 강화 학습에는 활성화 함수가 사용되는데, 그동안 다양한 활성화 함수가 제안되어 왔으나 적용 환경에 따라 그 성능 편차가 심했다. 따라서 환경에 따라 최적의 활성화 함수를 찾는 것이 효과적인 학습을 위해 중요하다. 본 논문은 자율주행 자동차가 주차를 학습하기 위해 심층 강화 학습을 사용할 때 어떤 활성화 함수를 사용하는 것이 가장 효과적인지 비교 평가하기 위해 강화 학습에 주로 사용되는 12개의 함수를 분석하였다. 이를 위해 성능 평가 환경을 구축하고 각 활성화 함수의 평균 보상을 성공률, 에피소드 길이, 자동차 속도와 비교하였다. 그 결과 가장 높은 보상은 GELU를 사용한 경우였고, ELU는 가장 낮았다. 두 활성화 함수의 보상 차이는 35.2%였다.