• Title/Summary/Keyword: 학습강화

Search Result 1,598, Processing Time 0.03 seconds

Control of Walking Robot based on Reinforcement Learning and Manifold Control (강화학습과 메니폴드 제어기법을 이용한 걷는 로봇의 제어)

  • Mun, Yeong-Jun;Park, Ju-Yeong
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2008.04a
    • /
    • pp.135-138
    • /
    • 2008
  • 최근 인간을 모방하는 휴머노이드 로봇(Humanoid robot)에 대한 관심이 증가함에 따라, 기계공학, 생체공학, 제어이론 등 여러 분야에서 관련 연구가 활발히 진행되고 있다. 이에 본 논문에서는 액츄에이터(Actuator)가 없이 경사진 지면을 걸을 수 있는 두 발을 가진 패시브 로봇(Passive robot)을 대상으로 강화학습과 메니폴드(Manifold control) 기법을 사용하여 안정적으로 걸을 수 있도록 제어기(Controller)를 설계하는 방안을 고려한다.

  • PDF

Study on Reinforcement Leaning based Resource Allocation of Cluster-edge Environments (강화학습 기반 클러스티-엣지 자원 할당 연구)

  • Youn, Joosang
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.317-318
    • /
    • 2022
  • 본 논문에서는 클러스터 기반 엣지 모델에서 자원을 효율적으로 사용할 수 있는 지능형 엣지 자원 할당 정책 모델을 제안한다. 최근 쿠버네틱스 기반 클러스터 엣지 시스템 개발 연구 다양한 방향에서 진행 중이다. 따라서, 본 논문에서는 클러스터-엣지 모델 구조를 소개하고 이 모델에서 컴퓨팅 자원을 가진 워커에 컴퓨팅 오프로딩 서비스를 효율적으로 사용할 수 있는 최적의 지능형 클러스터-엣지 컴퓨팅 자원 정책을 생성하는 구조 및 알고리즘을 제안한다.

  • PDF

A Study on Appropriate Inventory of Off-line Store using Time Series and Reinforce Learning (시계열분석과 강화학습을 활용한 오프라인 매장 적정재고 연구)

  • Jin-Kyu Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.436-438
    • /
    • 2023
  • 최근 공급망 이슈로 재고관리의 중요성이 커지는 상황이다. 본 연구에서는 시계열분석과 강화학습을 이용해 오프라인매장의 적정재고를 관리하는 방안을 연구하였다. 연구결과 방안을 활용해 효율적인 재고관리가 가능함을 확인하였다. 향후 온라인 매장으로의 연구확대를 기대한다.

Learning Behavior of Virtual Robot using Compensation Signal (보상신호를 수반하는 가상로봇의 학습행위 연구)

  • Hwang, Su-Chul
    • 전자공학회논문지 IE
    • /
    • v.44 no.3
    • /
    • pp.35-41
    • /
    • 2007
  • In this paper we suggest a model that the virtual robot based on artificial intelligence performs learning with compensation signals and compare the leaning speed of the virtual robot according to the compensation method after applying it to three type environments. As a result our model has showed that positive compensation is superior to hybrid one mixed positive and negative if there are enough time for learning in case of more or less complicated environment with the numerous foods, obstacles and robots. Otherwise hybrid method is better than positive one.

The Electronic Statistical Text with Enhanced Interaction (상호작용 강화를 위한 전자교재의 개선방안과 구현사례)

  • 한범수;한경수;최숙희
    • The Korean Journal of Applied Statistics
    • /
    • v.15 no.2
    • /
    • pp.423-432
    • /
    • 2002
  • Web Based electronic texts are studied on the statistics education fields. In this paper, we discuss the current problems encountered by many statistics electronic texts. We also suggest a new design concept for the Web Based interactive material. In addition, we presented several examples to demonstrate.

Artificial Engine Development through Reinforcement Learning on Jul-Gonu Game (강화학습을 이용한 줄고누게임의 인공엔진개발)

  • Shin, Yong-Woo
    • Journal of Internet Computing and Services
    • /
    • v.10 no.1
    • /
    • pp.93-99
    • /
    • 2009
  • Game program manufacture had been classed by 3D or on-line game etc. simply. But, atomized game programmer's kind now. So, Artificial Intelligence game programmer's role is important. This paper used reinforcement learning algorithm for Jul_Gonu board characters to learn, and so they can move intelligently. To compare a learned character to an random one, a board game was created, and then they fought against each other. As a result, learned character‘s ability was far more improved.

  • PDF

Experimental Analysis of A3C and PPO in the OpenAI Gym Environment (OpenAI Gym 환경에서 A3C와 PPO의 실험적 분석)

  • Hwang, Gyu-Young;Lim, Hyun-Kyo;Heo, Joo-Seong;Han, Youn-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.545-547
    • /
    • 2019
  • Policy Gradient 방식의 학습은 최근 강화학습 분야에서 많이 연구되고 있는 주제로, 본 논문에서는 강화학습을 적용시킬 수 있는 OpenAi Gym 의 'CartPole-v0' 와 'Pendulum-v0' 환경에서 Policy Gradient 방식의 Asynchronous Advantage Actor-Critic (A3C) 알고리즘과 Proximal Policy Optimization (PPO) 알고리즘의 학습 성능을 비교 분석한 결과를 제시한다. 딥러닝 모델 등 두 알고리즘이 동일하게 지닐 수 있는 조건들은 가능한 동일하게 맞추면서 Episode 진행에 따른 Score 변화 과정을 실험하였다. 본 실험을 통해서 두 가지 서로 다른 환경에서 PPO 가 A3C 보다 더 나은 성능을 보임을 확인하였다.

Study on Enhancing Training Efficiency of MARL for Swarm Using Transfer Learning (전이학습을 활용한 군집제어용 강화학습의 효율 향상 방안에 관한 연구)

  • Seulgi Yi;Kwon-Il Kim;Sukmin Yoon
    • Journal of the Korea Institute of Military Science and Technology
    • /
    • v.26 no.4
    • /
    • pp.361-370
    • /
    • 2023
  • Swarm has recently become a critical component of offensive and defensive systems. Multi-agent reinforcement learning(MARL) empowers swarm systems to handle a wide range of scenarios. However, the main challenge lies in MARL's scalability issue - as the number of agents increases, the performance of the learning decreases. In this study, transfer learning is applied to advanced MARL algorithm to resolve the scalability issue. Validation results show that the training efficiency has significantly improved, reducing computational time by 31 %.

In-Context Retrieval-Augmented Korean Language Model (In-Context 검색 증강형 한국어 언어 모델)

  • Sung-Min Lee;Joung Lee;Daeryong Seo;Donghyeon Jeon;Inho Kang;Seung-Hoon Na
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.443-447
    • /
    • 2023
  • 검색 증강형 언어 모델은 입력과 연관된 문서들을 검색하고 텍스트 생성 과정에 통합하여 언어 모델의 생성 능력을 강화한다. 본 논문에서는 사전 학습된 대규모 언어 모델의 추가적인 학습 없이 In-Context 검색 증강으로 한국어 언어 모델의 생성 능력을 강화하고 기존 언어 모델 대비 성능이 증가함을 보인다. 특히 다양한 크기의 사전 학습된 언어 모델을 활용하여 검색 증강 결과를 보여 모든 규모의 사전 학습 모델에서 Perplexity가 크게 개선된 결과를 확인하였다. 또한 오픈 도메인 질의응답(Open-Domain Question Answering) 과업에서도 EM-19, F1-27.8 향상된 결과를 보여 In-Context 검색 증강형 언어 모델의 성능을 입증한다.

  • PDF

Investigating Vocabulary Learning Strategies Instruction in Korean Elementary School English Textbooks (초등학교 5학년 영어 교과서 분석: 어휘학습전략 중심으로)

  • Kim, Keumsun;Im, Hee-Joo
    • The Journal of the Korea Contents Association
    • /
    • v.14 no.4
    • /
    • pp.435-444
    • /
    • 2014
  • As vocabulary acquisition has become one of the emerging key issues in the foreign language education field, interest in vocabulary learning strategies (VLS) has also increased. However, little has been done to investigate the vocabulary learning strategies of young learners. Therefore, this study attempts to investigate VLS use in elementary school English language textbooks. A total of three fifth grade English textbooks and teachers' guidebooks were chosen and analyzed with the vocabulary learning strategies taxonomy suggested by Scbmitt (1997). The researcher identified there were only a limited number of vocabulary learning strategies in the textbooks and most of them were consolidation strategies. It was concluded that a variety of VLS should be introduced in multiple ways in consideration of learner preference, styles, culture and level of English proficiency. Some implications for the teaching and learning of vocabulary for EFL instruction amongst young learners are discussed.