• 제목/요약/키워드: Q learning

검색결과 426건 처리시간 0.026초

Balancing a seesaw with reinforcement learning

  • Tengis, Ts.;Uurtsaikh, L.;Batminkh, A.
    • International Journal of Advanced Culture Technology
    • /
    • 제8권4호
    • /
    • pp.51-57
    • /
    • 2020
  • A propeller-based seesaw system is a system that can represent one of axis of four propeller drones and its stabilization has been replaced by intelligent control system instead of often used control methods such as PID and state space. Today, robots are increasingly use machine learning methods to adapt to their environment and learn to perform the right actions. In this article, we propose a Q-learning-based approach to control the stability of a seesaw system with a propeller. From the experimental results that it is possible to fully learn the balance control of a seesaw system by correctly defining the state of the system, the actions to be performed, and the reward functions. Our proposed method solves the seesaw stabilization.

공학교육을 위한 블렌디드 러닝의 운영사례 및 교육효과 연구 (A Case Study on Educational Effect and Operation of Blended Learning for Engineering Education)

  • 박형근
    • 실천공학교육논문지
    • /
    • 제15권1호
    • /
    • pp.39-44
    • /
    • 2023
  • 이러닝 교수법의 발전에 따라 대면교육과 이러닝을 혼합한 블렌디드 러닝의 요구가 높아지고 있으며 기존의 대면수업을 대체할 만한 학습효과를 보여주고 있다. 그러나 공학 교과목은 실습과 같은 다양한 학습활동이 이루어지고 있어 기존의 전통적인 블렌디드 러닝으로 운영하기 쉽지 않다. 따라서 공학 교과목에 필요한 학습활동에 따라 기존과는 다른 교수학습설계가 필요로 된다. 본 논문에서는 공학교과목에서 블렌디드 러닝을 위해 교수법 설계 및 운영사례를 소개하고 그 효과를 조사 분석하였다. 학습활동을 이론수업, 실습수업, 퀴즈 및 질의응답, 과제수행 및 풀이 등으로 세분화하고 학습활동에 따라 온라인 동영상, LMS 활용, 대면수업의 교수 학습방법을 적용하였다. 학생들의 수업만족도 조사결과를 보면 공학교과목에서도 블렌디드 러닝은 순수온라인과 대면수업에 비해 만족도가 높게 나타났으며 학습활동별로 차별화된 만족도를 나타내었다.

다감각놀이치료 프로그램이 ADHD 아동의 주의집중력과 학습에 미치는 영향 (Effect of a Multi-Sensory Play Therapy Program on the Attention and Learning of Children with ADHD)

  • 오혜원;김고운
    • 대한통합의학회지
    • /
    • 제7권4호
    • /
    • pp.23-32
    • /
    • 2019
  • Purpose : The purpose of this study was to evaluate the effects of multi-sensory treatment programs on attention and learning in ADHD children. Methods : The program was provided for 50 minutes twice a week for a total of 12 times over 6 weeks. The FAIR concentration test was used to identify the children's concentration of attention before and after the intervention. The children's learning ability was evaluated using K-ABC. Results : When attention was evaluated using FAIR, there was a significant increase in all dependencies of performance value (P), quality value (Q), and continuity value (C) (p>.05). In addition, when learning ability was evaluated using K-ABC, learning ability in general increased significantly (p>.05). The multi-sensory play therapy program had a positive effect on the children's attention and learning ability and thus it is a positive intervention method for children with ADHD. Conclusion : In addition to providing challenging activities, the program showed that it was possible to elicit the children's interest by engaging a variety of senses at the same time. This is believed to have motivated them internally to engage actively in the program.

A3C 기반의 강화학습을 사용한 DASH 시스템 (A DASH System Using the A3C-based Deep Reinforcement Learning)

  • 최민제;임경식
    • 대한임베디드공학회논문지
    • /
    • 제17권5호
    • /
    • pp.297-307
    • /
    • 2022
  • The simple procedural segment selection algorithm commonly used in Dynamic Adaptive Streaming over HTTP (DASH) reveals severe weakness to provide high-quality streaming services in the integrated mobile networks of various wired and wireless links. A major issue could be how to properly cope with dynamically changing underlying network conditions. The key to meet it should be to make the segment selection algorithm much more adaptive to fluctuation of network traffics. This paper presents a system architecture that replaces the existing procedural segment selection algorithm with a deep reinforcement learning algorithm based on the Asynchronous Advantage Actor-Critic (A3C). The distributed A3C-based deep learning server is designed and implemented to allow multiple clients in different network conditions to stream videos simultaneously, collect learning data quickly, and learn asynchronously, resulting in greatly improved learning speed as the number of video clients increases. The performance analysis shows that the proposed algorithm outperforms both the conventional DASH algorithm and the Deep Q-Network algorithm in terms of the user's quality of experience and the speed of deep learning.

딥 러닝을 이용한 자동 댓글 생성에 관한 연구 (A Study on Automatic Comment Generation Using Deep Learning)

  • 최재용;성소윤;김경철
    • 한국게임학회 논문지
    • /
    • 제18권5호
    • /
    • pp.83-92
    • /
    • 2018
  • 최근 다수의 분야에서 딥 러닝을 통한 연구 성과들이 사람의 판단력에 근접하는 결과를 보여주고 있다. 그리고 게임 산업에서는 온라인 커뮤니티, SNS의 활성화가 게임 흥행 여부를 결정할 정도로 중요성이 높아지고 있다. 본 연구는 딥 러닝을 이용해 온라인 커뮤니티, SNS에서 활동할 수 있는 시스템을 구성하고, 온라인 공간에서 사람들이 작성한 텍스트를 읽고 그에 대한 반응을 생성하고 스케쥴에 따라 트위터에 올리는 것을 목표로 한다. 순환 신경망(Recurrent Neural Network)을 이용해 텍스트를 생성하고 글 작성 스케쥴을 생성하는 모델들을 구성했고, 생성한 시각에 맞춰 모델들에 뉴스 제목을 입력해 댓글을 출력 받고 트위터에 작성하는 프로그램을 구현했다. 본 연구결과는 온라인 게임 커뮤니티 활성화, Q&A 서비스 등에 적용이 가능할 것으로 예상된다.

인지무선 에드혹 네트워크를 위한 강화학습기반의 멀티채널 MAC 프로토콜 (Reinforcement Learning based Multi-Channel MAC Protocol for Cognitive Radio Ad-hoc Networks)

  • 박형근
    • 한국정보통신학회논문지
    • /
    • 제26권7호
    • /
    • pp.1026-1031
    • /
    • 2022
  • 인지무선 에드혹 네트워크 (CRAHN : Cognitive Radio Ad-Hoc Networks)는 무선 서비스의 증가에 따른 주파수 자원부족을 극복할 수 있는 네트워크 기술이다. CRANH에서 주 사용자에 대한 간섭을 회피하기 위해 유휴채널을 확인하는 채널센싱이 필요하며, 주 사용자 출현시 빠른 유휴 채널선택을 통해 핸드오버로 인한 시간지연을 최소화 해야한다. 본 연구에서는 강화학습을 이용하여 CRANH에서 부 사용자의 채널 센싱의 대상을 축소하고 유휴채널의 가능성이 높은 채널을 우선적으로 센싱하도록함으로써 전송효율을 개선하였다. 또한 주기적인 센싱을 수행하지 않고 데이터의 전송시점에 채널을 센싱함으로써 센싱시점과 데이터 전송시점간의 차이로 인한 주 사용자와의 충돌가능성을 최소화할 수 있는 멀티채널 매체접근제어(MAC: Medium Access Control) 프로토콜을 제안하고 시뮬레이션을 통해 그 성능을 분석하였다.

Q-ILC를 이용한 액체추진제로켓엔진의 추력 및 혼합비 제어 (Thrust and Mixtrue Control of Liquid Propellant Rocket Engine using Q-ILC)

  • 정영석;임석희;조기주;오승협
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 2006년도 제27회 추계학술대회논문집
    • /
    • pp.139-145
    • /
    • 2006
  • 액체추진제로켓엔진(LRE)은 로켓의 궤도 및 동특성 제어에 있어서 가장 중용한 부분 중 하나이다. LRE 제어 목적은 주어진 추력 궤도에 맞추어 추력을 조절하는 것과 주연소실과 가스발생기 내의 연소가스의 온도가 일정 범위를 넘어가지 않도록 추진제의 혼합비를 일정하게 유지시키는 것이다. 이런 제어 목적을 가진 LRE는 LRE를 구성하고 있는 구성품 간의 상호간섭에 의하여 다중제어가 쉽게 이루어지지 않는다. 본 연구에서는 LRE에 대한 동특성 모델을 구성하였으며 PID 제어와 PID+Q-ILC 제어로직을 적용한 결과에 대해 해석하였다. 전산모사 결과, PID 제어 보다 PID+Q-ILC 제어 방식을 적용할 경우 오차를 더욱 더 줄일 수 있는 것을 확인하였다.

  • PDF

이공계 졸업생의 좋은 대학에 대한 주관적 인식 유형 분석 (Analysis of Subjectivity on Good Universities of Science and Engineering Graduates)

  • 홍성연
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.445-457
    • /
    • 2022
  • 학생 중심을 표방하는 대학이 늘고 있으나, 학생들이 생각하는 좋은 대학이 어떠한 모습인지는 분명하지 않다. 이 연구는 좋은 대학의 여러 특성 중 학생에 따라 어떤 것을 중요하게 생각하는지 밝히는 것을 목적으로 한다. 이를 위해 인간의 주관적 인식에 대한 연구방법인 Q 방법론을 활용하여, 이공계열 졸업생의 좋은 대학에 대한 인식을 유형화하고, 각 유형별로 학생들의 교육 경험의 차이를 살펴보았다. Q 방법론의 연구절차에 따라서 선행 연구와 대학의 질 관리 기준에 기초하여 29개의 진술문을 개발하고, 사회진출에 성공한 이공계열 졸업생 16명에게 진술문을 Q 표본 배열표에 맞게 분류하도록 하였다. 진술문의 선호도에 따라 참여자들은 세 유형으로 분류되었다. 학생 경험 중심형인 제1유형은 학생이 교내외 다양한 활동과 경험에 참여하도록 장려하고 지원하는 대학을 좋은 대학이라 인식했다. 대학 성과 중심형인 제2유형은 취업률, 연구성과, 입학 성적과 같은 지표를 보고 좋은 대학을 판단했다. 교육 활동 중심형인 제3유형은 대학을 하나의 공동체로 인식하며 교수와 학습의 질을 중요하게 여겼다. 이 연구는 학생의 입장에서 좋은 대학에 대한 상대적인 인식 차이를 분석했다는 점에 의미가 있다. 마지막으로 연구 결과를 기반으로 대학의 질 관리와 개선을 위한 제언을 추가하였다.

자기주도적 학습을 위한 전략형 Q&A 시스템 (A strategic Q&A system for self-directed study)

  • 이해복;김갑수
    • 정보교육학회논문지
    • /
    • 제6권1호
    • /
    • pp.13-29
    • /
    • 2002
  • 수학의 교육과정이 새롭게 난이도별로 구성되어 아동의 수준에 따른 교육과정 편성과 운영을 하도록 개정되었다. 위계성이 분명한 수학교과의 특성상 선행학습이 이루어진 정도에 따라 후속학습이 좌우되는 특성을 가진다. 여기에 현행학습의 과정을 학습함에 있어 아동의 이해를 돕고 문제해결의 방향을 선택하게 하여 다양한 해결전략을 경험하게 하는 것은 보다 나은 문제해결과 정확한 진단을 위한 기본이 될 수 있다. 이 전략형 Q&A 시스템은 주제별 해결유형을 제시하고 선택하도록 하여 학습의 장애요인을 줄이고 보다 효율적인 수학학습을 돕도록 설계하고 있다. 이를 통하여 여러 수준의 문제 및 학습내용을 해결할 수 있는 수학적 능력을 갖게 될 것이고 궁극적으로 학습목표에 도달할 수 있게 된다.

  • PDF

Systematic review of the clinical and genetic aspects of Prader-Willi syndrome

  • Jin, Dong-Kyu
    • Clinical and Experimental Pediatrics
    • /
    • 제54권2호
    • /
    • pp.55-63
    • /
    • 2011
  • Prader-Willi syndrome (PWS) is a complex multisystem genetic disorder that is caused by the lack of expression of paternally inherited imprinted genes on chromosome 15q11-q13. This syndrome has a characteristic phenotype including severe neonatal hypotonia, early-onset hyperphagia, development of morbid obesity, short stature, hypogonadism, learning disabilities, behavioral problems, and psychiatric problems. PWS is an example of a genetic condition caused by genomic imprinting. It can occur via 3 main mechanisms that lead to the absence of expression of paternally inherited genes in the 15q11.2-q13 region: paternal microdeletion, maternal uniparental disomy, and an imprinting defect. Over 99% of PWS cases can be diagnosed using DNA methylation analysis. Early diagnosis of PWS is important for effective long-term management. Growth hormone (GH) treatment improves the growth, physical phenotype, and body composition of patients with PWS. In recent years, GH treatment in infants has been shown to have beneficial effects on the growth and neurological development of patients diagnosed during infancy. There is a clear need for an integrated multidisciplinary approach to facilitate early diagnosis and optimize management to improve quality of life, prevent complications, and prolong life expectancy in patients with PWS.