Q-Learning Policy Design to Speed Up Agent Training (에이전트 학습 속도 향상을 위한 Q-Learning 정책 설계)

  • Yong, Sung-jung;Park, Hyo-gyeong;You, Yeon-hwi;Moon, Il-young
    • Journal of Practical Engineering Education
    • /
    • v.14 no.1
    • /
    • pp.219-224
    • /
    • 2022
  • Q-Learning is a technique widely used as a basic algorithm for reinforcement learning. Q-Learning trains the agent in the direction of maximizing the reward through the greedy action that selects the largest value among the rewards of the actions that can be taken in the current state. In this paper, we studied a policy that can speed up agent training using Q-Learning in Frozen Lake 8×8 grid environment. In addition, the training results of the existing algorithm of Q-learning and the algorithm that gave the attribute 'direction' to agent movement were compared. As a result, it was analyzed that the Q-Learning policy proposed in this paper can significantly increase both the accuracy and training speed compared to the general algorithm.

Understanding of x86 processor architecture (x86 프로세서 이해)

  • Kim, Do Yeon;An, Hyun Su;Jeon, Jae Wook
    • Annual Conference of KIPS
    • /
    • 2020.11a
    • /
    • pp.564-567
    • /
    • 2020
  • 본 논문은 공학계열 학생들이 어셈블리 프로그래밍을 통해 x86 프로세서를 학습하는 교육 과정을 소개한다. 이 교육 과정은 어셈블리 프로그래밍을 통해 가상머신에서 프로그램을 실행시켜 학생들이 전공 교과 과정에서 학습한 마이크로프로세서 이론의 이해를 향상시키도록 도와준다. 작성된 어셈블리 파일은 NASM 을 이용하여 컴파일 되고, VMware 의 Workstation Player 가 컴파일러에 의해 생성된 바이너리 파일을 실행시키기 위해 사용되었다. 교육 과정은 마이크로프로세서 이론 수업에 맞추어 과제가 학생에게 주어지고, 학생들은 이론 수업의 이해를 바탕으로 결과물을 완성하고 이를 직접 시연하여 평가받았다.

A Case Study of Course-Embedded Assessment for Program Outcomes in Computer Science & Information Engineering (컴퓨터·정보공학 분야의 교과기반 학습성과 평가 사례연구)

  • Cho, Soosun
    • Journal of Internet Computing and Services
    • /
    • v.17 no.1
    • /
    • pp.73-81
    • /
    • 2016
  • This paper deals with the practical experience and lessons to develop a method of course-embedded assessment for program outcomes in Computer Science & Information Engineering. In engineering education, ABEEK(Accreditation Board for Engineering Education of Korea) has been nominated as an official accreditation from Korean government under some conditions of fulfillment. One of the conditions is enforcement of course-embedded assessment for program outcomes. In this paper, a method of course-embedded assessment in Computer Science & Information Engineering is suggested. The case study was done in a basic project course which includes the special assessment methods in project courses. The case study of course-embedded assessment in a basic project course was given with consideration for each step, that is, set up of program outcomes which are highly related to the course, selection of assessment tools such as written examination and project-based assessment, set up of assessment criteria, implementation of course-embedded assessment, and analysis of results. The proposed method is expected to be a good example to construct the whole strategy for course-embedded assessment in Computer Science & Information Engineering.

Max-Mean N-step Temporal-Difference Learning Using Multi-Step Return (멀티-스텝 누적 보상을 활용한 Max-Mean N-Step 시간차 학습)

  • Hwang, Gyu-Young;Kim, Ju-Bong;Heo, Joo-Seong;Han, Youn-Hee
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.10 no.5
    • /
    • pp.155-162
    • /
    • 2021
  • n-step TD learning is a combination of Monte Carlo method and one-step TD learning. If appropriate n is selected, n-step TD learning is known as an algorithm that performs better than Monte Carlo method and 1-step TD learning, but it is difficult to select the best values of n. In order to solve the difficulty of selecting the values of n in n-step TD learning, in this paper, using the characteristic that overestimation of Q can improve the performance of initial learning and that all n-step returns have similar values for Q ≈ Q*, we propose a new learning target, which is composed of the maximum and the mean of all k-step returns for 1 ≤ k ≤ n. Finally, in OpenAI Gym's Atari game environment, we compare the proposed algorithm with n-step TD learning and proved that the proposed algorithm is superior to n-step TD learning algorithm.

Requirement Analysis and Design of an Engineering Certification Program, CEA System (공학교육인증프로그램 운영 효과 증진을 위한 CEA시스템의 요구분석 및 설계)

  • Jeon, Ju-Hyun
    • Proceedings of The KACE
    • /
    • 2017.08a
    • /
    • pp.225-226
    • /
    • 2017
  • 이공계 위기론을 해결하기 위해 ABET주도로 시작된 공학교육인증은 우리나라에도 도입되었으며 성과중심교육을 기본철학으로 하는 공학교육인증에서 프로그램 학습성과의 평가는 매우 중요하다. ABEEK에서 강조하고 있는 교과기반평가(Course Embedded Assessment, 이하 CEA)는 그 유용성에도 불구하고 학습성과 연계와 코스 연계 등이 전산시스템으로 지원되지 않아 교육현장에서 잘 반영되지 않는 문제점이 있으며 이로 인해 인증을 위한 자체평가보고서 작성시 PD교수들의 어려움이 있다. 이에 운영자들의 의견을 반영하여 CEA평가 시스템을 구현하기 위한 사용자 권한 중심의 요구분석과 시스템 설계를 진행 하였다.

The Relationship between Voice Recognition Games and Education: Current Research Trends and Future Perspectives (음성인식 게임과 교육의 연관성: 현재 연구 동향과 전망)

  • Se Jeong Heo;Sung Jin Kim;Young Hyun Yoon;Jai Soon Baek
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.397-398
    • /
    • 2023
  • 본 논문은 음성인식 기술을 활용한 게임과 교육 분야의 연계성에 대한 연구를 제시한다. 음성인식 게임은 사용자의 음성 명령을 인식하고 상호작용을 가능하게 함으로써 학습자의 참여와 흥미를 유발한다. 관련 연구들은 음성인식 게임이 언어 학습, 수학 학습, 학습 장애 학생 지원 등 다양한 교육 분야에서 효과적으로 활용될 수 있다는 것을 보여준다. 음성인식 게임은 교육 환경에서의 음성인식 기술의 잠재력을 제시하며, 추가 연구가 필요하다는 결론을 도출한다.

The value and direction of robot education in the elementary school curriculum (초등학교 교육과정에서의 로봇교육의 가치와 방향)

  • Seo, YoungMin;Lee, YoungJun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.07a
    • /
    • pp.155-158
    • /
    • 2012
  • 본 논문에서는 초등학교 정규교육과정에서 다루고 있는 로봇교육으로서 2011년 고시 초등학교 교육과정의 실과 교육과정 5-6학년의 (생활과 전기, 전자) 단원에서의 로봇교육과 교사 로봇 연구대회에서 발표한 로봇교육 지도안의 몇 가지 사례들을 살펴보고, 초등학교 교육과정에서 로봇교육이 어떠한 가치를 지니고, 어떠한 방향으로 이루어져야 하는지에 대한 프레임을 제공하는 것을 목적으로 한다. 위에서 언급한 사례들은 로봇의 작동 원리와 센서 등 공학적 측면을 강조하고 있다. 하지만 이것은 로봇교육이 지니는 다양한 장점 중 극히 일부분에 지나지 않는다. 주어진 매뉴얼을 통하여 수행되는 최소한의 공학적 이해 수준을 가리키는 것을 넘어 문제해결 및 알고리즘을 수행할 수 있는 물리적 객체로서의 인식의 전환이 필요하다. 또한 로봇이 정규교육과정 속에서 수행되기 어려운 한계점을 제시하고 이를 극복하기 위한 방안을 모색해보고자 한다.

Cloud Computing-based Computer Education System (클라우드 컴퓨팅 기반 컴퓨터 교육 시스템)

  • Shin, Eun-Joo;Lee, Bong-Hwan
    • Annual Conference of KIPS
    • /
    • 2010.11a
    • /
    • pp.1691-1693
    • /
    • 2010
  • 본 논문에서는 OpenNebula 기반의 클라우드 컴퓨팅 환경을 구축하고 클러스터 노드에 설치되는 하이퍼바이저로 Xen을 이용하여 클라우드 컴퓨팅 기반 컴퓨터 교육 시스템을 구축하였다. 전체 시스템은 Front-End 1대와 클러스터 노드 2대로 구성되며, 시스템 사용자는 원격 접속을 이용하여 가상 머신에 접근이 가능하다. 관리자는 Web를 통해 클러스터 노드와 가상 머신을 관리할 수 있으며, 컴퓨터 실습수업의 형태에 따라 각기 다른 OS와 응용 소프트웨어가 설치된 가상머신을 생성하여 사용자들에게 제공할 수 있다.

Development of Software Education Products Based on Physical Computing (피지컬 컴퓨팅 기반 소프트웨어 교육용 제품 개발)

  • Kim, Eung-Kon
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.14 no.3
    • /
    • pp.595-600
    • /
    • 2019
  • Educational tools for infants and younger students are becoming smarter as ICT-based digital technology convergence extends according to the development of technology. As the digital interaction function of smart education tools gives students greater immersion and fun, a learning might become a play to the students. The technologies used in the implementation of smart education tools come from the disciplines of robotics, computer engineering, programming, and engineering and mathematical foundations and these can be integrated into the field of education itself. This paper designs and implements a product based on optimized physical computing for R&D and education in consideration of the characteristics of educational tool robots used in the field education. It was developed to enable physical education for sensing information processing, software design and programming practice training that is the basis of robot system.

PESAA - Computer Assisted English Speaking Training system (PESAA - 컴퓨터 보조 영어 말하기 훈련 시스템)

  • Bang, Jeesoo;Lee, Jonghoon;Kang, Sechun;Lee, Geunbae Gary
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.73-76
    • /
    • 2012
  • 영어 교육의 필요성이 증가하고 그에 대한 수요가 늘어남에 따라 컴퓨터를 이용한 외국어 교육 시스템이 개인적인 영어 교육방법으로 소개되고 있다. 새로운 외국어를 접할 때 습득하기 어려운 부분 중 하나가 발음이고, 발음이 외국어 말하기 실력에 중요한 요소이기 때문에 특별한 훈련이 필요하다. 본 논문에서는 이러한 문제점에 대하여 충분히 인지하고 외국어 발음 향상에 도움을 주기 위하여 컴퓨터 보조 발음 훈련시스템을 개발하였다. 본 시스템은 발음 훈련과 억앙 훈련, 즉 문장 강세 훈련과 끊어 읽기 훈련을 포함하며, 사용자의 발화에 대해 적절한 평가와 피드백을 제공한다. 본 논문에서는 발음 훈련 시스템의 구성요소와 동작에 대하여 중점적으로 기술하였다.

