• 제목/요약/키워드: 심층 강화학습

검색결과 108건 처리시간 0.021초

심층 강화학습을 이용한 시변 비례 항법 유도 기법 (Time-varying Proportional Navigation Guidance using Deep Reinforcement Learning)

  • 채혁주;이단일;박수정;최한림;박한솔;안경수
    • 한국군사과학기술학회지
    • /
    • 제23권4호
    • /
    • pp.399-406
    • /
    • 2020
  • In this paper, we propose a time-varying proportional navigation guidance law that determines the proportional navigation gain in real-time according to the operating situation. When intercepting a target, an unidentified evasion strategy causes a loss of optimality. To compensate for this problem, proper proportional navigation gain is derived at every time step by solving an optimal control problem with the inferred evader's strategy. Recently, deep reinforcement learning algorithms are introduced to deal with complex optimal control problem efficiently. We adapt the actor-critic method to build a proportional navigation gain network and the network is trained by the Proximal Policy Optimization(PPO) algorithm to learn an evasion strategy of the target. Numerical experiments show the effectiveness and optimality of the proposed method.

구성주의 지리교육의 실천적 구성을 위한 현장 연구 I (An Action Research for the Practical Construction of the Constructivist Geography Education I)

  • 송언근
    • 대한지리학회지
    • /
    • 제35권4호
    • /
    • pp.565-583
    • /
    • 2000
  • 레지오 접근법을 토대로 한 구성주의적 지리교육이 현실적 적실성을 갖기 위해서는, 첫째, 도식적 언어를 통한 상징적 표상을 지식 구성의 결과가 아닌 과정적 도구로, 또는 토론의 매개체로 전환하여야 한다. 둘째, 주제(선도) 개념을 중심으로 연계성과 위계성을 가진 개념을 조직하고, 이를 토대로 여러 차시의 내용을 연계하여 수업해야한다. 섯째, 개인적 구성보다 사회적 구성이 보다 고차적이고 심층적인 지식 구성을 가능케 한다. 따라서 구성주의 수업은 협동적.토론적인 모습일 때가 바람직하다. 넷째, 수업의 방향성과 학습의 목적성을 위해 안내자, 조력자로서 교사의 역할을 다하여야 한다. 이때 안내는 학습자 스스로 자신의 학습 목적과 방향을 판단하는 매개체로서, 그리고 사고력을 증진시키는 디딤돌로써의 안내이어야 한다. 다섯째. 선행학습에서의 구성과정과 구성맥락을 재 상기시키고, 이를 통해 구서의 지속성과 심층성을 강화하는 나선형적 구성의 절차를 반드시 밟도록 해야 한다.

  • PDF

교원 정보화 역량강화 연수 운영 성과분석 연구 (Result Analysis of Training Programs for Stengthening Teacher's ICT Competency)

  • 서순식;김성완
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권10호
    • /
    • pp.111-120
    • /
    • 2011
  • 이 연구는 교원 정보화 역량강화 연수과정 내용 및 운영에 대한 현황조사 및 연수과정에 대한 온라인 설문조사, 연수과정 운영자 심층면담 등을 토대로 기존 교원 정보화 역량강화 연수의 운영 성과를 분석한 것이다. 이 연구를 바탕으로 차세대 교원 정보화 연수개발을 위한 현 연수과정의 개선방안을 제시하였다. 온라인 설문조사 결과에 따르면, 현행 교원 정보화 역량강화 연수과정은 전체적으로 바람직하게 운영되고 있다고 볼 수 있다. 다만, '사고력 신장을 위한 ICT활용 교육 과정', '미래로 가는 교육 과정', 'ICT활용 문제중심학습 과정'과 같이 보통수준이라고 응답한 비율이 비교적 높은 과정에 대해서는 운영과정의 효과성과 효율성 제고를 위한 노력이 요구된다. 특히 목표의 실천가능성, 수준별 고려여부, 연수 장소 및 교통편 등의 접근성, 맞춤형 수준별 전략 등의 하위평가영역은 타 영역에 비해 낮게 평가되었다. 또한 교원 정보화 역량강화 연수운영자에 대한 심층면담 결과, 이들은 교육현장 요구반영에의 필요성, 강사 재훈련 및 자기계발기회 제공, 지역 전달 연수의 질 관리, 해외 연수사례 국내화 과정에서 특성화, 연수기간의 확대, 연수 후 후속지원의 필요성 등을 제안하였다.

지역사회협력 기반 문헌정보학 캡스톤 교과목 개발과 운영에 관한 연구 - 휴먼라이브러리 프로젝트 수행을 통한 21세기 학습 기술 강화를 중심으로 - (A Study on the Implementation of a Community-based LIS Capstone Course: Developing the 21st Century Skills of Preservice Librarians through Human Library Projects)

  • 이지수
    • 한국문헌정보학회지
    • /
    • 제57권2호
    • /
    • pp.379-408
    • /
    • 2023
  • 본 연구는 C대학교 문헌정보학과에 기개설된 <지역문화정보론> 교과목을 프로젝트 기반 학습법을 활용한 캡스톤디자인 교과목으로 구성하여 운영한 사례에 관한 연구이다. 해당 교과목에서는 지역사회 청소년 특화기관과 연계하여 지역 고등학생들을 대상으로 디지털리터러시 교육을 수행하고 휴먼라이브러리 콘텐츠를 제작하는 프로젝트를 기획하여 진행하였다. 프로젝트에 참여한 수강생 5명과 협력기관 업무담당자 3명과의 반구조화된 심층면담을 수행하여, 지역사회와 연계하여 프로젝트 기반 학습법을 적용한 캡스톤디자인 교과목 개발과 운영의 특징 및 성과를 보고하고 개선점을 제안하였다. 또한, 21세기 학습 프레임워크(P21)를 사용하여 수강생들과의 심층면담 내용을 분석하여, 프로젝트 참여를 통해 수강생들은 P21의 3가지 기술 영역 전반의 11가지 학습 기술-자기주도, 프로젝트관리, 다양한 팀과의 협력, 유연함, 책임감, 리더십(삶과 경력 기술 영역)과 의사소통과 협업, 문제해결력, 창의력, 비판적 사고(학습과 혁신 기술 영역), 그리고 미디어결과물생성 기술(정보미디어테크놀로지 기술 영역)-을 강화했음을 확인했다. 본 사례연구는 지역사회협력에 기반한 문헌정보학 캡스톤디자인 교과목의 개발과 운영에 참고할 수 있는 방향성을 제시하고, 프로젝트 기반 학습법의 적용을 통한 커리큘럼 개발에 관심있는 교수자 및 연구자에게 도움이 되고자 하였다.

증강현실 조합형 마커시스템의 교육효과분석 (Analysis of Educational Effects in Augmented Reality Combined Marker System)

  • 고영남;김종우
    • 정보교육학회논문지
    • /
    • 제16권3호
    • /
    • pp.373-382
    • /
    • 2012
  • 컴퓨팅 기술발달에 따른 새로운 기술을 적용한 다양한 교육용 매체들이 개발되고 있다. 특히, 증강현실 콘텐츠는 학습자의 조작활동을 통한 3차원 입체영상을 제공하여 현실감 있는 정보 제공과 학습 경험을 확장시킬 수 있는 교육매체이다. 본 논문에서는 학습자의 직접적인 조작활동 강화 및 객체 간의 관계 탐구 향상을 위하여, 증강현실 콘텐츠를 증강현실 객체의 조합으로 구성하는 증강현실 조합형 마커시스템을 제작하였다. 교실수업에서 초등교과서 5학년 과학교과의 "지구와 달" 단원의 학습 콘텐츠로 사용하였으며, 학습자의 학습활동을 심층적으로 분석하였다. 개발된 증강현실 조합형 마커시스템을 활용한 수업은 학습자의 학습에 대한 자신감과 주의집중에 유의미한 영향을 주고 있으며, 내재적 만족도를 강화하였고, 특히 학습태도를 긍정적으로 변화시켜서 학업성취도의 주요 요소인 지식과 실천에 유의미한 영향을 주고 있다.

  • PDF

α-특징 지도 스케일링을 이용한 원시파형 화자 인증 (α-feature map scaling for raw waveform speaker verification)

  • 정지원;심혜진;김주호;유하진
    • 한국음향학회지
    • /
    • 제39권5호
    • /
    • pp.441-446
    • /
    • 2020
  • 본 논문은 심층 신경망을 이용한 화자 인증(Speaker Verification, SV) 시스템에서, 심층 신경망 내부에 존재하는 각 특징 지도(Feature Map)들의 분별력을 강화하기 위해 기존 특징 지도 스케일링(Feature Map Scaling, FMS) 기법을 확장한 α-FMS 기법을 제안한다. 기존의 FMS 기법은 특징 지도로부터 스케일 벡터를 구한 뒤, 이를 특징 지도에 더하거나 곱하거나 혹은 두 방식을 차례로 적용한다. 하지만 FMS 기법은 동일한 스케일 벡터를 덧셈과 곱셈 연산에 중복으로 사용할 뿐만 아니라, 스케일 벡터 자체도 sigmoid 비선형 활성 함수를 이용하여 계산되기 때문에 덧셈을 수행할 경우 그 값의 범위가 제한된다는 한계가 존재한다. 본 연구에서는 이러한 한계점을 극복하기 위해 별도의 α라는 학습 파라미터를 특징 지도에 원소 단위로 더한 뒤, 스케일 벡터를 곱하는 방식으로 α-FMS 기법을 설계하였다. 이 때, 제안한 α-FMS 기법은 스칼라 α를 학습하여 특징 지도의 모든 필터에 동일 값을 적용하는 방식과 벡터 α를 학습하여 특징 지도의 각 필터에 서로 다른 값을 적용하는 방식을 각각 적용 후 그 성능을 비교하였다. 두 방식의 α-FMS 모두 심층 심경망 내부의 잔차 연결이 적용된 각 블록 뒤에 적용하였다. 제안한 기법들의 유효성을 검증하기 위해 RawNet2 학습세트를 이용하여 학습시킨 뒤, VoxCeleb1 평가세트를 이용하여 성능을 평가한 결과, 각각 동일 오류율 2.47 %, 2.31 %를 확인하였다.

기계학습을 활용한 도로비탈면관리시스템 데이터 품질강화에 관한 연구 (The Study for Improvement of Data-Quality of Cut-Slope Management System Using Machine Learning)

  • 이세혁;김승현;우용훈;문재필;양인철
    • 지질공학
    • /
    • 제31권1호
    • /
    • pp.31-42
    • /
    • 2021
  • 도로비탈면관리시스템(Cut-Slope Management System, CSMS)은 전국 일반국도 비탈면에 대해 기초·정밀 조사를 바탕으로 데이터베이스를 구축해왔다. 그런데 이러한 데이터는 사람에 의해 기록되기 때문에 데이터 누락 및 오기입 문제가 발생할 수밖에 없다. 본 연구에서는 데이터의 불완전성 문제를 극복하기 위해 여러 머신러닝 기반의 예측모델들을 개발하고 이를 이용한 데이터 품질 강화 가능성을 검토하고자 하였다. 우선 다 범주 문자형 데이터를 수치화하는 과정을 수행하였고, 선정된 데이터 항목들에 대해 다항 로지스틱 회귀분석(Multinomial Logistic Regression)과 심층신경망(Deep-Neural-Network) 기반의 예측모델들을 개발하였다. 그 결과, 심층신경망 모델들의 정확도가 월등히 높은 것으로 나타났다. 향후 개발된 모델들을 활용하여 누락 및 오기입 데이터의 보완이 가능할 것으로 기대된다.

공 던지기 로봇의 정책 예측 심층 강화학습 (Deep Reinforcement Learning of Ball Throwing Robot's Policy Prediction)

  • 강영균;이철수
    • 로봇학회논문지
    • /
    • 제15권4호
    • /
    • pp.398-403
    • /
    • 2020
  • Robot's throwing control is difficult to accurately calculate because of air resistance and rotational inertia, etc. This complexity can be solved by using machine learning. Reinforcement learning using reward function puts limit on adapting to new environment for robots. Therefore, this paper applied deep reinforcement learning using neural network without reward function. Throwing is evaluated as a success or failure. AI network learns by taking the target position and control policy as input and yielding the evaluation as output. Then, the task is carried out by predicting the success probability according to the target location and control policy and searching the policy with the highest probability. Repeating this task can result in performance improvements as data accumulates. And this model can even predict tasks that were not previously attempted which means it is an universally applicable learning model for any new environment. According to the data results from 520 experiments, this learning model guarantees 75% success rate.

MANET에서 종단간 통신지연 최소화를 위한 심층 강화학습 기반 분산 라우팅 알고리즘 (Deep Reinforcement Learning-based Distributed Routing Algorithm for Minimizing End-to-end Delay in MANET)

  • Choi, Yeong-Jun;Seo, Ju-Sung;Hong, Jun-Pyo
    • 한국정보통신학회논문지
    • /
    • 제25권9호
    • /
    • pp.1267-1270
    • /
    • 2021
  • In this paper, we propose a distributed routing algorithm for mobile ad hoc networks (MANET) where mobile devices can be utilized as relays for communication between remote source-destination nodes. The objective of the proposed algorithm is to minimize the end-to-end communication delay caused by transmission failure with deep channel fading. In each hop, the node needs to select the next relaying node by considering a tradeoff relationship between the link stability and forward link distance. Based on such feature, we formulate the problem with partially observable Markov decision process (MDP) and apply deep reinforcement learning to derive effective routing strategy for the formulated MDP. Simulation results show that the proposed algorithm outperforms other baseline schemes in terms of the average end-to-end delay.

고급 심층 강화학습 기법을 이용한 추천 시스템 구현 (Implementation of a Recommendation system using the advanced deep reinforcement learning method)

  • 펭소니;싯소포호트;일홈존;김대영;박두순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.406-409
    • /
    • 2023
  • With the explosion of information, recommendation algorithms are becoming increasingly important in providing people with appropriate content, enhancing their online experience. In this paper, we propose a recommender system using advanced deep reinforcement learning(DRL) techniques. This method is more adaptive and integrative than traditional methods. We selected the MovieLens dataset and employed the precision metric to assess the effectiveness of our algorithm. The result of our implementation outperforms other baseline techniques, delivering better results for Top-N item recommendations.