• 제목/요약/키워드: 심층 강화학습

검색결과 108건 처리시간 0.024초

심층 신경망 기반 대화처리 기술 동향 (Trends in Deep-neural-network-based Dialogue Systems)

  • 권오욱;홍택규;황금하;노윤형;최승권;김화연;김영길;이윤근
    • 전자통신동향분석
    • /
    • 제34권4호
    • /
    • pp.55-64
    • /
    • 2019
  • In this study, we introduce trends in neural-network-based deep learning research applied to dialogue systems. Recently, end-to-end trainable goal-oriented dialogue systems using long short-term memory, sequence-to-sequence models, among others, have been studied to overcome the difficulties of domain adaptation and error recognition and recovery in traditional pipeline goal-oriented dialogue systems. In addition, some research has been conducted on applying reinforcement learning to end-to-end trainable goal-oriented dialogue systems to learn dialogue strategies that do not appear in training corpora. Recent neural network models for end-to-end trainable chit-chat systems have been improved using dialogue context as well as personal and topic information to produce a more natural human conversation. Unlike previous studies that have applied different approaches to goal-oriented dialogue systems and chit-chat systems respectively, recent studies have attempted to apply end-to-end trainable approaches based on deep neural networks in common to them. Acquiring dialogue corpora for training is now necessary. Therefore, future research will focus on easily and cheaply acquiring dialogue corpora and training with small annotated dialogue corpora and/or large raw dialogues.

기초학습능력 부진학생을 위한 기초역학 분야 기초학력강화 사례 연구 (A Case Study on Basic Learning Ability Achievement in the Field of Basic Mechanics for Students with Poor Basic Learning Ability)

  • 이종길
    • 실천공학교육논문지
    • /
    • 제10권2호
    • /
    • pp.95-102
    • /
    • 2018
  • 대학 공학계열 신입생들 중 많은 학생들이 기초학력 저하로 전공과목 수강에 어려움을 겪고 있으며 이는 대학 수준에 관계 없이 전국의 모든 대학에서 나타나는 현실이기도 하다. 이러한 학습부진과 기초학력 저하를 해결하기 위하여 본 연구에서는 A대학에서 기계공학을 전공하려는 학생들 중 기초역학에 대한 학습능력이 부족한 학생들을 대상으로 기초학력강화 프로그램을 운영하고 사전 및 사후 검사 결과를 통하여 그 실효성을 확인하고 설문조사를 통하여 만족도를 조사하였다. 사전 사후 검사 결과 A집단에서는 평균 40.1% 향상되었으며 B집단에서는 평균 18.9% 향상된 것으로 조사되었다. 프로그램 이수 후 실시한 만족도 조사 및 심층 면담 결과 기초학력강화 프로그램은 전체 평균 90.6%(4.53/5.0)의 높은 만족도를 나타내어 전공 과목에 대한 흥미와 학업에 대한 자신감을 높이는데 기여 했을 뿐 아니라 교수와 참여 학생과의 긍정적인 관계 형성에 큰 도움을 준 유용한 프로그램임을 확인하였다.

딥러닝을 활용한 도시가스배관의 전기방식(Cathodic Protection) 정류기 제어에 관한 연구 (A Study on Cathodic Protection Rectifier Control of City Gas Pipes using Deep Learning)

  • 이형민;임근택;조규선
    • 한국가스학회지
    • /
    • 제27권2호
    • /
    • pp.49-56
    • /
    • 2023
  • 4차 산업혁명으로 인공지능(AI, Artificial Intelligence) 관련 기술이 고도로 성장함에 따라 여러 분야에서 AI를 접목하는 사례가 증가하고 있다. 주요 원인은 정보통신기술이 발달됨에 따라 기하급수적으로 증가하는 데이터를 사람이 직접 처리·분석하는데 현실적인 한계가 있고, 새로운 기술을 적용하여 휴먼 에러에 대한 리스크도 감소시킬 수 있기 때문이다. 이번 연구에서는 '원격 전위 측정용터미널(T/B, Test Box)'로부터 수신된 데이터와 해당시점의 '원격 정류기' 출력을 수집 후, AI가 학습하도록 하였다. AI의 학습 데이터는 최초 수집된 데이터의 회기분석을 통한 데이터 전처리로 확보하였고, 학습모델은 심층 강화학습(DRL, Deep Reinforce-ment Learning) 알고리즘 중(中) Value기반의 Q-Learning모델이 적용하였다. 데이터 학습이 완료된 AI는 실제 도시가스 공급지역에 투입하여, 수신된 원격T/B 데이터를 기반으로 AI가 적절하게 대응하는지 검증하고, 이를 통해 향후 AI가 전기방식 관리에 적합한 수단으로 활용될 수 있는지 검증하고자 한다.

코칭기법을 활용한 문해교육프로그램 개발 및 적용 (Development and Application of Literacy Education program using Coaching methods)

  • 양복이;김진숙
    • 문화기술의 융합
    • /
    • 제7권3호
    • /
    • pp.261-268
    • /
    • 2021
  • 본 연구는 코칭기법을 활용한 문해교육프로그램을 개발, 문해학습자에게 적용한 후 학습성취도 향상에 어떠한 영향이 있는지 알아보기 위해 U시의 노인복지관 문해교육학습자 13명을 선정하여 심층면담과 관찰일지, 학습자료를 토대로 분석하는 질적연구방법을 선택하였다. 코칭기법을 활용한 문해교육프로그램은 마음열기, 긍정성 도입, 학습역량 강화 및 조력, 자신감 및 지속성 강화의 4단계 과정으로 구성된 프로세스중심 모델로 연구결과는 첫째, 1단계에서 교수자와 학습자와의 커뮤니케이션이 확장되었고, 둘째, 2단계에서는 긍정적인 마인드를 형성하여 자기주도학습력이 강화되는 결과를 보여주었다. 셋째, 3단계 균형 문해교수법과 상호작용교수법을 활용한 결과 읽고 쓰는 것에 자신감을 획득하여 자기효능감 상승효과로 이어졌다. 넷째, 4단계는 적극적인 칭찬과 지속적인 격려로 학습에 대한 두려움을 이기고 상급과정에 대한 희망을 내포하게 하는 학습성취도 향상의 결과를 보여주었다. 이상의 연구결과로 코칭기법을 활용한 문해교육프로그램은 문해교육 현장에서 학습자를 위한 교육방법으로 유용하게 활용될 수 있다고 본다.

가상환경과 DDPG 알고리즘을 이용한 자율 비행체의 소노부이 최적 배치 연구 (Research on Optimal Deployment of Sonobuoy for Autonomous Aerial Vehicles Using Virtual Environment and DDPG Algorithm)

  • 김종인;한민석
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권2호
    • /
    • pp.152-163
    • /
    • 2022
  • 본 논문에서는 대잠전의 필수 요소인 소노부이를 무인항공기가 최적의 배치로 투하할 수 있게 하는 방법을 제시한다. 이를 위해 Unity 게임엔진을 통해 음향 탐지 성능 분포도를 모사한 환경을 구성하고 Unity ML-Agents를 활용해 직접 구성한 환경과 외부에서 Python으로 작성한 강화학습 알고리즘이 서로 통신을 주고받으며 학습할 수 있게 하였다. 특히, 잘못된 행동이 누적되어 학습에 영향을 미치는 경우를 방지하고 비행체가 목표지점으로 최단 시간에 비행함과 동시에 소노부이가 최대 탐지 영역을 확보하기 위해 강화학습을 도입하고. 심층 확정적 정책 그래디언트(Deep Deterministic Policy Gradient: DDPG) 알고리즘을 적용하여 소노부이의 최적 배치를 달성하였다. 학습 결과 에이전트가 해역을 비행하며 70개의 타겟 후보들 중 최적 배치를 달성하기 위한 지점들만을 통과하였고 탐지 영역을 확보한 모습을 보면 겹치는 영역 없이 최단 거리에 있는 지점을 따라 비행하였음을 알 수 있다. 이는 최적 배치의 요건인 최단 시간, 최대 탐지 영역으로 소노부이를 배치하는 자율 비행체를 구현하였음을 의미한다.

작업 준비비용 최소화를 고려한 강화학습 기반의 실시간 일정계획 수립기법 (Real-Time Scheduling Scheme based on Reinforcement Learning Considering Minimizing Setup Cost)

  • 유우식;김성재;김관호
    • 한국전자거래학회지
    • /
    • 제25권2호
    • /
    • pp.15-27
    • /
    • 2020
  • 본 연구는 일정계획을 위한 간트 차트(Gantt Chart) 생성과정을 세로로 세우면 일자형만 존재하는 테트리스(Tetris) 게임과 유사하다는 아이디어에서 출발하였다. 테트리스 게임에서 X축은 M개의 설비(Machine)들이 되고 Y축은 시간이 된다. 모든 설비에서 모든 종류(Type)의 주문은 분리 없이 작업 가능하나 작업물 종류가 다를 경우에는 시간지체 없이 작업 준비비용(SetupCost)이 발생한다는 가정이다. 본 연구에서는 앞에서 설명한 게임을 간트리스(Gantris)라 명명하고 게임환경을 구현 하였으며, 심층 강화학습을 통해서 학습한 인공지능이 실시간 스케줄링한 일정계획과 인간이 실시간으로 게임을 통해 수립한 일정계획을 비교하였다. 비교연구에서 학습환경은 단일 주문목록 학습환경과 임의 주문목록 학습환경에서 학습하였다. 본 연구에서 수행한 비교대상 시스템은 두 가지로 4개의 머신(Machine)-2개의 주문 종류(Type)가 있는 시스템(4M2T)과 10개의 머신-6개의 주문종류가 있는 시스템(10M6T)이다. 생성된 일정계획의 성능지표로는 100개의 주문을 처리하는데 발생하는 Setup Cost, 총 소요 생산시간(makespan)과 유휴가공시간(idle time)의 가중합이 활용되었다. 비교연구 결과 4M2T 시스템에서는 학습환경에 관계없이 학습된 시스템이 실험자보다 성능지표가 우수한 일정계획을 생성하였다. 10M6T 시스템의 경우 제안한 시스템이 단일 학습환경에서는 실험자보다 우수한 성능 지표의 일정계획을 생성하였으나 임의 학습환경에서는 실험자보다 부진한 성능지표를 보였다. 그러나 job Change 횟수 비교에서는 학습시스템이 4M2T, 10M6T 모두 사람보다 적은 결과를 나타내어 우수한 스케줄링 성능을 보였다.

2015 개정 교육과정 운영 실태 분석을 통한 대학 입시 방향 연구: 전문가 심층 인터뷰를 중심으로 (Study on the Direction of College Admission through the Analysis of the 2015 Revised Curriculum : Focused on In-depth Interview with Experts)

  • 백민경;백광호;이제영
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.422-434
    • /
    • 2020
  • 본 연구는 2015 개정 교육과정에 따른 문·이과 통합 교육과정의 운영 실태를 파악하여, 대학에서 강화 혹은 반영해야 할 전형 유형에 대한 분석과 입시 방향을 제시하는 것을 목적으로 한다. 이를 위해, 5명의 교육과정 전문가를 대상으로 운영 실태에 대한 심층 인터뷰를 실시하였다. 심층 인터뷰 결과, 고교 생활의 내면을 들여다볼 수 있는 전형 도입과 명료한 입학전형 설계가 필요하며, 학생 선발 지표의 구체적인 기준 마련, 학습 활동과 관련된 심층 면접 확대, 평가역량 강화, 평가인력 충원 등이 요구됨을 알 수 있었다. 또한 2015 개정 교육과정 활성화를 위해 학생부 종합 전형과 교과 전형을 확대시키기 위해서는 학생들이 얼마나 다양한 과목, 진로에 적합한 과목들을 내실 있게 수강했는지를 평가할 필요가 있다. 이를 위해 지속적이고 적극적 역할 수행을 파악할 수 있는 대학만의 평가요소 및 평가 기준을 추출하고, 이를 객관적으로 판단할 수 있는 전형 설계가 요구된다. 이러한 연구 결과는 향후 공교육 활성화를 위한 대입 전형 정착에 기여함과 동시에, 대학에서 원하는 인재 선발을 위한 기초 자료로 활용될 것으로 기대한다.

AI기반 교량설계 프로세스 자동화를 위한 강화학습 알고리즘과 외부 해석프로그램 간 인터페이스 구축 (Interface Establishment between Reinforcement Learning Algorithm and External Analysis Program for AI-based Automation of Bridge Design Process)

  • 김민수;최상현
    • 한국전산구조공학회논문집
    • /
    • 제34권6호
    • /
    • pp.403-408
    • /
    • 2021
  • 현재 교량과 같은 토목구조물의 설계프로세스는 1차 설계 후 구조 검토를 수행하여 기준에 부적합할 경우 재설계하는 과정을 반복하여 최종적인 성과품을 만드는 것이 일반적이다. 이러한 반복 과정은 설계에 소요되는 기간을 연장시키는 원인이 되며, 보다 수준 높은 설계를 위해 투입되어야 할 고급 엔지니어링 인력을 기계적인 단순 반복 작업에 소모하고 있다. 이러한 문제는 설계 과정 자동화를 통하여 해결할 수 있으나, 설계 과정에서 사용되는 해석프로그램은 이러한 자동화에 가장 큰 장애요인이 되어 왔다. 본 연구에서는 기존 설계 과정 중 반복작업을 대체하고자 강화학습 알고리즘과 외부 해석프로그램을 함께 제어할 수 있는 인터페이스를 포함한 교량설계 프로세스에 대한 AI기반 자동화 시스템을 구축하였다. 이 연구를 통하여 구축된 시스템의 프로토타입은 2경간 RC라멘교를 대상으로 제작하였다. 개발된 인터페이스 체계는 향후 최신 AI 및 타 형식의 교량설계 간 연계를 위한 기초기술로써 활용될 수 있을 것으로 판단된다.

심층 결정론적 정책 경사법을 이용한 선박 충돌 회피 경로 결정 (Determination of Ship Collision Avoidance Path using Deep Deterministic Policy Gradient Algorithm)

  • 김동함;이성욱;남종호;요시타카 후루카와
    • 대한조선학회논문집
    • /
    • 제56권1호
    • /
    • pp.58-65
    • /
    • 2019
  • The stability, reliability and efficiency of a smart ship are important issues as the interest in an autonomous ship has recently been high. An automatic collision avoidance system is an essential function of an autonomous ship. This system detects the possibility of collision and automatically takes avoidance actions in consideration of economy and safety. In order to construct an automatic collision avoidance system using reinforcement learning, in this work, the sequential decision problem of ship collision is mathematically formulated through a Markov Decision Process (MDP). A reinforcement learning environment is constructed based on the ship maneuvering equations, and then the three key components (state, action, and reward) of MDP are defined. The state uses parameters of the relationship between own-ship and target-ship, the action is the vertical distance away from the target course, and the reward is defined as a function considering safety and economics. In order to solve the sequential decision problem, the Deep Deterministic Policy Gradient (DDPG) algorithm which can express continuous action space and search an optimal action policy is utilized. The collision avoidance system is then tested assuming the $90^{\circ}$intersection encounter situation and yields a satisfactory result.

성인학습자의 자신감 향상을 위한 융합프로그램 진행 경험에 관한 사례연구 (A Case Study on Adult Learners' Performance Experience of Convergence Program for Self-Confidence Improvement)

  • 박선희
    • 사물인터넷융복합논문지
    • /
    • 제8권4호
    • /
    • pp.49-55
    • /
    • 2022
  • 본 연구는 성인학습자가 주간보호센터 이용 성인 뇌병변 장애인 대상으로 자신감 향상을 위한 융합프로그램 진행 경험의 의미와 본질이 어떤 것인지 파악하고자 질적연구로 사례연구 방법을 활용하여 분석하였다. 본 연구는 뇌병변 장애인 대상으로 자신감 향상을 위한 융합프로그램 진행 경험한 3명의 성인학습자를 심층 면담을 통해 자료 수집하였다. 이 프로그램은 총 5회기로 90분씩 진행하였고 자료 분석으로 구성된 의미 24개, 하위주제 6개, 상위주제 3개로 범주화하여 도출하였다. 그 결과는 첫째, 성인 뇌병변 장애인 대상 자신감 향상을 위한 융합프로그램 진행 경험이 처음이라 '시작의 긴장감'으로 범주화하여 도출하였다. 둘째, 성인학습자들이 성인 뇌병변 장애인 대상으로 자신감 향상을 위한 융합프로그램 진행하면서 자신, 가족, 이웃 사랑하는 마음이 생겨 '함께하는 즐거움'으로 범주화로 도출하였다. 셋째, 자신감 향상을 위한 융합프로그램을 성인 뇌병변 장애인 대상으로 진행하면서 전공과 나 자신을 들여다보는 '현재의 나'로 범주화하여 구성하였다. 이상의 결과를 바탕으로 성인학습자들이 성인 뇌병변 장애인 대상으로 자신감 향상을 위한 융합프로그램 진행 경험으로 장애인에 대한 인식변화를 비롯하여 대학 생활의 동기부여와 학습 동기 강화에 활용할 수 있기를 제언하였다.