• 제목/요약/키워드: Q learning

검색결과 426건 처리시간 0.026초

교수가능 에이전트(Teachable Agent)의 개념적 이해와 설계방안 (Understanding and Designing Teachable Agent)

  • 김성일;김원식;윤미선;소연희;권은주;최정선;김문숙;이명진;박태진
    • 인지과학
    • /
    • 제14권3호
    • /
    • pp.13-21
    • /
    • 2003
  • 이 연구에서는 기존의 지능형 교수기계와 또래 튜터링의 단점을 보완하여 '가르치기를 통한 학습'을 위한 교수가능 에이전트(Teachable Agent, 이하 TA) 의 이론적 배경 및 설계방안을 제시하고자 한다. TA는 학습자가 컴퓨터 에이전트를 가르치는 과정을 통해 학습하는 시스템으로 교수 Module, 묻고 답하기 Module, 테스트 Module, 학습자료 Module 등의 4 가지 Module로 구성된다. 교수 Module에서는 개념도(concept map)의 구성을 통해 튜터 역할을 하는 학습자가 TA 의 심성모형 (mental model)을 수정하고 update하게 되며, 묻고 답하기 Module에서는 인터렉티브 창을 통해 튜터와 TA가 제한된 방식으로 학습내용에 관한 질문과 응답을 함으로써 개념도를 수정보완하게 된다. 테스트 Module에서는 튜터가 가르친 TA가 미리 정해놓은 학습목표에 도달하였는지를 평가하게 된다. 테스트 결과 TA가 일정 수준에 도달하지 못한 경우에는 개념도의 재수정 과정을 통해 계속적인 학습이 이루어지도록 한다. 학습자료 Module은 튜터가 참고할 자료를 제공해 주는 Module이다. 이러한 TA는 튜터의 역할을 담당하는 학습자에게 깊이 있는 인지적 처리와 능동적인 학습동기를 경험하도록 함으로써 실제 교육현장에서의 유용한 교수/학습도구로 활용될 수 있을 것으로 기대된다.

  • PDF

고객 질의 문서 자동 분류를 위한 학습 알고리즘 성능 평가 (Performance Evaluation on the Learning Algorithm for Automatic Classification of Q&A Documents)

  • 최정민;이병수
    • 정보처리학회논문지D
    • /
    • 제13D권1호
    • /
    • pp.133-138
    • /
    • 2006
  • 최근 인터넷의 보급으로 전자상거래가 대중들에게 나타났고 현재 기업들의 경영환경 변화를 주도하고 있다. 전자상거래에서는 기업이 고객과의 유지 및 관계 구축을 위하여 고객이 원하는 것이 무엇인가를 파악하고 그것을 고객에게 제안하는 여러 가지 고객 채널을 가지고 있는데, 그 중 게시판과 전자메일은 고객의 질의를 직접적으로 들을 수 있는 인바운드(Inbound) 정보로서 매우 중요한 채널로 다루어지고 있다. 그러나 현재 운영되는 전자상거래의 게시판과 전자메일은 체계적인 관리와 처리과정 없이 질의와 답변이 이루어지고 있는 실정이다. 따라서 본 연구에서는 이러한 문제점의 해결을 위해 인공지능 분야의 문서 분류에서 널리 사용되고 있는 기계학습 알고리즘 중 대표적인 나이브 베이지안(Naive Bayesian), TFIDF, 신경망, k-NN 알고리즘을 도입하여 전자상거래에서 존재하는 여러 가지 고객 질의의 카테고리를 자동으로 분류할 수 있도록 함으로써 관리자가 정확한 답변을 신속하게 처리할 수 있도록 하였다. 그리고 도입한 알고리즘의 고객 질의 문서 자동 분류 성능 실험을 통해 어떤 알고리즘이 우수한 분류 성능을 나타내는지 확인하였으며 실험 결과 나이브 베지이지안 알고리즘이 95%이상의 높은 분류 성능을 나타내는 것을 확인하였다.

정보검색기반 결함위치식별 기술의 성능 향상을 위한 버그리포트 품질 예측 (Bug Report Quality Prediction for Enhancing Performance of Information Retrieval-based Bug Localization)

  • 김미수;안준;이은석
    • 정보과학회 논문지
    • /
    • 제44권8호
    • /
    • pp.832-841
    • /
    • 2017
  • 버그리포트는 소프트웨어의 유지보수 단계에서 발생한 결함 정보를 담고 있는 문서로서 개발자가 해당 결함을 수정하기 위해 필수적인 정보이다. 이 때 개발자가 버그리포트를 해결하기 위해 결함을 추적하는 시간을 단축시키기 위한 정보검색기반 결함위치식별 기술들이 제안되었다. 그러나 정보검색에 유용하지 못한 내용들로 작성된 낮은 품질의 버그리포트가 등록 될 경우 결함위치식별 성능이 크게 저하된다. 본 논문에서는 낮은 품질의 버그리포트를 선별하기 위한 품질 예측 방법을 제안한다. 이 과정에서 버그리포트의 쿼리로써의 품질 요소를 정의하고, 기계학습을 사용하여 품질을 예측한다. 제안 방법을 오픈 소스 프로젝트에 적용하여 기존 품질 예측 기술 대비 평균 6.62% 더 정확하게 예측하였다. 또한 기존 결함위치식별 기술에 제안 예측 기술과 자동 쿼리 재구성 기술을 함께 적용한 경우 결함위치식별 정확도를 1.3% 향상시켜, 제안 품질 예측 기술이 정보검색기반 결함위치식별 기술의 성능 향상을 도울 수 있음을 확인하였다.

인간 동작 데이타로 애니메이션되는 아바타의 학습 (Training Avatars Animated with Human Motion Data)

  • 이강훈;이제희
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권4호
    • /
    • pp.231-241
    • /
    • 2006
  • 제어 가능하고 상황에 따라 반응하는 아바타의 제작은 컴퓨터 게임 및 가상현실 분야에서 중요한 연구 주제이다. 최근에는 아바타 애니메이션과 제어의 사실성을 높이기 위해 대규모 동작 캡처 데이타가 활용되고 있다. 방대한 양의 동작 데이타는 넓은 범위의 자연스러운 인간 동작을 수용할 수 있다는 장점을 갖는다. 하지만 동작 데이타가 많아지면 적절한 동작을 찾는데 필요한 계산량이 크게 증가하여 대화형 아바타 제어에 있어 병목으로 작용한다. 이 논문에서 우리는 레이블링(labeling)이 되어있지 않은 모션 데이타로부터 아바타의 행동을 학습시키는 새로운 방법을 제안한다. 이 방법을 사용하면 최소의 실시간 비용으로 아바타를 애니메이션하고 제어하는 것이 가능하다. 본 논문에서 제시하는 알고리즘은 Q-러닝이라는 기계 학습 기법에 기초하여 아바타가 동적인 환경과의 상호작용에 따른 시행착오를 통해 주어진 상황에 어떻게 반응할지 학습하도록 한다. 이 접근 방식의 유효성은 아바타가 서로 간에, 그리고 사용자에 대해 상호작용하는 예를 보임으로써 증명한다.

암반터널 예비설계를 위한 인공신경회로망 전문가 시스템의 개발 (Development of an Artificial Neural Network Expert System for Preliminary Design of Tunnel in Rock Masses)

  • 이철욱;문현구
    • 한국지반공학회지:지반
    • /
    • 제10권3호
    • /
    • pp.79-96
    • /
    • 1994
  • 인공신경회로망을 이용하여 터널굴착설계를 위한 전문가 시스템 NESTED를 개발하였다. 이를 위하여 지하 암반의 안정성을 평가할 수 있는 신경회로망 모델과 대표적인 암반분류법인 RMR과 Q 시스템 사이의 상관관계를 결정할 수 있는 신경회로망 모델을 사용하였다. 또한 사용된 모델과 전산화된 암반분류법 프로그램이 동일한 사용자 환경을 통해 운용될 수 있도록 통합 시스템을 구성하였다. NESTED에 사용된 신경회로망의 구조는 역전파 학습 알고리즘을 채용한 다층 역전파 신경 회로망이다. 전문가 시스템에 필요한 지식기반을 구축하기 위해 이전의 현장 시공사례로 학습과정을 수행함으로써 불완전하거나 오류가 포함된 정보를 처리할 수 있는 공학 데이터베이스를 개발하였다. 일련의 실험을 통해 전문가 시스템을 현장사례에 적용해보고 여기서 출력된 결과를 문헌에 보고된 자료와 비교하였다. 이 결과 암반의 파괴거동을 추정하고 이에 따른 보강시기의 변화를 정확히 예측하는 신경회로망의 추론능력을 확인할 수 있었다. 이처럼 본 연구를 통해 개발된 신경회로망 전문가 시스템을 암반터널에 적용할 경우 부족한 지질자료에 대해 합리적인 기준을 제공하고 터널의 예비설계에 필요한 보강설계를 제시할 수 있었다.

  • PDF

이동 장애물을 고려한 DQN 기반의 Mapless Navigation 및 학습 시간 단축 알고리즘 (Mapless Navigation Based on DQN Considering Moving Obstacles, and Training Time Reduction Algorithm)

  • 윤범진;유승열
    • 한국정보통신학회논문지
    • /
    • 제25권3호
    • /
    • pp.377-383
    • /
    • 2021
  • 최근 4차 산업혁명에 따라 공장, 물류창고, 서비스영역에서 유연한 물류이송을 위한 자율 이동형 모바일 로봇의 사용이 증가하고 있다. 대규모 공장에서는 Simultaneous Localization and Mapping(SLAM)을 수행하기 위하여 많은 수작업이 필요하기 때문에 개선된 모바일 로봇 자율 주행에 대한 필요성이 대두되고 있다. 이에 따라 본 논문에서는 고정 및 이동 장애물을 피해 최적의 경로로 주행하는 Mapless Navigation에 대한 알고리즘을 제안하고자 한다. Mapless Navigation을 위하여 Deep Q Network(DQN)을 통해 고정 및 이동 장애물을 회피하도록 학습하였고 두 종류의 장애물 회피에 대하여 각각 정확도 90%, 93%를 얻었다. 또한 DQN은 많은 학습 시간을 필요로 하는데 이를 단축하기 위한 목표의 크기 변화 알고리즘을 제안하고 이를 시뮬레이션을 통하여 단축된 학습시간과 장애물 회피 성능을 확인하였다.

Collision Prediction based Genetic Network Programming-Reinforcement Learning for Mobile Robot Navigation in Unknown Dynamic Environments

  • Findi, Ahmed H.M.;Marhaban, Mohammad H.;Kamil, Raja;Hassan, Mohd Khair
    • Journal of Electrical Engineering and Technology
    • /
    • 제12권2호
    • /
    • pp.890-903
    • /
    • 2017
  • The problem of determining a smooth and collision-free path with maximum possible speed for a Mobile Robot (MR) which is chasing a moving target in a dynamic environment is addressed in this paper. Genetic Network Programming with Reinforcement Learning (GNP-RL) has several important features over other evolutionary algorithms such as it combines offline and online learning on the one hand, and it combines diversified and intensified search on the other hand, but it was used in solving the problem of MR navigation in static environment only. This paper presents GNP-RL based on predicting collision positions as a first attempt to apply it for MR navigation in dynamic environment. The combination between features of the proposed collision prediction and that of GNP-RL provides safe navigation (effective obstacle avoidance) in dynamic environment, smooth movement, and reducing the obstacle avoidance latency time. Simulation in dynamic environment is used to evaluate the performance of collision prediction based GNP-RL compared with that of two state-of-the art navigation approaches, namely, Q-Learning (QL) and Artificial Potential Field (APF). The simulation results show that the proposed GNP-RL outperforms both QL and APF in terms of smooth movement and safer navigation. In addition, it outperforms APF in terms of preserving maximum possible speed during obstacle avoidance.

심층강화학습 기반 분산형 전력 시스템에서의 수요와 공급 예측을 통한 전력 거래시스템 (Power Trading System through the Prediction of Demand and Supply in Distributed Power System Based on Deep Reinforcement Learning)

  • 이승우;선준호;김수현;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.163-171
    • /
    • 2021
  • 본 논문은 분산형 전력 시스템에서 심층강화학습 기반의 전력 생산 환경 및 수요와 공급을 예측하며 자원 할당 알고리즘을 적용해 전력거래 시스템 연구의 최적화된 결과를 보여준다. 전력 거래시스템에 있어서 기존의 중앙집중식 전력 시스템에서 분산형 전력 시스템으로의 패러다임 변화에 맞추어 전력거래에 있어서 공동의 이익을 추구하며 장기적인 거래의 효율을 증가시키는 전력 거래시스템의 구축을 목표로 한다. 심층강화학습의 현실적인 에너지 모델과 환경을 만들고 학습을 시키기 위해 날씨와 매달의 패턴을 분석하여 데이터를 생성하며 시뮬레이션을 진행하는 데 있어서 가우시안 잡음을 추가해 에너지 시장 모델을 구축하였다. 모의실험 결과 제안된 전력 거래시스템은 서로 협조적이며 공동의 이익을 추구하며 장기적으로 이익을 증가시킨 것을 확인하였다.

국내대학의 온라인교육 확대에 따른 학습자의 어려움 및 학습지원방안 (An Analysis of Learners' Difficulties and Proposal of Learning Support Plan for the Expansion of Online Education in Domestic Universities)

  • 김재엽
    • 한국건축시공학회지
    • /
    • 제21권1호
    • /
    • pp.71-78
    • /
    • 2021
  • 코로나 팬데믹과 4차산업혁명의 도래는 대학교육에도 영향을 미쳐, 많은 변화가 유발되고 있다. 이러한 변화의 하나로 온라인 교육의 확대가 있다. 본 연구는 국내대학에서 급격하게 확대된 온라인교육으로 인한 학습자들의 어려움을 분석하고, 학습 지원방안을 모색하는 것을 목적으로 하였다. 이를 위해 국내 대학의 건축공학전공 학생들을 대상으로 설문을 하였다. 그 결과 준비가 부족한 상황에서 급격히 확대된 온라인교육으로 인해, 교수와 학생의 상호작용에서 어려움이 있었던 것으로 나타났다. 비대면 온라인교육으로 인한 의사소통의 기회가 충분하지 못했고, 질의응답이나 피드백을 신속하게 받지 못한 것으로 분석되었다. 또한 본 연구는 온라인교육 학습의 어려움을 지원하기 위한 방법을 조사하였다. 학생들은 '강의일정과 같은 공지사항의 적절한 안내', '교수자의 강의노트를 학습자료로 제공' 등의 항목에서 높은 선호도를 보였다.

국내 대학 e-러닝의 운영 특징 및 수강자 요구 조사를 통한 활성화 방안 (Strategies for Revitalizing E-Learning Through Investigating the Characteristics of E-Learning and the Needs of Distance Learners in the Domestic Universities in Korea)

  • 민경배;신명희;류태호;곽선혜
    • 한국콘텐츠학회논문지
    • /
    • 제14권1호
    • /
    • pp.30-39
    • /
    • 2014
  • 본 연구는 국내 대학의 e-러닝 운영 특징은 무엇이며 이에 대한 수강자의 평가 및 요구사항은 어떠한지를 조사하여 대학 e-러닝 활성화방안을 모색하고자 하였다. 이를 위해 운영주체차원의 조사로 10개 일반대학 및 17개 사이버대학의 홈페이지와 언론보도를 분석하여 e-러닝 중점사업을 조사하였으며, 이용자차원의 조사로 Q&A게시판 내용분석 및 수강생 대상 일대일 심층면접을 진행하였다. 조사결과, 국내 대학은 모바일 스마트 캠퍼스 구축, 강의콘텐츠 다양화, 상호작용 시스템 강화, e-러닝 시스템 및 스마트기기 활용교육을 강조하고 있었다. 그러나 e-러닝 수강자들은 모바일에서의 e-러닝 환경이 학사행정에 있어서는 편리하나 과목수강과 관련해서는 불안정하거나 기능이 미흡하다고 느끼고 있었고, 강의콘텐츠는 아직도 특정 형태가 차지하는 비중이 높으며, 강의내용에 따라 차별화된 형태로 운영되는 것이 바람직하다고 응답했다. 또한 운영자 및 시스템의 상호작용보다 수강자 상호간의 상호작용이 활발하게 이루어지길 바라고 있었으며, 일반적인 스마트미디어활용교육이 아닌 강의 및 학습과 관련하여 활용할 수 있는 소셜애플리케이션에 대한 교육을 원하고 있었다. 따라서 국내 대학의 e-러닝 활성화를 위해서는 행정중심적 사업추진이 아닌 교육중심적 e-러닝 환경구축을 목표로 한 실효성 있는 노력이 필요하다.