A Study on Learning Performance Improvement by Using Hidden States in Deep Reinforcement Learning

Choi, Yohan;Seok, Yeong-Jun;Kim, Ju-Bong;Han, Youn-Hee;

doi:10.3745/PKIPS.y2022m05a.528

Annual Conference of KIPS (한국정보처리학회:학술대회논문집)

2022.05a
/
Pages.528-530
/
2022
/
2005-0011(pISSN)
/
2671-7298(eISSN)

Korea Information Processing Society (한국정보처리학회)

DOI QR Code

A Study on Learning Performance Improvement by Using Hidden States in Deep Reinforcement Learning

심층강화학습에 은닉 상태 정보 활용을 통한 학습 성능 개선에 대한 고찰

Choi, Yohan (Future Convergence Engineering, Dept. of Computer Science Engineering, KOREATECH) ;
Seok, Yeong-Jun (Dept. of Computer Science Engineering, KOREATECH) ;
Kim, Ju-Bong (Future Convergence Engineering, Dept. of Computer Science Engineering, KOREATECH) ;
Han, Youn-Hee (Future Convergence Engineering, Dept. of Computer Science Engineering, KOREATECH)

최요한 (한국기술교육대학교 컴퓨터공학과 미래융합공학전공) ;
석영준 (한국기술교육대학교 컴퓨터공학과 컴퓨터공학전공) ;
김주봉 (한국기술교육대학교 컴퓨터공학과 미래융합공학전공) ;
한연희 (한국기술교육대학교 컴퓨터공학과 미래융합공학전공)

Published : 2022.05.17

https://doi.org/10.3745/PKIPS.y2022m05a.528 Citation PDF

Download PDF

⟨ Previous Next ⟩

Abstract

심층강화학습에 완전 연결 신경망과 합성곱 신경망은 잘 활용되는 것에 반해 순환 신경망은 잘 활용되지 않는다. 이는 강화학습이 마르코프 속성을 전제로 하기 때문이다. 지금까지의 강화학습은 환경이 마르코프 속성을 만족하도록 사전 작업이 필요했다, 본 논문에서는 마르코프 속성을 따르지 않는 환경에서 이러한 사전 작업 없이도 순환 신경망의 은닉 상태를 통해 마르코프 속성을 학습함으로써 학습 성능을 개선할 수 있다는 것을 소개한다.

Keywords

Acknowledgement

이 논문은 2020년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(No. NRF-2020R1I1A3065610).

Annual Conference of KIPS (한국정보처리학회:학술대회논문집)

A Study on Learning Performance Improvement by Using Hidden States in Deep Reinforcement Learning

심층강화학습에 은닉 상태 정보 활용을 통한 학습 성능 개선에 대한 고찰

Abstract

Keywords

Acknowledgement

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)