Ⅰ. Introduction
인터넷의 발달과 정보통신기술의 발전에 힘입어 이러닝 등 원격교육에 대한 수요가 증가하고 있다[1]. 특히 2020년부터 코로나 등의 환경요인에 의하여 비대면을 통한 원격교육이 증가하며 원격교육환경에서 학습자의 학습환경 개선 및 만족도 향상을 위한 노력이 증가하고 있는 추세이다.
Fig.1은 GIA에서 조사한 글로벌 원격교육 시장의 매출 추이를 나타낸 것으로, 2017년 이후 2년 단위 10% 이상의 매출 증가 추이를 확인 수 있다[1].
Fig. 1. Global Distance Education Sales Trend[1]
원격교육(distance education)이란 정보통신 기술을 기반으로 교수자와 학습자가 대면이 아닌 통신망을 통하여 교수 학습활동을 하는 형태의 교육이다[2]. 원격 교육은 언제 어디서나 낮은 비용으로 교육이 가능하며 양방향 상호작용 및 반복학습이 가능하다는 장점을 가지고 있다. 최근에는 인공지능, 가상현실 등의 기술을 통한 에듀테크가 교육에 적용되며 질 높은 교육 콘텐츠와 서비스 제공이 가능하다[2][3]. 원격 교육환경은 학습자의 학습 의지에 따라 학습 종료 및 후속 학습 연계가 가능하므로 무엇보다 학습을 위한 자기 주도 학습 및 학습 동기부여가 필요하다[3][9].
본 논문에서는 원격 교육 시 학습자가 자기 주도적으로 학습을 진행할 수 있는 방법으로 문제해결을 위한 경로 제시 알고리즘을 제안한다.
II. Background
1. Knowledge Tracking Algorithms
원격교육에서 학습자의 성취도를 높이기 위한 방법으로 학습(지식) 추적 알고리즘이 연구되었으며 종류로는 강화학습이 가능한 힌트 알고리즘(Hint Factory Algorithm), 이전 학습내용을 기억하여 문제해결 과정을 도와주는 지식추적(Knowledge Tracking)등이 제안되었다[4]. 이 중 지식추적 방법은 학습자의 이전 학습상태(x0, x1...xt)를 모델링하고 이전 학습경험을 바탕으로 현재 학습가능 상태를 추적하는 기법이다[5]. 지식추적 연구는 2010년 Pardos & Heffernan에 의해 연구된 베이지안(Bayesian) Knowledge Tracking)방식과 2006년 Hinton & Salakhutdinov에 의해 연구된 재귀신경망(Recursive Neural Network) 방식이 대표적이다[6][7][8]. 이 중 재귀 신경망 방식은 입력을 통하여 학습에 대한 추적이 가능한 방식이다[7][8]. 재귀신경망을 통한 학습추적 알고리즘을 적용한 대표 사례는 칸 아카데미(Khan Academy)와 code.org의 학습문제해결과정이다[2][4][5]. 칸 아카데미는 학습자의 학습과정 데이터와 학습완료 후 결과값을 바탕으로 재귀신경망방법의 우수성을 입증하였으며 code.org는 학습자의 미래 성과 예측을 위하여 재귀 신경망 방법을 사용하였다[4].
Fig.2는 code.org에서 사용하는 인공지능기반 학습 문제해결 프로그램 화면의 일부이다.
Fig. 2. AI-based learning program screen in code.org [10]
위에서 언급한 기존 연구내용은 재귀신경망을 적용한 학습예측 알고리즘을 통한 미래학습예측 및 활용이 가능 하나하나의 문제에 대한 문제해결 중심 학습추적이 대다수이기 때문에 다양한 과목 및 난이도에 대한 대응이 미흡하다. 기존 알고리즘의 경우 문제풀이 중심의 학습추적이 가능하기 때문에 동일 학습자의 다른 과목의 학습에 학습추적알고리즘을 적용시키기에 어려움이 있다. 본 논문에서는 다양한 과목에서 다양한 난이도의 학습내용에 대한 문제해결 시 학습자의 학습경로를 추적하고 학습자의 학습 패턴을 여러 과목에서 활용할 수 있도록 학습자의 학습과정 패턴을 다양한 데이터셋으로 수집하여 학습하도록 한다.
2. Recursive neural network and Spanning tree
본 논문에서는 학습추적알고리즘 연구를 위하여 재귀 신경망과 신장트리의 개념을 적용한다.
1) Recursive neural network
딥러닝 모델 중 정적인 입출력 사항은 입력패턴에 대하여 시간적 고려를 하지 않는다[10]. 따라서 과거 입력에 대한 기억이 불가하여 시간에 따라 변하는 동적 입출력 매핑이 불가하다[11].
학습추적을 위하여 사용되는 재귀신경망 방법은 연속된 데이터를 다루는 시퀀스(Sequence)모델로 입력과 출력을 연속으로 처리한다[12].
Fig.3은 재귀신경망에 대한 처리과정 개념적으로 나타낸 것이다[12].
Fig. 3. Recursive Neural Network Processing Process [Conceptual Schematic][12]
재귀신경망은 입력, 활성화함수 처리(은닉층), 출력으로 구성되며 은닉층의 활성화 함수를 통하여 도출된 결과값이 출력층에 영향을 미치는 동시에 은닉층의 다음 계산의 입력에 영향을 미친다[12][13].
Fig.2와 같이 재귀신경망은 재귀형태의 표현이 가능하지만 여러 시점에 걸쳐 결과가 표현되기도 한다. 재귀 신경망을 설명하기 현재 시점을 나타내는 변수인 t와 입력층의 입력 벡터를 나타내는 x, 출력층의 출력벡터를 나타내는 y 와 은닉층에서 활성화 함수를 통하여 결과를 보내는 역할을 하는 노드인 셀(cell)에 대하여 고려할 수 있다[8][13].
2) Spanning tree
신장트리는 그래프 내의 모든 정점(vertex) 을 포함하는 트리로써 최소 연결을 통한 순환하지 않는 그래프를 나타낸다. 신장트리에서는 모든 정점이 연결되어야 하며 사이클 포함이 불가하므로 N개의 정점이 있는 경우 (N-1)개의 간선(Edge)으로 연결된다. 신장트리 중 사용된 간선들의 가중치 합이 최소인 트리를 최소비용 신장트리(MST, Minimum Spanning Tree)라 한다. 최소비용 신장트리에서를 위하여 N개의 정점을 가지는 그래프에 대하여 (N-1) 개의 간선이 사용되며 사이클이 포함이 불가하다[14][15].
최소비용 신장트리의 대표적 알고리즘으로 크루스컬 최소 비용 신장 트리 알고리즘(Kruskal MST Algorithm)과 프림 최소비용신장트리 알고리즘(Prim‘s MST Algorithm) 이있다[[14][15]. 크루스컬 최소비용신장트리 알고리즘은 그리디 방법(Greedy Method)를 기반으로 가중치가 할당된 간선에 대한 정렬을 통하여 최적 경로를 선택하는 알고리즘이다[15]. 크루스컬 알고리즘의 경우 간선들을 간선들을 정렬하는 시간에 의해 시간 복잡도가 결정되며 평균 O(elog₂e) 의 시간 복잡도를 가진다[14][15]. Fig.4는 크루스컬 알고리즘의 처리과정을 간단히 나타낸 것이다.
Fig. 4. Kruskal MST Algorithm[13][14]
프림 최소비용신장트리 알고리즘은 시작정점부터 출발하여 최소비용신장트리 집합에 추가하고, 추가된 정점에 연결된 간선 중 최소비용을 사이클이 되지 않도록 고려하여 연결될 간선을 선택하여 신장트리 집합을 확장해 가는 방법이다[14][15].
Fig.5는 프림 알고리즘의 처리과정을 간단히 나타낸 것이다.
Fig. 5. Prim’s MST Algorithm[13][14]
프림 알고리즘은 정점의 수가 N 일 경우 내부 반복이 n 번 반복되는 경우 시간 복잡도는 O(n^2) 이 된다[13][14].
III. Research Proposal
1. Overview of Proposals
원격교육 시 문제해결을 위한 경로(Path)를 제시함으로써 학습자의 학습완료를 도와주고 자기 주도적 학습능력을 향상시킬 수 있다[1].
특히 프로그래밍 과목의 경우 문제해결을 위해서는 해당 문제에 대한 알고리즘의 이해와 코드 작성 중 발생 가능한 오류에 대한 적절한 대처가 중요하기 때문에 문제해결 과정 중 적절한 경로 제시가 필요하다.
본 논문에서는 원격교육 시 문제 해결 경로를 제시하기 위하여 프로그래밍 과목의 문제해결 과정을 중심으로, 기존 해결자의 문제 해결 경로를 수집하고 수집된 경로 중 최적의 방법을 제시하여 학습자가 문제를 효율적으로 해결할 수 있는 방법을 제시한다.
본 논문의 연구를 위하여 최소비용신장트리와 재귀 신경망 기술을 적용한다. 재귀신경망의 경우 학습과정에서 발생하는 연속적인 학습자의 학습패턴을 학습하기 용이하다. 또한 학습자의 문제해결 경로에 대한 가중치를 학습하여 최적화된 학습추적을 제공하기 위하여 신장트리를 사용하여 최적의 학습경로에 대한 빠르고 유연한 학습패턴 제시가 가능하다.
2. Proposal for Problem Solving Path Algorithm
본 논문에서는 프로그래밍 과목 중 피지컬 컴퓨팅을 도와주는 Arduino의 스케치 코드를 작성하기 위한 환경을 기반으로 학습자들의 문제 해결 경로를 기록하기 위하여프림 최소비용 신장트리 알고리즘을 사용하고 해당 데이터셋을 기반으로 학습자의 문제해결 시 발생하는 연속된 데이터를 탐색하는 과정에서 재귀신경망이 적용되어 학습자의 문제해결을 위한 최적의 경로 제시가 가능하도록 한다.
제안 내용에 사용되는 재귀신경망은 각각의 계층에서 가중치 값을 가진다. 가중치 계산 시 중간층에서의 입력값은 입력층에서의 입력과 가중치의 곱, 이전단계의 중간층에서의 입력과 가중치의 곱의 합으로 나타낼 수 있다. 또한, 중간층에서 출력층으로 출력은 활성화 함수를 거쳐 변환되며 출력층의 입력값은 가중치들의 곱을 통해 산출되고 해당 값 또한 출력층의 활성화 함수를 거쳐 출력 값으로 변환된다.
다음은 학습자들의 문제해결 최적경로 탐색을 위한 알고리즘이다.
Fig. 6. Algorithm for gathering various path for problem solving
Fig.7을 통하여 수집한 데이터를 토대로 Fig.6과 같이 최적의 문제해결 경로 검색을 위한 모델을 설정한다.
Fig. 7. Algorithm for problem solving path using reflexive neural network
Fig.7은 최적의 문제해결 경로를 찾기 위한 알고리즘을 의사 코드로 나타낸 것으로 input 데이터에 대한 처리 시재 귀신 경망의 가중치적용 알고리즘이 적용되어 현재 문제해결 후 다음 문제 해결을 위한 최적의 경로를 제시할 수 있다. Fig.6의 알고리즘 중 핵심내용인 은닉상태확인에 대한 코드 작성을 위하여 Fig.7과 같이 작성하였다.
Fig.8은 Python으로 구현한 재귀신경망의 은닉상태 확인 코드 중 일부이다.
Fig. 8. Part of the code to check the hidden state of the recursive neural network
위의 코드를 통하여 각 시점에 따라 입력값이 입력되어 결과를 출력하기 위한 과정을 진행할 수 있다.
3. Experiment and performance evaluation
본 논문에서 제안한 알고리즘의 성능을 평가하기 위하여 Fig.9 와과 같은 내용의 문제를 A원격교육기관의 동일 과목 학습자 100명을 대상으로 10명씩 그룹을 묶어 총 10 개 그룹에 대하여 2단계의 레벨, 각 레벨 별 2개의 문제로 총 4개의 문제를 각각 순서대로 해결하도록 하였다.
Fig. 9. Presenting problems for performance evaluation
제시 알고리즘에 대한 예측모델 생성을 위하여 문제해결 가능한 MST를 생성하여 데이터 셋으로 제시하고 수준별 문제해결 경로를 제시한다.
본 논문에서는 다양한 과목에서 다양한 난이도에 대한 학습 과정 시 학습자의 학습추적알고리즘을 고려하여 문제해결 가이드가 가능하도록 연구하였기 때문에 하나의 문제를 해결하기 위해 집중하는 기존의 학습추적 알고리즘과의 비교는 효율적이지 않다는 판단으로 본 논문에서 제안한 알고리즘의 가용성과 효율성측면을 중심으로 성능평가를 진행 하였다.
성능평가는 두가 지 방법으로 진행하였다. 먼저, 알고리즘의 가용성을 측정하기 위한 방법으로 문제해결 시 실험그룹의 학습자가 제시 알고리즘을 포함하여 문제를 해결하였는지 확인하는 평가를 진행하고 두 번째로, 문제해결 경로를 제시한 경우와 그렇지 않은 경우에 대하여 동일 난이도에서 문제를 바꾸어 제시하고 문제해결 시간을 측정하였다.
먼저, 알고리즘의 가용성을 측정하기 위한 식은 Piech, C 등에 의해 기존 제안한 알고리즘 효율성 측정식을 사용하며 수식은 다음과 같다[15]
Fig. 10. Formula for measuring the efficiency of an algorithm
기존 문제해결 학습자(a1~an)의 문제해결 경로(b1~bn) Path(a1b1)가 제시한 문제해결 경로\(\Pi^{a 1} \)에 포함되어 있는지 \(A n s_{\Pi}\)의 식으로 확인할 수 있다. Path(a1b1)이 포함된 경우 T(True)를 반환하고 그렇지 않은 경우 F(False)를 반환하여 학습자 문제해결 시 제시된 문제해결 경로가 포함되는지 \(\text { Result }\left(\text { Path }^{a 1 b 1}\right)\)의 결과로 확인할 수 있다. 성능평가를 위하여 성능평가에 참여한 10개 그룹(10명 × 10개 그룹) 총 100명에 대하여 , 본 논문의 제시알고리즘을 사용하여 문제해결경로 포함여부를 조사하였다.
각 그룹은 10명으로 구성되며 구성원이 산출한 비율의 평균을 기록하였다.
Table 1. Performance evaluation result1 (Availability)
G :Group
%: Percentage of solutions including problem solving path
두 번째로 알고리즘을 통한 효율성을 측정하기 위하여 문제해결 경로 제시의 경우와 그렇지 않은경우에 대하 여문 제 해결 시간을 측정하였다.
Table 2. Performance evaluation result2 (Computational Costs)
G :Group
T1: Time of solutions including problem solving path
T2: Time of solutions without problem solving path
위의 그림을 통하여 제시된 경로가 포함되도록 문제를 해결한 경우는 평균 52% 이상이 되는 것으로 확인되었으며 문제해결 경로를 제시한 경우, 그렇지 않은 경우 대비 문제해결 속도가 45% 이상 향상됨을 확인하였다.
IV. Conclusions
원격교육의 수요가 증가하며 학습자의 효율적 자기주도 학습을 위한 방법이 연구되고 있다. 원격교육에서 학습의 완성과 후속학습 진행을 위하여 필요한 것은 학습자의 주도적 학습의지와 문제해결능력이다. 문제해결 시 여러 번 오류를 겪는 경우 학습자의 학습 연속성이 낮아질 수 있다.
본 논문에서는 재귀신경망과 신장트리 알고리즘을 적용하여 문제해결을 위한 경로제시 알고리즘을 제시하였다. 기존에도 재귀신경망을 활용한 학습추적알고리즘이 존재하였으나 하나의 문제에 집중한 형태가 대다수 였다. 본 논문에서는 다양한 과목에서 다양한 난이도의 학습내용에 대한 문제해결 시 학습경로를 추적하고 해당 패턴을 다른 과목에도 활용할 수 있도록 데이터 셋에 추가하도록 하였다.
제안 내용에 대한 성능평가는 가용성과 효율성 측면을 평가하기 위하여 두 가지 방법으로 측정하였으며 가용성측면에서 실험대상자의 52% 이상이 문제해결 과정에서 제안 알고리즘이 포함됨을 확인할 수 있었고 효율성 측면에서 문제해결 경로를 제시한 경우, 그렇지 않은 경우 대비 문제해결 속도가 45% 이상 향상됨을 확인하였다.
본 논문에서 제안한 알고리즘을 통하여 원격교육 시 학습자의 원활한 자기주도 학습이 가능하며 최적의 문제해결 경로를 확보하여 다양한 과목의 여러 난이도 문제 해결 시에도 학습추적을 위한 경로제시 알고리즘을 효율적으로 적용할 수 있을 것이라 사료된다.
현재 연구 내용으로는 특이 학습자의 학습 패턴인식 과학습 시 발생 가능한 돌발 상황에 대한 유연한 대처가 미흡할 수 있다. 향후 보다 다양하고 풍부한 데이터 셋을 기반으로 학습 시 돌발상황에 대한 유연한 대처가 가능한 학습추적알고리즘 연구가 필요하다.
References
- Gemological Institute Of America Market Report, Available at:https://www.gia.edu/gem-lab
- Da-Young Kong, "Comparison of Perceptions of Instructors, Learners, and IT Managers on the Success Factors of Non-face-to-Face Class System", Korea University Digital Business Administration Ph.D. Thesis, 2021.
- Hyo-rye Ahn and Hong-cheol Shin, "A Study on the Effects of Non-face-to-Face Education Service Quality on Learning Commitment and Education Satisfaction", Tourism and Leisure Research, Vol.32, No.11, pp.363-384, 2020. DOI : 10.31336/JTLR.2020.11.32.11.363
- Young-ho Lee, "Development of an Intelligent Model to Predict Problem-solving Path for Customized Programming Education", Seoul National University of Education, Department of Computer Education, Ph.D. Thesis, 2018.
- Jeong-Hoon Lim and Sang-Hong Kim, "Effects of individual learning and collaborative learning on academic achievement, self-directed learning skills and social efficacy in smart learning", Educational Information Media Research, Vol.19, No.1, pp.1-24, 2013. UCI : G704-000750.2013.19.1.001
- Pardos et al.," Modeling individualization in a bayesian networks implementation of knowledge tracing", International Conference on User Modeling, Adaptation, and Personalization, pp. 255-266, 2015. DOI : 10.1007/978-3-642-13470-8_24
- Ying-kun Huang et al., "Supervised feature selection through Deep Neural Networks with pairwise connected structure", In Knowledge-Based Systems, 2020. DOI:10.1016/j.knosys.2020.106202
- Marapelli. Bhaskar et al., "RNN-CNN MODEL:A Bi-directional Long Short-Term Memory Deep Learning Network For Story Point Estimation", 5th International Conference on Innovative Technologies in Intelligent Systems and Industrial Application, pp. 25-27, 2020. DOI: 10.1109/CITISIA50690.2020.9371770
- Hassan et al., "Deep Learning approach for sentiment analysis of short texts", 3rd International Conference on Control, Automation and Robotics, pp.705-710, 2017. DOI :10.1109/ICCAR.2017.7942788
- Code.org, Available at:https://curriculum.code.org/ko-kr/hoc/plugged/1
- Byeong-il Bae et al., "How to Reduce Learning Time for Code Change Recommendation System Using Recurrent Neural Network", Journal of Information Science and Technology, Vol.47, No.10, pp.948-957, 2020. DOI : 10.5626/JOK.2020.47.10.948
- Changmook Lee et al., "Longitudinal Prediction of Student Academic Performance Using a Recurrent Neural Network", Journal of Educational Evaluation, Vol.33, No.1, pp.161-189, 2020. DOI : http://dx.doi.org/10.31158/JEEV.2020.33.1.161
- Su-Youn Choi, Dea-Woo Park,"Proposal of a hypothesis verification prediction system for educational society using a deep learning model", Journal of the Korea Computer Information Society, Vol.25, No.9, pp.37-44, 2020. DOI : https://doi.org/10.9708/jksci.2020.25.09.037
- O'Quinn et al., "Solving the Minimum Spanning Tree Problem with a Quantum Annealer", 2020 IEEE Globecom Workshops, 2020. DOI:10.1109/GCWkshps50303.2020.9367437
- Carrabs. Francesco et al., "Minimum spanning tree with conflicting edge pairs: a branch-and-cut approach", Annals of Operations Research, Vol. 298, Issue 1/2, pp.65-78. Mar 2021, DOI : 10.1007/s10479-018-2895-y
- Piech.c et al.," Autonomously generating hints by inferring problem solving policies", In Proceedings of the Second ACM Conference, pp.195-204, 2015. DOI:10.1145/2724660.2724668