1. 서 론
4차 산업혁명 시대의 도래는 여러 분야에서 다양한 형태로 변화를 일으키고 있다. 산업, 예술, 교육계 등에서는 국가 경쟁력 강화를 위하여 4차 산업혁명 시대의 핵심 기술을 반영하기 위한 연구가 활발하게 진행 중이다. 미국과 독일은 국가 특성을 반영한 4차 산업혁명 대응 전략을 수립하였다. 미국은 정보통신기술을 활용한 ‘스마트아메리카 챌린지’ 사업으로 국민의 생활에 실질적 도움이 되는 공공서비스 개발에 주력하고 있고, 독일은 ‘산업 4.0’슬로건을 내걸고 기계와 인간의 노동 분담, 기술의 고도화 등을 통하여 자국의 제조업 경쟁력 강화를 목적으로 하고 있다[1]. 이 외에도 캐나다 등 18개 국가에서 4차 산업혁명의 핵심기술인 인공지능 전략을 발표하였고, 그 중에서도 주체적인 재정지원 및 정책을 제시한 9개 국가에서는 연구 및 인재 육성, 산업화, 종합적 포괄성, 지침 역할 등을 국가적 전략 추진 방향으로 공표하였다[2].
연구 및 인재 육성 부분을 살펴보면, 인공지능의 기술 선도를 위하여 인공지능 선도국인 미국, 중국, 영국 등의국가들이 대대적인 투자를 하고 있지만 인공지능 경쟁력의 핵심인 우수 인력은 국가 및 산업 분야를 막론하고 턱없이 부족하여 인재 확보 경쟁이 치열한 것이 현실이다. 특히, 미국에서는 인공지능 기술자가 약 85만 명으로 전 세계 인공지능 기술자 190만 명의 절반에 가까우며, MIT 는 인공지능 단과대학을 설립하여 체계적인 인공지능 교육을 진행 중에 있다. 우리나라에서도 인공지능 인재 육성을 위하여 2019년 3월 인공지능 대학원으로 KAIST, 고려대, 성균관대를 선정 및 발표하였다[3]. 미국과 중국 등에서는 초등학교부터 인공지능 교육을 체계적으로 진행하는 것에 비하여 우리나라는 대학원에서부터 인공지능교육을 실시하게 되었는데, 이는 우리나라 학부 교육과정 개편이 쉽지 않은 것으로 해석할 수 있다. 그러나 2018년 중학교 입학생부터 소프트웨어 교육을 의무화했기 때문에 이를 단계적으로 확대하여 소프트웨어 교육에 인공지능 교육을 포함하도록 추진되었으면 기대한다.
소프트웨어 분야에 탁월한 관심과 재능을 가진 초·중학생들의 융합형 인재로의 양성을 위하여 인공지능 학문을 반영하기 위한 연구가 진행 중에 있다[4]. 그러나 이러한 인재를 양성하기 위한 교원에 대한 인력이 턱없이 부족한 상태이다. 그나마 SW융합영재 교육이 가능한 교원들도 역량이 부족하다는 문제점이 지속적으로 지적되고 있다[5].
이에, 본 논문에서는 SW융합영재 담당교원들의 역량강화를 위한 텐서플로우 기반 인공지능 교육 콘텐츠 개발을 제안한다. 개발한 교육 콘텐츠를 통하여 SW융합영재 담당 교원들의 역량을 강화하여 보다 안정적이고 수준 높은 SW융합영재 교육의 방향을 제시하고자 한다.
본 논문의 구성은 2장에서 SW융합영재 담당교원의 역량과 SW융합영재 대상의 교육 콘텐츠 현황 및 텐서플로우 기반 인공지능 서비스에 대하여 소개하고, 3장에서는텐서플로우 기반 인공지능 교육 콘텐츠 개발을 제안하며, 4장에서는 결론 및 향후 연구과제에 대하여 제시한다.
2. 관련연구 및 선행연구
2.1 SW융합영재 담당교원 역량 현황
2019년 현재 우리나라 수학, 과학, 정보 등의 영재교육담당교원 수는 25,000여명이 넘는 것으로 나타나고 있다[6]. 일정 시간의 연수를 받으면 영재 담당교원이 될 수 있지만 해당 연수를 이수했음에도 핵심역량의 차이는 크게 나타나지 않는다고 한다[7]. 이에 영재 담당교원의 역량을 강화하기 위해서는 측정도구를 통하여 담당교원들의 부족한 부분을 정확히 인지하고 부족한 역량을 지속적으로 보완할 수 있도록 다양한 형태의 교육 프로그램 지원에 대한 연구들이 있다[7][8].
2011년 이후 교육부 및 한국과학창의재단에서는 융합인재양성을 위하여 STEAM 수업 모델 개발 등의 형태로 담당교원에게 지원하였다. 그러나 다양한 정책적 지원에도 불구하고 교사들은 타 교과의 선행지식 부족, 시간 부족 등의 이유로 융합교육의 어려움을 드러내고 있다[9].
위와 같이 일반적인 영재에 대한 담당교원의 핵심역량부족, 융합교육에 대한 담당교원의 현장 적용에 대한 어려움 등을 확인할 수 있었다. 이러한 근거로 SW융합영재담당교원의 역량 강화를 위한 교육 콘텐츠 개발 및 연구가 필요한 것이다.
2.2 SW융합영재 교육 콘텐츠 현황
교육부는 2011년 과학기술에 대한 학생들의 흥미와 이해를 높여 과학 기술 기반의 융합적 사고와 문제해결력배양을 위한 교육으로 STEAM을 정의하고, 초·중등 대상의 STEAM 융합교육의 강화를 주요 과제로 발표하였다[9].
STEAM 융합교육은 우리나라 국가경쟁력 강화를 위하여 매우 중요한 역할을 수행한다는 점에 크게 공감하고 국가적 차원에서 다양한 정책적 지원 및 실행 연구들이 이루어졌다. 관련 연구들로는 STEAM 융합교육의 방향, 수업 모델 설계 및 수업모형에 따른 프로그램 개발 등이 있다[10][11][12][13]. 대부분의 STEAM 융합교육은 수학과 과학에 치중되어 있으며[11], 간혹 음악이나 미술에융합된 교육 프로그램 개발 연구도 있었지만[10][12][13], 보다 심화된 형태의 SW융합영재들을 위한 교육 프로그램 개발 및 연구는 찾기 어려웠다.
특히, STEAM 융합교육의 프로그램을 보다 체계적으로 개발할 필요가 있는데, 기본 교육 프로그램에서부터 단계별로 심화시키는 과정에서 타 교과와의 다양한 형태로 융합할 수 있는 STEAM 융합교육 로드맵을 정부차원에서 설계 및 개발 지원할 필요가 있는 것으로 보인다.
2.3 텐서플로우 기반 인공지능 서비스
인공지능(Artificial Intelligence)이란 인간의 인지능력, 이해능력, 학습능력, 추론능력 등을 실현하는 기술이다[14]. 인공지능의 역사는 1950년대부터 1970년대 초까지는 성공적인 프로그램과 새로운 발전 방향이 나타난 황금기였고, 이후 엄청난 관심과 투자에도 불구하고 1990년대 중반까지는 전문가 시스템과 신경망 이론 등이 잠시두각을 나타낸 것 외에는 이렇다 할 성과가 없었던 암흑기였다. 이후 컴퓨터 성능의 향상과 빅데이터 등으로 인공지능 기술은 급속도로 발전되었다[14].
4차 산업혁명에서 필요한 주요 기술들 중에서도 인공지능은 빅데이터, 지능형로봇, 자율주행, IoT, 클라우드 컴퓨팅 등의 다른 여러 기술들과 함께 유기적으로 결합되기 때문에 그 중요성이 매우 강조되고 있는 기술이다[15][16].
인공지능 분야 중에서 머신러닝(Machine Learning)은 컴퓨터가 스스로 학습하여 예측모형을 개발하는 분야이고, 딥러닝(Deep Learning)은 인간의 신경망 원리를 이용한 심층신경망 이론을 이용한 머신러닝 학습 방법이다.딥러닝은 2012년 신경정보처러시스템학회에서 Alex-net을 시작으로 크게 발전하였고, 2016년 이세돌 9단과 인공지능 알파고의 바둑 대국으로 세계적인 주목을 받으며 학술 연구뿐만 아니라 산업과 예술 및 교육계까지 급속도로 성장하고 있다[17].
특히, 구글에서 개발한 파이선 환경에서 딥러닝과 같은 인공지능 기법을 쉽게 구현할 수 있도록 도와주는 오픈소스 라이브러리인 텐서플로우의 등장은 인공지능에 관심이 있는 많은 사람들에게 도움이 되었다. 현재 텐서플로우는 전 세계 개발자들 사이에서 가장 인기 있는 딥러닝 도구로 부상하였다. 텐서플로우가 짧은 기간 내에급성장 할 수 있었던 이유는 타 딥러닝 라이브러리들보다 쉬운 사용법, 지속적인 라이브러리 업데이트, 구글 서비스의 대부분이 텐서플로우를 적용했다는 점 등이다. 이러한 텐서플로우 특징은 다음과 같다[18].
① 데이터 플로우 그래프를 통한 풍부한 표현력
② 아이디어 테스트에서 서비스 단계까지 이용 가능
③ 계산 구조와 목표 함수만 정의하면 자동으로 미분등의 복작한 계산 처리
④ Python, C++, Go, Java, R을 지원하며, SWIG를 통한 다양한 언어 지원 가능
⑤ 코드 수정 없이 CPU/GPU 모드로 동작
⑥ 분산된 서버 환경에서 데이터와 학습의 병렬 처리지원
3. 연구 설계
3.1 연구 절차
본 연구는 SW융합영재 담당교원의 역량 강화를 위하여 4차 산업혁명 시대에서 빠지지 않고 등장하는 인공지능 기술을 이용한 교육 콘텐츠를 다음의 순서대로 진행하여 개발한다.
첫째, 관련연구 및 선행연구에 기반을 둔 인공지능 교육 콘텐츠의 방향을 설정한다.
둘째, 인공지능 중에서도 SW융합영재 교육에 적합하다고 판단한 머신러닝에 대한 교육 콘텐츠를 구성한다.
셋째, 구성한 교육 콘텐츠를 3회차의 분량으로 상세설계 및 개발한다.
넷째, 개발한 교육 콘텐츠는 인공지능 교육 전문가 및 현장 교육 전문가에게 질적인 측면의 검증을 실시한다.
위 단계를 거쳐 인공지능 교육 콘텐츠를 설계 및 개발함으로써 SW융합영재 담당교원의 역량 강화에 도움을 주고자 한다. 이를 정리한 연구의 절차는 다음 그림 1과 같다.
(그림 1) 연구 절차
(Figure 1) Research procedure
3.2 텐서플로우 기반 인공지능 교육 콘텐츠 내용
3.2.1 교육 콘텐츠 방향
중등 SW융합영재 담당교원 대상의 텐서플로우 기반 SW융합영재 담당교원 역량 강화를 위한 텐서플로우 기반 인공지능 교육 콘텐츠 개발 170 2019. 12인공지능 교육 콘텐츠 개발 방향은 다음과 같다.
첫째, 중등 SW융합영재 담당교원이라는 특성을 반영하여 회귀 이론과 텐서플로우를 이용한 인공지능 실습을 통하여 SW융합영재들의 잠재력과 가능성을 발전시킬 수 있도록 한다.
둘째, 회귀 이론과 연계된 가격 예측 인공지능을 직접 실습함으로써 인공지능에 대한 실생활과의 연계성을 탐구하고 스포츠 경기 결과 예측, 수요 예측 등의 다양한 범위에 활용할 수 있도록 한다.
셋째, 일반 교원 대상의 교육 콘텐츠 이론이나 인공지능 기능 실습 교육과는 다르게 SW융합영재들이 자기 주도적으로 문제를 구조화하고 직접 실습한 인공지능 프로그램을 응용할 수 있도록 한다.
넷째, 특정 영역에서의 문제해결이 아닌 다양한 교과와의 융합된 영역에서 인공지능을 응용하여 창의적으로 문제해결을 할 수 있도록 한다.
3.2.2 교육 콘텐츠 구성 내용
중등 SW융합영재 담당교원 역량 강화를 위한 인공지능 교육 콘텐츠는 머신러닝 학습을 통하여 수치 예측에 가장 간단한 모델 중 하나인 선형 회귀 머신러닝을 이용한다. 선형 회귀 머신러닝은 농산물 가격 예측, 기상 예측, 스포츠 분야의 경기 결과 예측, 관찰과 실험에 대한 예측등 다양한 형태로 타 교과와 융합될 수 있기 때문이다.
본 논문에서 제안하는 교육 콘텐츠는 총 3가지 주제로 구성하였다.
첫 번째 주제에서는 머신러닝과 텐서플로우를 이해하기 위한 기본적인 개념과 텐서플로우를 실습할 수 있는 파이선 설치 및 라이브러리 설치 등의 개발환경을 구축하고, 머신러닝의 선형 회귀에 대한 기본적인 이해 및 실습을 진행한다. 주어진 데이터를 이용하여 1차 방정식의 선형적인 관계를 모델링하는 선형 회귀를 최소 제곱법을 이용하여 텐서플로우로 구현하는 내용으로 구성하였다.
두 번째 주제에서는 최소 제곱법을 이용하여 찾은 1차방정식이 실제 값과 얼마나 차이가 있는지 평균 제곱근오차를 이용하여 오차를 평가한다. 미분 기울기를 이용하는 경사 하강 라이브러리를 이용하여 오차가 가장 작은 방향으로 이동하는 과정을 텐서플로우를 이용하여 실습하고, 수치 예측을 위한 선형 회귀 머신러닝 모델을 구현하는 내용으로 구성하였다.
세 번째 주제에서는 콘솔 환경이 아닌 브라우저에서 실습할 수 있도록 아나콘다와 주피터 노트북을 설치하여 보다 편리한 개발환경을 구축하고, 예측에 영향을 주는 요인이 2개 이상인 경우 이를 반영하여 예측할 수 있는 다중 선형 회귀에 대한 기본적인 이해 및 다중 선형 회귀기반의 가격 예측 머신러닝을 구현한다. 시각화 라이브러리를 이용하여 가격 데이터를 시각화하는 내용으로 구성하였다.
이를 정리한 교육 콘텐츠의 구성 내용은 다음 표 1과 같다.
(표 1) 교육 콘텐츠의 구성 내용
(Table 1) Composition of Education Contents
본 논문에서 제안한 SW융합영재 담당교원 대상의 교육 콘텐츠가 차시별로 융합하고 있는 타 교과를 정리하면 다음 표 2와 같다. 1차 방정식과 2차 방정식을 이용한 회귀를 이해하는 동안 자연스럽게 수학 교과와의 융합적 사고력이 형성되고, 가격 예측 인공지능 머신러닝 학습 모델을 개발하는 과정에서 예측을 원하는 대상에 따라 타 교과와의 융합이 다양해 질 수 있다. 스포츠 분야의 경기 결과를 예측하고 싶다면 해당 스포츠의 경기 방식과 점수 득실에 대한 규칙을 적용하기 위하여 체육 교과와의 융합적 사고력이 필요해지며, 관찰 및 실험을 통한 예측을 원한다면 필요한 요소를 관찰 및 실험에 적용하기 위하여 과학 교과와의 융합적 사고력이 자연스럽게 길러지게 된다.
(표 2) 교육 콘텐츠의 융합 교과 내용
(Table 2) Convergence Contents of Educational
SW융합영재 담당교원 대상의 교육 콘텐츠는 타 교과와의 융합 외에도 인공지능 교육 콘텐츠 개발을 위하여 여러 가지 기술들이 다루어진다. 본 논문에서는 다음 표 3과 같은 기술 환경에서 교육 콘텐츠가 개발되었다.
(표 3) 다루어지는 기술들
(Table 3) Technologies for Using
3.2.3 개발된 교육 콘텐츠 세부내용
개발된 SW융합영재 담당교원 대상의 인공지능 교육콘텐츠 세부내용은 다음과 같다. 제시된 내용은 총 3회차분량이다. 1회차에서는 환경 구축 및 선형 회귀 머신러닝 기본실습의 내용으로 구성되어 있다.
① 머신러닝과 텐서플로우 이해하기
사람의 지능을 컴퓨터로 표현하려고 한 것이 인공지능인데, 그 중에서도 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 머신러닝이라고 한다. 머신러닝과 딥러닝을 위해 구글에서 만들어 제공한 오픈소스 라이브러리가텐서플로우이다.
② 프로그램 및 라이브러리 설치 및 실행하기
파이선 공식 홈페이지(https://www.python.org/downloads/windows/)에서 파이선을 다운로드 받아 설치하고, 명령프롬프트에서 텐서플로우 라이브러리 설치(c:\pip install tens orflow) 및 케라스 라이브러리 설치(c:\pip install keras)한다.
③ 머신러닝 기본 예제 실습
다음의 코드를 파이선 IDLE에서 입력하여 오류 없이실행했다면 텐서플로우 기반 환경이 구축된 것이다.
④ 선형 회귀의 기본적인 이해 및 실습
데이터 사이의 선형적인 관계를 모델링한 것을 선형회귀라고 하는데, 변화에 영향을 미치는 요인(독립변수)이 하나인 경우를 의미한다. 예를 들어 시급 사원의 경우 근무시간이 늘어날수록 수입도 늘어나게 되는데 이렇게근무시간에 따른 수입의 선형적인 관계에 적용하는 대표적인 머신러닝 학습 모델이 선형 회귀라고 할 수 있다. 선형 회귀 모델을 구축한다는 것은 주어진 데이터를 학습시켜 가장 합리적인 직선을 찾아내는 것이다.
즉, \(H(x)=W x+b\)라는 1차 방정식을 이용하여 직선을 표현하고 오차를 줄여가면서 가장 합리적인 근사식을 찾아내는 것이다.
⑤ 최소 제곱법을 이용하여 정확한 1차 방정식 찾기
최소 제곱법을 이용하여 가장 합리적인 직선의 방정식을 찾게 되는데, 정확한 기울기 W 와 정확한 절편 b 를 찾는 것이다. 최소 제곱법은 회귀 분석에서 사용하는 표준 방식으로 데이터를 분석하여 미지의 상수를 구할 때 사용하는 공식이다. 즉, 알바생이 근무한 시간은 x 값이고 수입은 y 값일 때 이를 이용하여 기울기 W 와 절편 b 를 구하게 되는데, 식은 각각 (1)과 (2)와 같다[19].
\(W=\frac{\sum_{i=1}^{n}(x-\operatorname{mean}(x))(y-\operatorname{mean}(y))}{\sum_{i=1}^{n}(x-\operatorname{mean}(x))^{2}}\) (1)
\(b=\operatorname{mean}(y)-(\operatorname{mean}(x) * W)\) (2)
2회차에서는 수치 예측을 위한 선형 회귀 머신러닝 구현의 내용으로 구성되어 있다.
① 평균 제곱근 오차를 이용하여 오차가 가장 작은 1차방정식 찾기
앞서 최소 제곱법을 이용하여 가장 합리적인 1차 방정식을 찾았으나, 입력 데이터가 많을 때는 연산이 복잡해지기 때문에 임의의 직선을 그려놓고, 이 직선이 잘 그려졌는지 평가하여 조금씩 수정해 가는 방법을 사용한다. 가장 많이 사용하는 방법으로 평균 제곱근 오차가 있다. 오차는 실제값 y 와 예측값 \(\hat{y}\) 의 차이이다. 오차 값이 음수가 나오면 오차들을 모두 더할 때 크기를 측정할 수 없기 때문에 각 오차를 제곱하여 모두 더한 후 데이터의 개수 으로 나누어 평균 제곱 오차를 구한다. 오차에 제곱을 하게 되면 대용량 데이터일 경우 계산 속도가 느려지기 때문에 다시 제곱근을 구하게 되는데, 이 평균 제곱근오차의 계산 결과가 가장 작은 선을 찾는 것이다. 식은 다음 (3)과 같다[20].
\(R M S E=\sqrt{\frac{1}{n} \sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}}\) (3)
② 미분 기울기를 이용하는 경사 하강법 이해
가장 합리적인 직선을 찾을 때 기울기가 너무 크거나 작으면 오차가 커지게 된다. 오차는 비용함수라고도 하는데, 식은 다음 (4)와 같다[21].
\(\cos t(W, b)=\frac{1}{n} \sum_{i=1}^{n}\left(H\left(x^{(i)}\right)-y^{(i)}\right)^{2}\) (4)
기울기와 오차는 상관관계가 있고 이 관계는 2차 방정식의 포물선 그래프로 표현할 수 있다. 포물선 그래프의한 위치에서 미분하여 순간 기울기를 구하는데 순간 기울기가 이 되는 위치가 오차가 가장 작은 위치가 된다. 처음에는 임의의 위치를 정하여 미분하여 순간 기울기를 구하고, 아주 미세하게 위치를 이동(순간 변화율)하여 순간 기울기를 수정해 가는데, 이렇게 미세하게 움직이면서포물선 그래프에서 오차가 가장 작은 위치인 맨 아래 볼록한 부분을 찾아 간다. 미분을 이용하여 순간 기울기가인 오차가 가장 작은 방향으로 이동하는 방법이 경사하강법이다. 식은 다음 (5)와 같으며 이 식에서 는 학습률로서 너무 크면 위로 치솟아 버리고, 너무 작으면 학습시간이 느려지게 된다[21]
\(W:=W-\alpha \frac{1}{n} \sum_{i=1}^{n}\left(W x^{(i)}-y^{(i)}\right) x^{(i)}\) (5)
③ 경사 하강 라이브러리를 이용하여 오차 줄이기
앞서 살펴본 경사 하강법을 텐서플로우 라이브러리를 이용하여 오차를 줄여가며 실행하는 과정을 확인한다.텐서플로우 라이브러리를 불러온 뒤, 데이터 x와 데이터 y의 값을 초기화 한다.
기울기 W 와 절편 b는 –100 ~ 100 사이의 임의의 값으로 초기화한다.
학습률은 0.01로 설정하고, 5000번의 반복 학습을 한다. 예측값 계산을 위한 1차 방정식은 hypothesis = W * xData + b 로, 오차(비용함수) 계산을 위한 평균 제곱근오차는 RMSE = tf. reduce_mean(tf. square (hypothesis-yData))로, 가장 작은 오차 값을 찾기 위한 미분 계산은 W_grad, b_grad = tape.gradient(RMSE,[W,b]) 로, 계산된 미분 값에학습률을 곱한 기울기와 절편 값 업데이트는 W.assign_su b(learning_rate * W_grad) 와 b.assign_sub(learning_rate * b_ grad)로 표현한다. 500번마다 RMSE, 기울기 W , 절편 b를 출력한다.
④ 수치 예측을 위한 선형 회귀 머신러닝 모델 구현
앞에서 살펴본 모든 내용을 정리하여 알바생 근무 시간 대비 수입을 예측하는 선형 회귀 머신러닝 모델을 구현하였다. 데이터 x는 근무시간, 데이터 y는 근무시간에 따른 수입이다. 구현한 선형 회귀 머신러닝 모델의 학습이 어느 정도 되었는지 확인하기 위하여 100시간 근무 시수입금액을 예측하는 다음의 내용을 추가한다.
5000번의 학습 중에서 2500번 이후로 오차가 인 것은 2500번 이전에 학습이 완료된 것으로 볼 수 있고, 학습완료 후 100시간 근무 시 예측한 수입금액은 834,999.44원으로 출력된 것을 확인할 수 있다. 실행 결과는 다음 그림 2와 같다.
(그림 2) 실행 결과
(Figure 2) Execution Result
3회차에서는 다중 선형 회귀 기반 가격 예측 머신러닝구현의 내용으로 구성되어 있다.
① 아나콘다 설치 및 주피터 노트북 설치 및 사용
주피터 노트북은 웹브라우저에서 파이선 코드 작성 및 실행이 가능한 대화형 방식의 통합개발환경이다. 인공지능 및 데이터분석 용도로 파이선을 사용하는 경우 코드 실행 및 수정이 간편하여 많이 사용하는 도구이다. 파이선이 설치되어 있다면 주피터 노트북 라이브러리 설치(c:\pip install jupyter)후 사용할 수 있지만, 아나콘다를 설치하게 되면 주피터 노트북뿐만 아니라 데이터 처리 및 분석에 필요한 패키지가 모두 포함되어 설치되기 때문에 일반적으로 아나콘다를 설치하여 사용한다. 아나콘다는 공식 홈페이지(https://www.anaconda.com/distribution/)에서 다운로드 받아 설치 후 명령프롬프트에서 실행(c:\jupyter notebook)하면 웹브라우저에서의 주피터 노트북 사용 환경이 구축된 것이다.
② 다중 선형 회귀 머신러닝 모델 제시
선형 회귀 머신러닝 모델에서 데이터 와 데이터 를통하여 가격을 예측해 보았다. 이때 데이터 는 예측에 영향을 주는 독립변수이고, 데이터 는 예측에 영향을 받는 종속변수가 된다. 다중 선형 회귀 머신러닝 모델은 예측에 영향을 주는 독립변수가 2개 이상일 때 사용하는 모델이다. 예를 들어 노지 채소 재배에 영향을 주는 날씨의 독립변수에는 평균온도, 최고온도, 최저온도, 강수량이 있고, 이 모든 독립변수들이 채소 가격에 영향을 미친다면 각각을 반영하여 다중 선형 회귀 1차 방정식으로 표현한 식은 다음 (6)과 같다[22].
\(H\left(x_{1}, x_{2}, x_{3}, x_{4}\right)=W_{1} x_{1}+W_{2} x_{2}+W_{3} x_{3}+W_{4} x_{4}+b\) (6)
위 식은 행렬의 곱을 이용하여 \(H(x)=W x\) 와 같이 간단히 표현할 수 있고, 이 식을 다중 선형 회귀 머신러닝 모델에 그대로 반영한다. 다중 선형 회귀 머신러닝으로 날씨에 영향을 받는 노지채소의 가격을 예측하는 모델을 제시한다. 기상 정보는 기상자료개방포털(https://data.kma.go.kr/)에서 수집하고, 채소 가격 정보는 KAMIS 농수산 유통정보(https://www.ka mis.or.kr/customer/main/main.do)에서 수집한다. 다중 선형회귀 머신러닝에 학습시킬 수 있는 약 2년간의 일별 평균온도, 최고온도, 최저기온, 일강수량, 일평균 무 가격을 정제하여 액셀로 저장한다.
③ 다중 선형 회귀 모델의 가격 예측 머신러닝 구현
주피터 노트북을 실행하여 텐서플로우 등의 필요 라이브러리를 불러온 뒤, 엑셀로 저장한 데이터를 불러와 행렬 형태로 저장한다.
가격 예측에 영향을 주는 독립변수에 해당하는 평균온도, 최고온도, 최저온도, 일강수량을 xData에 저장하고, 영향을 받는 종속변수에 해당하는 가격은 yData에 저장한 뒤, 가중치 W 값을 초기화한다. 학습률은 0.000005로 설정하여 되도록 짧은 시간에 정확한 결과가 나오도록 하고, \(H(x)=W x\) 식을 사용자 정의 함수로 작성한다.
10만 번의 반복 학습을 수행하는 동안 오차(비용함수)에 미분 계산 후 학습률을 곱하여 기울기를 업데이트 한다. 500번마다 학습 횟수, 오차(비용함수), 예측 가격을 출력한다.
학습을 완료 후 사용자가 입력한 평균온도, 최고온도, 최저온도, 일강수량의 값을 입력받아 무 가격을 예측하여 출력한다.
④ 시각화 라이브러리를 이용하여 가격 데이터 시각화
학습한 가격 데이터를 시각화하기 위하여 텐서플로우등의 필요 라이브러리를 불러오는 상단에 시각화 라이브러리를 불러오는 다음의 내용을 추가한다.
학습을 반복하는 부분에 500번마다 학습 횟수와 학습한 예측 가격을 리스트 x와 y에 저장하는 다음의 내용을 추가한다.
학습 완료 후 부분에 학습 횟수에 따라 학습한 가격 데이터를 시각화하기 위하여 다음의 내용을 추가한다.
10만 번의 학습을 반복하는 동안 2만 번 이후로는 학습이 완료되어 거의 평행선에 가까운 형태가 나타난다는 것을 확인할 수 있다. 학습한 가격 데이터를 시각화한 실행 결과는 다음 그림 3과 같다.
(그림 3) 가격 데이터 시각화
(Figure 3) Price Data Visualization
3.2.4 교육 콘텐츠에 대한 전문가 검증
개발된 SW융합영재 담당교원 역량 강화를 위한 인공지능 교육 콘텐츠 1차안에 대하여 초점집단면담(Focus & nbsp; SW융합영재 담당교원 역량 강화를 위한 텐서플로우 기반 인공지능 교육 콘텐츠 개발한국 인터넷 정보학회(20권6호) 175 Group Interview)을 통하여 질적인 측면의 검증을 실시했다. 본 검증에 참여한 인공지능 교육 전문가와 현장 교육 전문가 8명 대부분은 인공지능 교육 콘텐츠, 교육 콘텐츠의 구성, 교육 콘텐츠의 기술적 측면, 교육 콘텐츠의 실습내용 구성, 타 교과와의 융합의 5가지 주제의 검증 항목에 대하여 4차 산업혁명 시대에 인공지능 교육은 필요하다고 했으며, 선형 회귀 기반의 인공지능 교육 콘텐츠가타 교과와의 융합 내용으로 적합하다고 했다. 질의응답을 하면서 도출된 내용은 내용적 측면, 방법적 측면, 교육 환경적 측면으로 구분하여 분석하였다.
① 내용적 측면
인공지능 입문 교육 콘텐츠로 핵심 부분이 잘 전달되었다는 긍정적인 답변과 선형 회귀 기반 머신러닝 외에도 다양한 분야의 인공지능 내용을 다뤘으면 하는 의견 등이 있었다. 정리하면 표 4와 같다.
(표 4) 내용적 측면의 검증 의견
(Table 4) Verification Opinion of Content Aspect
② 방법적 측면
제안한 인공지능 교육 콘텐츠 내용에 대하여 전문가들은 대체적으로 긍정적인 반응을 보였고, 담당교원이 바로 수업에 활용할 수 있도록 다양한 예제나 실습 중심의 내용 구성을 제안한 의견 등이 있었다. 정리하면 표 5와 같다.
③ 교육 환경적 측면
제안한 인공지능 교육 콘텐츠에 대하여 보다 안정적인 개발환경 구축 필요, 파이선 이해도에 따른 교육 내용 구성, 인공지능에 대한 필요성과 활용도 구성에 대한 의견 등이 있었다. 정리하면 표 6과 같다.
(표 5) 방법적 측면의 검증 의견
(Table 5) Verification Opinion of Methodological
(표 6) 교육 환경적 측면의 검증 의견
(Table 6) Verification Opinion of Educational Environmental Aspect
4. 결론 및 향후 연구과제
인공지능 인재 육성이 국가 경쟁력이 되는 시대이기 때문에 SW융합영재들에게도 필수가 되는 인공지능을 교육할 수 있도록 SW융합영재 담당교원의 역량 강화를 위한 인공지능 교육 콘텐츠를 개발하였다. 인공지능 분야 중에서도 주어진 정보를 학습하여 수치를 예측하는 선형회귀 머신러닝 학습 모델을 제시 및 구현하였다.
인공지능은 수십 년에 걸쳐 발전 및 변화해 온 분야이기 때문에 교육해야 할 내용도 상당히 다양하지만 수치예측을 위해 당연히 학습해야 되는 선형 회귀 기반의 머신러닝에 대한 교육 콘텐츠를 개발하였다. 선형 회귀는 통계학에서 예측을 위한 목적으로 다뤄지는 회귀 분석기법이기 때문에 수학적으로 다뤄야할 이론적인 내용도 적지 않고, 수치 예측을 위한 머신러닝 환경 구축부터 다뤄야할 실습적인 내용도 많은 편이다. 이론적인 부분과 실습적인 부분을 3회차에 걸쳐 체계적으로 구성하여 교안을 개발함으로써 최대한 쉽게 접근할 수 있도록 하였다.
본 논문에서 제안한 교안으로 학습한 담당교원은 주변에서 인공지능을 활용하여 분석할 수 있는 다양한 주제를 주체적으로 찾고, 해결하기 위한 다양한 아이디어를 고민할 수 있도록 학생들에게 지도하는 계기가 될 것으로 기대한다.
향후 연구에서는 전문가들이 제안한 의견들을 반영하여 본 논문에서 제안한 교육 콘텐츠를 클라우드 기반 환경으로 업데이트 후 SW융합영재 담당교원에게 직접 적용하여 효과성과 적합성을 검증할 것이다. 본 논문의 내용으로 연수를 받아 일정 수준 이상의 내용을 이해한 담당교원들 대상으로 텐서플로우 기반으로 개발한 교육 콘텐츠를 케라스 라이브러리 기반으로도 개발하여 텐서플로우 기반의 예측과, 케라스 기반의 예측을 비교 분석하는 교육 콘텐츠 개발을 계획하고 있다. 그 다음 단계 과정으로 딥러닝을 위한 신경망에 대한 교육 콘텐츠를 이미지 분류 및 자연어 처리 기반으로 개발하여 인공지능을 교육해야 하는 담당교원의 역량을 강화하는데 도움이 되고자 한다.
References
- JU Ju, "4th Industrial Revolution and Seoul's Industrial Policy", Policy Report of the Seoul Institute, No. 254, pp. 1-21, 2018. https://www.si.re.kr/si_download/59917/21697
- KS Park, Introducing the US AI Initiative and Strategy in 18 Countries, National Research Foundation of Korea R&D Brief, No. 2019-5, 2019. https://www.nrf.re.kr/cms/board/general/view?nts_no=114114&menu_no=317&nts_no=&search_type=ALL&search_keyword=&page=5
- YS Lee, US and China, the AI War without Gunshot s… Japan has AI Education since Elementary School, ChosunBiz, 2019. http://biz.chosun.com/site/data/html_dir/2019/04/12/2019041202300.html
- JH Jeon, "Universal Education in the Field of Artificial Intelligence at a Universal Technology in the Fourth Industrial Revolution", Journal of the The Korean Society of Mechanical Engineers, Vol. 59, No. 6, pp. 38-41, 2019. http://www.riss.kr/link?id=A106234613
- MH Oh, "Efficient SW Education In The Era Of The 4th Industrial Revolution", Proceedings of the 2017 Korea Society of IT Services Conference, Vol. 2017, No. 1, pp. 446-450, 2017. http://www.riss.kr/link?id=A103314323
- Gifted Education Database, 2019. https://ged.kedi.re.kr/index.do
- JC Ryu, SD Lee, JK Lee, "A Study for Strengthening and the Level Analysis on the Core Competence of Teachers for the Gifted", The Journal of the Korean Society for the Gifted and Talented, Vol. 14, No. 3, pp. 5-30, 2015. http://www.riss.kr/link?id=A101730947
- JW Yoo, SH Park, "An analysis of Concerns of the Teachers Responsible for Gifted Education and Differences by stage after the OJT (On-the-Job)", Journal of Gifted/Talented Education, Vol. 24, No. 6, pp. 917-934, 2014. https://doi.org/10.9722/jgte.2014.24.6.917
- JH Shin, "Survey of Primary & Secondary school teachers recognition about STEAM convergence education", Korean Journal of the Learning Sciences, Vol. 7, No. 2, pp. 29-53, 2013. http://www.riss.kr/link?id=A99767414
- HY Shin, "A Study on Model and Implementation Possibility of Art Class Utilizing Golden Ratio through Interdisciplinary Integration", The Journal of Korean Society of Basic Design & Art, Vol. 19, No. 2, pp. 269-282, 2018. http://www.riss.kr/link?id=A105319579 https://doi.org/10.47294/KSBDA.19.4.20
- SR Ryu, JH Lee, MB Yoon, HS Kim, "Development of Convergence Education Program for Elementary School Gifted Education Based on Mathematics and Science", Journal of the Korea Convergence Society, Vol. 9. No. 10, pp. 217-228, 2018. https://doi.org/10.15207/JKCS.2018.9.10.217
- YH Choi, SJ Park, DW Lee, YS Jeong, JS Jung, EH Chang, "Development of STEAM Program Utilizing Museum and Art Gallery Exhibits", The Journal of Korean Practical Arts Education, Vol. 21, No. 1, pp. 183-199, 2015. https://doi.org/10.17055/jpaer.2015.21.1.183
- YJ Choe, KH Ahn, "A Study on the Development of the Convergence Education Program for the Gifted Students based on a Top Type Convergence Talented Ability", The Journal of the Korean Elementary Art Education Association, Vol. 36, pp. 359-389, 2013. http://www.riss.kr/link?id=A99970540
- Artificial intelligence, Wikipedia, the free encyclopedia, 2019. https://en.wikipedia.org/wiki/Artificial_intelligence
- South Korea's top 10 trends for 2019, Hyundai Research Institude, 2019. http://hri.co.kr/board/reportView.asp?firstDepth=1&secondDepth=1&numIdx=30113&isA=1
- Top 10 global trends in 2019, Hyundai Research Institude, 2019. http://hri.co.kr/board/reportView.asp?numIdx=30110&firstDepth=1&secondDepth=1&thirdDepth=
- MS Cho, "Artificial intelligence Open Source Library Tensorflow and Artificial intelligence Application Software Development", Journal of The Korean Institute of Communication Sciences, Vol. 34, No. 10, pp. 55-63, 2017. http://www.riss.kr/link?id=A103626537
- TensorFlow, Wikipedia, the free encyclopedia, 2019. https://en.wikipedia.org/wiki/TensorFlow
- Least squares, Wikipedia, the free encyclopedia, 2019. https://en.wikipedia.org/wiki/Least_squares
- Root Mean Square Error, Wikipedia, the free encyclopedia, 2019. https://en.wikipedia.org/wiki/Root-mean-square_deviation
- Gradient descent, Wikipedia, the free encyclopedia, 2019. https://en.wikipedia.org/wiki/Gradient_descent
- Linear regression, Wikipedia, the free encyclopedia, 2019. https://en.wikipedia.org/wiki/Linear_regression