l. 서 론
인공지능(Artificial Intelligence, AI)으로 대변되는제 4차 산업혁명의 정보통신기술은 경제 사회 전반에걸쳐 급격한 변화를 야기하고 있다. 이에 대응하기 위해 AI의 핵심기술인 알고리즘의 구현 및 최적화에 근간을 이루는 산업수학은 새로운 시장을 만들거나 부가가치를 창출할 수 있는 잠재력을 지니고 있기에, 최근 산업수학의 활용과 역할이 더욱 강조되고 있다[1]. 산업수학은 수학적 이론과 분석방법을 활용하여 세상의 문제를 해결하거나 산업의 부가가치를 창출하는 활동으로산업현장에서 발생하는 문제해결, 경영상의 의사결정, 자연현상과 인간활동 예측, 신상품 개발 등 다양한 분야에 활용되고 있다[2]. 구체적으로 엔지니어링 설계, 인공지능 기술개발, 에너지 효율성 제고 등 산업현장에서 제기되는 기술적인 문제의 해결 방법을 제시하는 데 있다. 이는 교통노선 설계, 물류 최적화, 세금징수 등 행정이나 경영을 위한 최적의 의사결정을 수립하는 데활 용된다. 또한 폭풍 및 해일 예측, 질병 확산이나 발생 예측, 선거결과 예측 등의 자연현상과 인간의 행동을 예측하는데, 가상이나 증강현실 등 컴퓨터 그래픽스에금융파생 상품, 전자상거래 보안, 질병 진단 및 치료 등세상에 없던 새로운 상품을 개발하는 데 활용되고 있다 [1].
미국은 세계대전 시기부터 수학적 지식의 유용성에대한 경험을 전 학문 분야에서 공유하고 있으며 20세기 내내 자연과학, 전통수학, 응용수학을 포괄하는 수리 과학(mathematical science)이라는 용어를 사용하고 있으며, 국방, 제조, 마케팅, 금융 등 다양한 학문 분야를 연결하는 선도국가로 위치하고 있다. 미국 연방정부가 수리과학 전반에 투자하는 연간 연구비는 4-5억 불이며 이 중 50% 이상은 국립과학재단(NSF)이 제공하고 있으며, 나머지는 국방부, 에너지부, 국립보건원에서제공하고 있다. 이를 통해 미국의 수리과학은 고성능컴 퓨팅, 생물학 등 최첨단 연구 분야와도 잘 결합되어 있으며 다양한 학문 분야를 지원하고 있음을 알수 있다. 또한 산업수학과 관련한 직접적인 수학자들의 관심은 협회, 연구소, 세미나 및 워크숍, 네트워킹 활동을 통해표출되고 있다. 특히 협회 차원에서 미국 산업응용수학
회(Society for Industrial and Applied Mathematics, SIAM)는 12개의 저널을 출판하고 있으 며, SIAM의 설립을 통해 ENIAC 등 디지털 컴퓨터의개발 과정에 수학자들이 적극적으로 참여하게 된 계기를 제공하였다. SIAM은 1982년 Linear Algebra 분과를 시작으로 2000년 Imaging Science와 Life Science, 2002년 Computational Science and Engineering 분과 등을 설립함으로써 새로운 과학 연구 분야의 등장에 따라 수학자들의 역할을 적극적으로모색하고 있다. 또한 미국의 산업수학 거점으로는 기존의 수학과 중심으로 만들어졌던 수학 연구소를 수리과학연구소로 변화시키는 프로젝트를 진행하면서 캘리포니아대학 버클리캠퍼스의 수리과학연구소 (Mathematical Science Research Institute, MSRI) 와 미네소타 대학의 수학 및 응용연구소 (Institute for Mathematics and its Applications, IMA)를 각각1981년과 1982년에 설립하면서 세계적인 선도 기업들이 수학계와 협력을 할 수 있는 구심적 역할을 담당하고 있다. 구체적으로 MSRI는 한국의 국가수리과학연구 소(National Institute for Mathematical Sciences, NIMS)의 모델이 되었다고 홍보하고 있으며, 기후 변화와 관련한 연구 세미나를 지속해서 개최하고, 시스템 생물학, 암호학 등 인접 분야로 확장해나가고 있다. IMA는 한국의 서울대학교, KAIST. 포항공과대학, NIMS가 위원으로 참여하고 있으며, 방문자와 연구원들이 자유롭게 연구할 수 있는 환경을 통해 협력의 거점 구심을 하고 있다. 또한 매해 응용수학의 특정 주제와 관련한 Annual Thematic Program, 학제 간의 연구를 강화하고 급속히 관심의 대상으로 부각하는 주제를 다루는 Hot Topic Workshop, 기업체가 참여할수 있는 Industrial Partner Program 등 다양한 산학활동과 산업수학 박사후 연수제도, 모델링 학교, 산업문제 세미나 등 다양한 산업연계 프로그램을 시행하고 있 다[1-3].
우리나라에서도 순수학문에 치우친 수학의 보다 적극적인 산업계 응용을 위해 2005년 유일한 수학 분야의 정부출연 연구기관인 NIMS를 설립하였다. NIMS는사회 전반에 걸쳐 기업들의 수학에 대한 요구가 늘어남에 따라 산업현장의 문제 발굴과 해결, 이를 통해 산출
된 성과의 환류 등 산업수학 활성화에 선두적인 역할을수행하고 있다. 산업수학 문제해결 소통의 장으로 개방형 산업수학 문제해결 플랫폼을 오픈하였으며, 2015년부터는 산업수학 관련 프로젝트를 시작하였다. 구체적으로 대학교수들이 수학을 활용하여 기업이 산업현장에서 직면하는 다양한 문제를 찾아서 해결하거나 유망한 상품의 개발을 지원하는 프로젝트인 산업수학 점화프로그램을 시행하였다. 또한 2016년에는 정부의 산업수학육성방안을 기점으로 NIMS에서 산업수학혁신센 터(Innovation Center for Industrial Mathematics, ICIM)를 설치했다. ICIM은 정부 지원에 힘입어 인공지능 분야를 포함한 데이터과학, 암호학, 금융 등 수리 기반 산업기술을 기반으로 서울대에서, 그리고 빅데이터기반의 금융·수산·제조 혁신을 다룰 수 있도록 부산대에 설치하였다. 2019년에는 의료분야의 수학적 문제수요가 급증함에 따라 의료수학센터를 개소하였다. 최근 수학적 알고리즘과 인공지능 기술을 접목하여 X선영상에서 조기진단 기술을 개발하는 등 수학적 방법을통해 의료분야의 문제를 해결하는 사례들이 제시되고 있다[4]. 그러나 의료수학, 인공지능, 금융수학 등 산업수학 제 분야에 관해 정부가 전략적으로 지원하고 있지 만, 여전히 인력과 예산 면에서 부족한 현실이다[5].
본 연구의 목적은 산업수학과 관련한 한국과 미국의이슈를 텍스트마이닝을 통해 전반적으로 파악하고자하는 것이다. 이를 위해 20년 전부터 산업수학이 보편화되고 생태계가 조성되어 거의 모든 분야에서 응용하고 다양한 산업에 활용함으로써 산업수학의 선도국가로 위치하는 미국과 2016년 산업수학육성방안을 기점으로 정부 주도하에 산업수학 발전을 위한 지원이 이루어지고 있는 한국을 대상으로 정하였다. 구체적으로 각국가의 대중매체 중 온라인 뉴스 기사와 소셜매체 중온라인 포럼에서 게시글과 댓글을 수집하여 구조적 토 픽모델링(Structural Topic Modeling, STM)을 수행 하였다.
STM은 가장 많이 알려진 토픽모델링 방법인 잠재적디리클레 할당(latent Dirichlet allocation, LDA) 모형을 기반으로 개발되었다. 그러나 LDA를 포함한 다른토픽모델링 방법들이 주로 데이터에 대한 탐색적 기술에치중하고 있는 반면[6-8], STM은 텍스트 데이터, 모
형의 적합도, 문서 저자의 개인적 속성 또는 문서 제작시기 등을 나타내는 문서의 메타데이터(meta data) 정보가 문서 내 잠재된 특정 토픽의 발현확률(topic prevalence)에 어떤 영향을 미치는지를 통계적 관점에서 확증할 수 있다[9I910]. 토픽 발현확률이란 한 토픽에 할애된 문서의 비율로 정의한다[10]. STM을 수행함으로써 분석대상이 되는 문헌 집합에서 특정 개수의 토픽을 추출할 경우, 문서 작성 주체나 문서 작성 시기 등의 문서 메타데이터를 독립변수로, 각 토픽의 발현확률을 종속변수로가정하는 선형회귀모형(linear regression model)에 기반하여 통계적 유의성을 검정할수 있다. 현재까지 산업수학과 관련하여 토픽모델링을 적용한 연구는 3편[6[11][12]에 불과하며, 이들은모두 학술지에서 출판한 논문에 LDA를 적용함으로써학술적 측면이 강조된 산업수학의 현황과 동향 등에 대한 탐색적 기술로 그친다는 한계가 있다. 따라서 본 연구에서는 산업수학과 관련한 현장의 소리를 반영할 수있도록 소셜매체를 분석대상으로 정하며, 한국과 미국이라는 두 국가의 차이점에 대한 탐색적 기술에서 나아가 차이에 대한 통계적 검증을 수행하고자 한다. 구체적으로 한국 미디어에서 총 9,728개와 미국 미디어에서 총 10,662개를 추출하여 STM을 분석함으로써 한국과 미국의 산업수학 이슈를 비교한다. 이를 바탕으로한국의 산업수학 생태계 정착을 위한 학술적 및 실무적시사점을 제공한다. 구체적인 연구문제는 다음과 같다.
첫째, 한국과 미국의 온라인 뉴스에서 산업수학과 관련한 공통 이슈와 차이점은 무엇인가?
둘째, 한국과 미국의 온라인 포럼에서 산업수학과 관련한 공통 이슈와 차이점은 무엇인가?
셋째, 한국의 온라인 뉴스와 포럼에서 산업수학과 관련한 공통 이슈와 차이점은 무엇인가?
넷째, 미국의 온라인 뉴스와 포럼에서 산업수학과 관련한 공통 이슈와 차이점은 무엇인가?
이론적 배경
산업수학
산업수학이란 수학적 이론과 분석방법을 활용해 세상의 문제를 해결하거나 산업의 부가가치를 창출하는 활동이다[1]. 즉, 수리과학의 지식과 방법론을 활용해공공 및 산업현장에서 제기되는 여러 문제를 해결하고기업의 기술혁신과 수익 증대에 기여하는 활동을 의미 한다[13].
산업 고도화에 따른 산업수학의 발전을 살펴보면 태동기는 1980년부터 1990년대로 미국을 포함한 선진국에서는 제조업을 중심으로 수학의 수치제어와 최적화분야를 접목해 수학을 산업의 기술적 문제를 해결하는수단으로 활용하기 시작했다. 또한 산업수학을 위한 전문 연구기관을 설립하여 전문인력을 양성하였다. 확산기는 2000년대로 금융, 바이오, 교통, 제조업, 에너지, 서비스 등의 다양한 산업과 수학의 모델링과 시뮬레이션 분야를 접목하였다. 이는 자원탐사, 에너지효율, 엔지니어링 최적 설계 도심 상권분석, 물류최적화, 세금 징수, 버스노선 결정 암발생 확률 예측, 감염병 확산속도 예측, 선거결과 예측, 금융 파생상품 설계, 전자상거래 보안솔루션 개발 등에 활용하였으며, 산업수학 개념을 보편화하였다. 또한 기업, 대학, 연구소 간 협력이 활발해지는 산업수학 생태계를 출현시키며, 정부 지원이 본격화되었다. 도약기는 2010년대 이후로 4차산업혁명이 도래함에 따라 빅데이터 산업에 수학을 활용하여빅데이터로부터 패턴과 규칙성을 찾아 가치 있는 정보를 생산하였다. 이처럼 빅데이터 분석을 처리할 수 있는 컴퓨팅 기술이 갖춰지면서 산업수학은 비약적으로 발전했다. 또한 수학 기반 스타트업이 출현하고, 수학기반 문제해결 컨설팅이 비즈니스가 되는 시대라고 할수 있다. 그리고 현재는 2021년까지 산업수학의 단계적 육성을 마친 정착기에 해당한다.
구체적으로 국가별로 산업수학 생태계를 살펴보면한국은 2005년 유일한 수학 분야의 정부출연 연구기관인 NIMS를, 그리고 2016년 ICIM를 설립하였다. 또한2016년 산업수학 육성방안을 발표하여 초기 단계에는정부 지원이 마중물이 되도록 하고 2021년까지 산업 계, 학계, 연구계가 자발적으로 협력하는 생태계가 작동되도록 하였다. 또한 2022년 이후에는 수학 스타트업창업이 활성화되고 민간 주도 산업수학 생태계가 조성되는 정착 단계에 이르도록 하고 있다. 미국은 연방정
부에서 연간 4~5억 달러의 규모로 수리과학 전반에 걸쳐 투자하고 있으며, 이 중 국립과학재단이 2억 달러이상을 차지하며 나머지는 국방부, 에너지부, 그리고국립보건원에 제공하고 있다. 또한 산업수학의 연구거점으로는 캘리포니아대학의 MSRI와 미네소타 대학의IMA를 들수 있다. 이 수리과학연구소들은 세계적 선도 기업과 수학계와의 협력의 구심점 역할을 담당하고 있다.
독일은 연구기관 거점으로 독일 연구재단 소속의 연구소로 국제적 응용수학 기관인 Research Center Matheon 및 1987년 베를린 주 법령으로 응용수학·데이터 집약적 고성능 계산을 위해 설립된 연구소 Zuse Institute Berlin을 들수 있다. 또한 라이프니츠 연합에 속하는 응용수학연구소로 복잡한 경제적, 사회적, 과학기술의 문제를 수학적 모델링 및 수치해석적 시뮬레이션을 통한 해결을 지향하는 Weierstrass Institute for Applied Analysis and Stochastics, 그리고 Fraunhofer Institute의 독립기관 중 최초의 수학기반 연구소로 정보통신기술 그룹과 재료 및 구성 요소그룹에 속해있는 Fraunhofer Institute for Industrial Mathematics를 들수 있다. 이러한 연구기관들은 공통적으로 산업체와의 세미나, 자문, 인턴십 등 산업연계 활동을 통해 산업수학의 매개조직 역할을 수행하고 있다.
영국은 민간 자문기관인 스미스 연구소가 운영하는 Knowledge Transfer Network for Industrial Mathematics를 통해 산업계의 문제를 해결하고 있다. 또한 옥스퍼드 대학 산하의 연구소인 Oxford Centre for Collaborative Applied Mathematics에서는학적 모델링, 알고리즘 설계, 데이터 분석, 수치해석 등수학적 기법을 통해 과학계와 산업계의 기술 발전 및문제해결을 추구하며 다양한 연구자들의 연구 교류및공동연구와 방문자 프로그램을 운영하고 있다.
캐나다는 Alberta와 British Columbia에 있는 5개대학교의 협력으로 설립된 Pacific Institute for the Mathematical Science 및 대표적인 산업수학 연구소로 수리과학과 관련 분야의 산업응용연구를 지원하는Mitacs를들수 있다. 또한 수리과학에 집중된 연구거점인 Mprime을 통해 대학원생과 박사후연구원의 산업계 인턴십 지원, 박사후연수 프로그램, 공동 연구교류
프로그램 등을 수행하며 기업의 투자 유치와 기술이전및지식 교환에 주력하고 있다[1-31[13].
이상에서 살펴본 바와 같이 산업수학 생태계를 정착시키기 위해 세계의 여러 국가들은 정부 주도하에 또는기업과 정부의 혁신에 기여하기 위해 설립된 민간 자문기관에 의해 지원을 받고 있으며 산업계, 학계, 연구계와 보다 유기적 연계를 위한 공동세미나, 공동연구를수행하는 데 노력을 기울이고 있음을 알 수 있다. 따라서 본 연구에서는 이 중 미국에 초점을 맞추어 산업수학 이슈를 분석함으로써 한국에서 산업수학 생태계 정착을 위한 시사점을 제공하고자 한다.
2. STM을 활용한 연구
STM을 활용해 특정 학문 분야의 현황 및 동향을 분석한 연구들을 국내와 국외로 나누어 살펴보면 다음과 같다. 먼저 국내에서 김준혁 외[14]는 의학교육에서 텍스트 분석 및 기계학습 방법을 교육하기 위한 사례로석면에 관련한 1990년 이후의 신문기사를 대상으로STM을 분석하였다. 분석 결과, 신문 기사에는 환자의고통이나 불편에 관한 주제는 잘 드러나고 있지 않으 며, 보수적인 언론은 석면을 덜 언급하고 있으며, 진보적인 언론은 석면을 더 많이 언급하는 방향으로 석면문제에 접근하고 있다고 밝혔다. 설동훈, 고재훈, 유승환[15]은 1964년부터 2017년까지를 세 시기로 구분하여 한국사회학회에서 출판, 또는 발표된 모든 논문의전문 텍스트 내용을 분석하였다. 분석결과, 각 시기에따라 토픽들을 세 개의 핵심단어로 요약하여 제시하였 으며, 시기에 따른 변동 분석을 통해 각 연구분야의 성 장, 지속, 쇠퇴의 방향을 확인하고, 각 분야에 대해 연구초점이 어떻게 바뀌었는지를 설명하였다. 염유식 외[16]는 보건과 사회과학에 게재된 논문 334편을 대상으로 시기별 연구주제 및 연구방법론의 동향을 분석한 결과, 보건사회학 분야가 독립적인 연구주제를 확립해가는 과정에 있으며, 신체질환 등 전문성이 필요한 연구나 종단 연구는 부족하다고 밝혔다. 박한샘, 김동현. 장성주[17]는 SCOPUS에 게재된 스마트 시티 관련 논문 10,955편을 분석한 결과, 센싱 데이터를 기반으로한 데이터 분석 및 적용 분야의 연구가 핫토픽으로 분
류된 반면, GIS 및 소셜미디어 등은 콜드토픽으로 분류되었다고 밝혔다. 설동훈 외[18]는 국내 조사연구의 변동 양상을 탐색하기 위해 1999년부터 2019년까지 한국조사연구학회에서 출판 및 발표된 1,190개의 논문을 분석하였다. 분석 결과, 학문 분야의 다양성과 통계분석기법을 적용한 논문이 증가했으며, 그중에서도 고급통계기법을 사용한 논문이 점점 증가하고 있다고 밝혔다.
국외연구로 Bohr와 Dunlap[19은 1990년부터2014년까지 SSCI에 등재된 환경사회학과 관련한 815 편의 논문 초록을 분석하여 연구주제의 동향을 분석하 였으며, STM이 대규모의 텍스트 분석에서 주제를 도출하는데 적합한 방법이라고 밝혔다. Chandelier[20I는프랑스에서 늑대의 출현과 이로 인해 벌어지는 지역 거주민과의 충돌에 대한 1994년부터 2014년까지 지역신문과 전국 신문의 보도 내용을 분석하였다. 분석 결 과, 늑대와 직접적으로 접촉하는 지역의 신문은 이 이슈에 대해 인간 중심적 입장으로 보도를 하였지만, 전국 단위의 신문은 늑대 측면을 고려한 보도에 치중해있음을 밝혔다. Reich 외[21]는 온라인 수업의 토론 포럼게시물에 숨겨진 토픽을 추출하기 위해, Tvinnereim 과 Flottum[22]는 기후 변화에 대한 토픽을 추출하기 위해, Das 외[23]는 교통과 관련한 연구주제를 탐색하는 데 STM을 활용하였다. Chen 외[24]는 'Computers & Education 학술지에 1976년부터 2018년까지 게재된 3,342편의 논문 제목, 초록, 주제어를 분석한 결 과, 맥락과 협업학습, E-러닝과 정책, 실험과 방법론, 인간과 컴퓨터의 상호작용, 사회연결망과 커뮤니티를중심으로 연구가 이루어지고 있으며, 상승하는 연구주제로는 기술수용모델, 게임기반학습, 교사 연수 등이, 하락하는 연구주제로는 프로그래밍언어, 교육과정과 프 로그램, 개념도 등이 도출되었다고 밝혔다. 이상에서 살펴본 바와 같이 STM을 적용한 연구들은 최근 들어 사회과학을 중심으로 교육학, 교통공학, 기후학, 정보과 학, 의학 등 다양한 분야에서 수행되고 있지만, 산업수학과 관련하여 STM을 적용한 연구는 거의 전무한 실정 이다. 구체적으로 현재까지 토픽모델링을 활용한 산업수학 연구로는 3편만이 있다. 첫째, 미국산업응용수학회 학회에서 출판하는 총 17종의 학술지를 분석함으로써 산업수학 분야의 지적구조에 대한 전체적인 흐름 및
변화를 탐색한 연구[6]이다. 둘째, 한국산업응용수학회지의 창간호부터 출판된 논문을 분석함으로써 국내의전반적인 산업수학 현황과 동향을 분석한 연구[11]이 다. 셋째, SIAM Journal on Applied Mathematics에게재된 논문을 분석함으로써 산업수학과 관련한 논문들의 연구 및 현황을 탐색[12]한 연구가 이에 해당한다. 따라서 본 연구에서는 온라인 뉴스와 포름이라는 두매체를 동시에 고려하며, 두 매체의 차이점을 탐색적 기술로 그치는 것이 아니라 통계적 검증을 할 수 있는STM을 적용하여 한국과 미국의 산업수학 이슈를 분석하고자 한다.
연구방법
본 연구에서는 한국과 미국의 산업수학 이슈를 분석하기 위해 한국과 미국의 블록체인 이슈를 비교한 연구인 손새아 외[25]에서 활용한 동일한 사이트에서 자료를 수집하였다. 구체적으로 온라인 뉴스와 관련해서는한국의 경우 주요 포털 사이트인 네이버 뉴스 기사를, 미국의 경우에는 NewYork Times와 CNN의 뉴스기사를 수집대상으로 선정하였다. 또한 온라인 포럼과 관련하여서는 한국의 경우 클리앙(Clien)과 미국의 경우에는 Reddit의 게시글과 댓글을 수집대상으로 선정하 였다. Reddit의 경우 전 세계에서 게시글과 댓글을작성할수 있지만 본 연구에서는 미국의 초대형 커뮤니티사이트로 본사가 미국에 위치하므로 미국으로 한정하여 해석하였다.
자료수집의 종료일은 한국과 미국의 전반적인 산업수학 이슈를 비교하기 위해 신종코로나바이러스(코로나19)의 영향력을 축소하고자 온라인 개학 이후 처음으로 학생들이 학교에 가기 시작한 시점인 2020년 5월4 일부터 2020년 5월 20일 사이의 한 날을 임의로 정하여 동일하게 적용하였다. 한국에서는 다양한 주제에 대해 전문성 있는 토론을 중심으로 하는 온라인 포럼인클리앙(Clien)에서는 산업수학으로 검색한 결과 2004 년3월 18일부터 2020년 5월 16일까지 507개의 게시
글과 6,963개의 댓글을 웹 크롤링으로 수집하였다. 뉴스기사는 네이버 뉴스에서 산업수학으로 검색한 결과, 1995년 1월 12일부터 2020년 5월 16일까지 2,258개소기사 API를 활용하여 수집하였다.
미국에서는 다양한 주제에 대해 전문성이 있는 토론을 중심으로 하는 온라인 포럼인 Reddit에서는 industrial mathematics로 검색한 결과 2008년 3월31일부터 2020년 5월 16일까지 224개의 게시글과9,053개의 댓글을 API를 활용하여 수집하였다. 온라인뉴스 기사는 NewYork Times와 CNN에서 industrial mathematics로 검색한 결과, 1964년 1월 12일부터2020년 5월 16일까지 1,385개의 기사를 API를 활용하여 수집하였다.
수집한 자료들은 [표 1]의 분석 자료에 제시하였다. 한국과 미국 모두 온라인 뉴스의 비중이 온라인 포럼의게시글보다 높게 나타났으며, 온라인 포럼에서는 게시글보다 댓글이 훨씬 많이 수집되어 게시글에 달리는 댓글을 통해 산업수학과 관련한 토론이 많이 일어나고 있다고 해석할 수 있다.
자료
2. 자료 전처리
한국과 미국의 국가와 온라인 뉴스와 포럼의 매체 간비교를 분석하기 위해 먼저 수집한 한국의 온라인 뉴스 기사, 온라인 포럼의 게시글, 댓글 자료들을 하나의 열로 병합하여 'csv'파일로 통합하였으며, 메타 데이터로매체를 나타내는 1개의 열을 추가하여 온라인 뉴스는0으로 포럼은 1로 코딩하였다. 동일하게 미국에서 수집한 자료들도 메타 데이터를 포함하여 'csv'파일로 통합 하였다. 다음으로 분석에 필요한 텍스트 자료만 추출하
여 한글은 KoNLP 패키지[26], 영어는 SnowballC 패 키지를[27] 사용하여 형태소를 분석하고 품사를 태깅하 여, 명사, 형용사, 동사를 추출하는 토큰화(tokenization) 과정을 수행하였다. 다음으로 대명사, 부사, 전치사 등과같은 위에서 언급하지 않은 품사, 모든 문서에 포함되어 있는 산업 수학(구체적으로 산업'과 '수학' '산업 수학' 'industry'와 'mathematics, 'industrial mathematics'를 포함함, 이하 '산업 수학'으로 칭함)' 연구 목적과 무관하면서 자주 나타나는 '기사', 기기' 'news, reporter' 등을 삭제하였으며, 영어의 경우는추가로 tm 패키지에서[28] 제공하는 english'와'SMART"에 있는 불용어(stopwords)를 삭제하였다. 띄어쓰기가 다르게 표현된 용어들, 의미는 같지만 다르게표현되는 용어들을 하나로 통일하였으며, 영어는 대문자를 소문자로 바꾸었다. 또한 exchanging, exchanged, exchanges와 같이 문장 내에서 다양하게 나타나는 단어들을 표제어인 exchange를 추출하는원형복원(lemmatization)을 수행하였다.
3. 자료분석
3.1 공출현 단어 분석
전처리 과정을 모두 마친 한국과 미국의 온라인 뉴스및 포럼 텍스트 자료를 대상으로 공출현 행렬 (co-occurrence matrix)을 구성하였다. 공출현 행렬이란 단어들이 문서에서 동시에 나타나는 빈도를 나타내는 행렬이다. 문서 내에서 특정 단어가 동시에 나타난다는 것은 서로 관련이 있음을 의미하며, 이 단어들이 문서 내에서 반복적으로 나타난다는 것은 단어들 간의 관련성이 높다고 해석할 수 있다[29]. 본 논문에서는산업 수학'과 동시 출현한 단어들 중 빈도가 높은 상위20개를 추출하여, 주제어로 명명하고 한국과 미국의 온라인 뉴스와 포럼 간의 비교를 수행하였다.
3.2 STM 분석
한국과 미국의 온라인 뉴스와 포럼에서 도출되는 토픽을 매체별로 비교 분석하기 위해 STM 기법의 토픽모델링 분석을 수행하였다. STM은 관찰 가능한 텍스트자료로부터 잠재적인 토픽 구조를 탐색하는 확률 모형 으로, 가장 많이 활용되고 있는 LDA를 기반으로 한다.
그러나 STM은 탐색적 기술에 초점이 맞춰져 있는LDA와 달리, 문서 작성 주체나 문서 작성 시기 등의메타데이터를 독립변수로 각 토픽의 발현확률을 종속변수로 하는 선형회귀모형에 기반하여 통계적 유의성을검증할수 있다는 특징을 갖고 있다. 본 연구에서는 토픽을 이슈로 명명하고, 메타데이터로 매체인 온라인 뉴스와 포럼을 각각 0과 1로 구분하여 독립변수로 정하 였다. 구체적으로 [그림 1]에서STM의 생성 과정을 제 시하였다[30].
그림1. STM의 생성 과정
[그림 1]은 d개 문서에서 k개의 이슈를 추출하는 과정으로 먼저 0.는 이슈 발현확률에 대한 독립변수(XL) 들의 선형모형을 평균 벡터로 가지는 로지스틱 정규분포로부터 개별 문서에서 특정한 이슈들이 발현할 확률이 추출된다. 다음으로 이슈에 대한 단어 분포를 형성(3)하는 과정으로, 단어 확률은 기본적인 단어 분포 (m), 이슈 편차(KN2), 독립변수 집단 편차(k실은), 그리고 (i) 두 편차 간의 상호작용(*,mm's 비례하여 추출된다. 마지막으로 문서 내 각 단어에 대해 이슈를 할당하는 과 정으로, 개별 문서에서 특정한 이슈들이 발현할 확률분포에 기반하여 이슈(zin)가 할당되고, 주어진 이슈에해당하는 단어들(Mia)이 추출된다[31].
STM 분석에서 초기값은 스펙트럴 알고리즘 (spectral algorithm)을 활용하였으며, 최적의 토픽개수를 미리 정해야 하므로 본 연구에서는 held-out 가능도와 의미적 응집도가 높으며, 잔차 분석 결과 값이작게 나타난 12개로 정하였다. 이를 기하학, 대수학, 통 계학, 해석학, 교육학을 전공한 5인의 박사에게 제공하여 개별적으로 이슈를 명명하고, 근거를 제시하도록 하 였다. 이후 본 연구자는 5인의 박사로부터 분석 결과를수합하여 일치 정도를 반영하여 이슈를 다시 명명하였
다. 단, 이 과정에서 이슈 명이 일치하지 않는 경우에는각이슈 명과 근거를 함께 기록하여 5인의 박사에게 제 공하였다. 이후 전문가협의회를 개최하여 일치하지 않는이슈 명에 대한 토론 과정을 거친 후, 최종적으로 본연구자가 이슈 명을 확정하였다. 또한 해당 이슈에서는유의미하고 편리한 해석을 위해 FREX(frequency exclusivity) 값을 기준으로 각 이슈를 구성하는 상위10개 단어를 선정하였다. FREX는 단어의 출현 빈도와고유도를 동시에 고려한 값으로 다음의 식을 통해 산출 된다[30-32].
\(\operatorname { FREX } _ { k , v } = ( \frac { \omega } { \operatorname { ECDF } ( \beta _ { k , v } / \sum _ { j = 1 } ^ { K } \beta _ { j , v } ) } + \frac { 1 - \omega } { E C D F ( \beta _ { k , v } ) } ) ^ { - 1 }\)
모든 분석은 R 프로그램으로 수행하였다. 구체적으로 전처리에는 KoNLP 패키지를[26], STM 분석에는 stm 패키지를[30] 활용하였다.
IV 연구결과
1. 공출현 단어 분석 결과
1.1 한국과 미국의 온라인 뉴스 결과 비교
한국과 미국의 온라인 뉴스 기사에서 '산업 수학' 과 공출현한 단어 중 빈도가 높은 상위 20개의 주제어는 [표 2]와 같다. 한국과 미국의 공통점으로 두 국가에서 동시에 상위에 제시된 주제어는 '교수'와 professor'로 산업 수학과 관련하여 교수 중심의 교육과 연구 활동 등에 대한 논의가 이루어지고 있다고 해석할 수 있다. 구체적으로 교육과 관련하여서 산업수학을 위한 인력 을 대학에서 어떻게 양성해야 할 지에 대한 전략을 들
수 있다[5]. 또한 수학분야의 교수들이 산업현장에서 발생하는 난제들에 대해 수학적 해석·모델링을 통합적으로 활용해 이를 해결하는 연구 활동 들을 들수 있다. 실례로 대수학 분야에서 동형암호 기술에 대한 연구, 해석학 분야에서 고유이 알고리즘에 대한 연구, 기하및 위상수학에서의 연구 활동을 들수 있다. 이 연구들은각각 코로나19 상황에서 본인의 동선은 노출시키지않으면서 확진자와 동선이 겹치는지를 확인할 때, 의료분야와 머신러닝의 성능을 개선할 때, 그리고 2차원의 CCTV 영상을 바탕으로 보험사가 과속 여부를 판단할때 활용할 수 있다[29].
표2. 한국과 미국의 온라인 뉴스 기사에서 '산업 수학'과 공출현한 주제어
한국과 미국의 차이점으로 한국에서는 '육성' 국가수 리과학연구소' 문제해결' 새로움', 역할' '미래부', '지 원' 등 산업수학의 필요성과 정부의 지원 측면에 대한 논의가 이루어지고 있는 것으로 나타났다. 반면에 미국 에서는 'science, engineering, 'shysics', art 'music, 'language, philosophy 등 산업수학 자체 와 산업수학을 활용할 수 있는 다양한 분야에 대한논 의가 이루어지고 있는 것으로 나타났다. 구체적으로 빅 데이터 수집 및 분석기술이 발달함에 따라 다양한 언어 자료들이 은행, 의료, 교육 등에서 만들어 낼수 있는 새로운 시장 및 상품에 대한 소개와 딥러닝 기반 챗봇 을 활용한 번역 모형들을 예로 들수 있다. 또한 학과 및 전공에서 수학 및 산업수학의 철학을 소개하고 있는 것으로 나타났다.
1.2 한국과 미국의 온라인 포럼결과 비교
한국과 미국의 온라인 포럼에서 산업 수학'과 공출현 한 단어 중 빈도가 높은 상위 20개의 주제어는 [표 3] 과 같다. 한국과 미국의 공통점으로 두 국가에서 동시 에 상위에 제시된 주제어로는 '공학'과 engineering, 과학'과 'science 전공'과 'course, 컴퓨터'와 computer' 물리와 'physics'로 산업수학은 산업계의 문제를 수학적 지식과 함께 다른 분야의 지식들을 융합 해서 해결하고 있다고 해석할 수 있다. 구체적으로 과 거에는 수학 이론이 산업에 적용되기까지 과학과 공학 을 거쳐 평균적으로 80년이 걸렸다면[33], 산업수학은 최근 컴퓨터 기술의 발달로 대규모의 계산 문제들을 해 결하고, 서로 다른 분야의 전문 지식을 공유하고 전달하 는 산업계와 수학계를 이어주는 중재자로서 해야 할역 할을 하고 있으며, 여기에 필요한 다양한 학문과 교육과 정에 대한 논의가 이루어지고 있다고 해석할 수 있다.
표33 한국과 미국의 온라인 포럼에서 '산업 수학'과 공출현한주제어
한국과 미국의 차이점으로 한국에서는 대학' '어려 움', 재능', '수능, 공무원', 경제학' 등 산업수학과 관련 한 학문 분야로 경제학에 대한 논의가 이루어지고 있으 며, 대부분 일반적인 수학과 관련하여 수학은 재능이 있어야 잘하며, 어렵다는 인식과 대학 입학과 취업과 관련한 시험에 대한 논의가 이루어지고 있는 것으로나 타났다. 반면에 미국에서는 'degree' master, 'phd', job', interest 등 고등교육을 받은 석사, 박사들이 자 신들의 관심을 바탕으로 산업수학 분야와 관련된 직업 에대해 논의하고 있다고 해석할 수 있다.
2. STM 분석 결괴
2.1 한국의 온라인 뉴스와 포럼 결과 비교
한국의 온라인 뉴스와 포럼을 대상으로 산업수학과 관련한 이슈 및 각 이슈들을 대표할 수 있는 주제어를 추출하기 위해 STM을 분석한 결과는 [표 4]와 같다.
표4. 한국에서의 산업수학 관련 이슈및 주제어
[표 4]에 제시된 12개의 이슈명은 전문가협의회에서 정하였으며, 주제어는 지면 제약 상 해당 주제가 다른 주제와 구분되는 특성을 잘 나타내는 FREX에서 상위 10개를 제시하였다. 전반적으로 한국에서의 산업수학 관련 이슈들은 4차 산업혁명의 진전에 따른 정부 주도 하의 지원 및 활용, 그리고 교육과 관련하여 논의되어 있다고 해석할 수 있다.
구체적으로 이슈 K1은 보안기술로 '기술', '양자', 암 호', '보안' 등으로 구성되어 있다. 이는 산업수학 관련이슈가 양자암호기술 및 암호화폐관련 기술 등 양자역학의 원리를 바탕으로 이론적으로 절대적인 안정성을보장하는 미래 보안기술을 반영하고 있다고 해석할 수 있다.
이슈 K2는 원자력으로 원자력', 안전' '전전소' 화력'등으로 구성되어 있다. 이는 산업수학 관련 이슈가
후쿠시마 원전 사고 등 에너지를 과다하게 생산할 경우발생할수 있는 문제들을 다루고 있다고 해석할 수 있다.
이슈 K3는 역사로 '조선', 역사', 세종', '이순지' 등으로 구성되어 있다. 이는 산업수학 관련 이슈가 한국의전통 과학 기술이 한 단계 발전한 조선 초와 전성기에해당하는 세종 시대 최고의 과학자이자 수학자인 이순지의 업적을 다루고 있다고 해석할 수 있다[34].
이슈 K4는 4차산업혁명으로 인공지능', '데이터', 기 계학습', '딥러닝* 등으로 구성되어 있다. 이는 산업수학관련 이슈가 정보통신기술의 융합으로 이루어지는 산업혁명으로 인공지능기술과 데이터 활용기술을 융합하는 지능정보기술로 촉발된 4차산업혁명을 다루고 있다고 해석할 수 있다.
이슈 K5는 필요성으로 필요', 가능성', 주장', 가치등으로 구성되어 있다. 이는 산업수학 관련 이슈가 기업체를 포함한 사회 전반에서 수학에 대한 수요가 늘어남에 따라 다양한 분야에서 산업수학 자체의 필요성을강조하고 있다고 해석할 수 있다.
이슈 K6는 대학입시로 수시', '입시', 정시', '수능' 등으로 구성되어 있다. 이는 산업수학 관련 이슈로 수학교과 자체가 입시에서 중요한 과목으로 여겨지고 있음을 다루고 있다고 해석할 수 있다.
이슈 K7은 고교학점제로 공교육', 이수, 학점', 고등학교 등으로 구성되어 있다. 이는 산업수학 관련 이슈가 지능정보사회를 선도하는 인재 양성을 위한 수학교육을 교육부에서 2025년 전면 도입하기로 한 고교학 점제와[35] 관련되어 다루고 있다고 해석할 수 있다.
이슈 K8은 산업수학기관으로 "국가수리과학연구소 워크숍', 서울대', '부산대* 등으로 구성되어 있다. 이는산업수학 관련 이슈가 NIMS를 비롯해 미래창조과학부에서 선정한 수산·제조업 분야의 문제를 해결하는 부산대 산업수학센터와 의료·법률·금융 분야의 문제를 해결하는 서울대 산업수학센터와 관련되어 있다고 해석할수 있다.
이슈 K9은 세계수학자대회로 교수, 연구', '서울' '대회' 등으로 구성되어 있다. 이는 서울에서 세계수학자 대회가 개최됨으로써 산업수학의 중요성이 강조된계기로 해석할 수 있다[36]. 즉, 산업수학이 기존에 수학을 응용하는 응용수학 분야 대신 수학과 연계가 없다
고 생각했던 산업의 문제들에 수학을 적용함으로써 수학에 대한 사회적 관심과 기대가 높아진 시점에서 수학의 대중화에 상당히 기여할 수 있는 분야로 대두되었기 때문이다.
이슈 K10은 금융으로 '시장', '주식' 금리', 차익' 등으로 구성되어 있다. 이는 산업수학 이슈가 수학 모델링으로 시장 움직임을 예측하는 알고리즘을 만들고, 이를 토대로 투자를 결정하는 퀀트 등 빅데이터 기반의금융 문제를 다루고 있다고 해석할 수 있다.
이슈 K11은 정부지원으로 '지원', 정부, 전략과제', '미래부 등으로 구성되어 있다. 이는 산업수학 관련 이슈로 한국의 산업수학 태동과 관련하여 산업수학육성방안 등 정부 주도의 지원 하에 발전하고 있다고 해석할 수 있다.
이슈 K12는 국가임금동향으로 '국가', 임금' 추이' '일자리* 등으로 구성되어 있다. 이는 산업수학 관련 이슈로 해외의 다양한 국가에서 수학적 방식으로 산업현장의 문제를 분석하고 해결하는데 활용되는 직업과 관련되어 있다고 해석할 수 있다.
매체에 따라 한국에서 산업수학 관련 이슈가 다른지를 분석하기 위해 매체를 독립변수로, 그리고 논문에등장하는 이슈의 발현확률을 종속변수로 정하여 STM 을 분석한 결과는 [표 5]와 [그림 2]와 같다. 모든 산업수학 관련 이슈가 매체에 따라 통계적으로 유의한 차이가 나타났다.
표5. 한국에서의 STM 토픽모델링 분석 결과
주1.*p <.05,**p <.01,***p <.001. 주2. init.type은 spectral, max.em.its는 75, runs는 20으로 stm을 분석했음
그림2. 한국의 매체별 산업수학 이슈 발현확률
구체적으로 [표 5]에 제시된 것처럼 K1-보안기술 (b = -.048 , p< .001), K4-4차산업혁명 (b = -.105.p<.001), K5-필요성 (b= -.089,p<.001) ,K8-산업수 학기관 (b = -.277,p<:001),K9-세계수학자대회 (b = -236,p< .001), K11-정부지원 (b = --195.1<.001)은 온라인 포럼보다 뉴스에서 해당 산업수학 관련 이슈를 많이 다루는 것으로 나타났 다. 반면에 K2-원자력(b = 159.p< .001), K3-역사 (b = .086, p<.001), K6-대학입시제도 (b = .103,p<.001), K7-고교학점제(b = 176 , p<.001), K10-금융 (b = 034.p<.001), K12-국 가임금동향(b = .049,p< .001)은 온라인 뉴스보다 포 럼에서 해당 산업수학 관련 이슈를 많이 다루는 것으로 나타났다. 또한 [그림 2]에 제시되어있는 것처럼 K8-산 업수학기관, K9-세계수학자대회, K11-정부지원은 온 라인 포럼보다 뉴스에서, 그리고 K2-원자력, K6-대학 입시, K7-고교학점제는 온라인 뉴스보다 포럼에서 많 이 다루고 있는 이슈인 것으로 나타났다.
2.1 미국의 온라인 뉴스와 포럼 결과 비교
미국의 온라인 뉴스와 포럼을 대상으로 산업수학과 관련한 이슈 및 각 이슈를 대표할 수 있는 주제어를추 출하기 위해 STM을 분석한 결과는 [표 6]과 같다. [표 6]에는 한국의 온라인 뉴스와 포럼을 분석한 절차를 따 라 동일하게 12개의 이슈와 상위 10개의 주제어를 제 시하였다. 전반적으로 미국에서의 산업수학 관련 이슈 들은 금융, 공학, 교육, 국방, 문화, 의료, 환경에 이르기
까지 다양한 분야에서 논의되어 있다고 해석할 수 있다.
구체적으로 이슈 U1은 국방으로 weapon war 'defense', missile' 등으로 구성되어 있다. 이는 산업수학 관련 이슈가 국가 보안 및 각종 무기와 첨단무기개발을 위한 핵심기술을 다루고 있다고 해석할 수 있다.
이슈 U2는 여성수학자로 woman, ·life', 'book', 'biography' 등으로 구성되어 있다. 이는 산업수학 관련이슈로 기존에 잘 알려지지 않았던 여성수학자에 초점을 맞추어 이들의 삶, 죽음, 역사, 전기 등을 다루고있다고 해석할 수 있다.
이슈 U3는 전공도서로 'ebook,, test, management accounting 등으로 구성되어 있다. 이는 산업수학 관련 이슈로 경영, 기업, 회계, 보건, 통계 등 각 전공 도서에서 산업수학을 공부하는 데 필요한 내용, 시험, 그리고 해법 등을 다루고 있다고 해석할 수 있다.
이슈 U4는 문화로 art, museum, painting 'music' 등으로 구성되어 있다. 이는 산업수학 관련 이슈로 수열, 방정식, 그리고 알고리즘을 기반으로 산업수학이 음악, 미술 등 전반적인 예술 분야에서 활용되고있다고 해석할 수 있다.
이슈 U5는 교육으로 school*, education' graduate', curriculum 등으로 구성되어 있다. 이는산업수학 관련 이슈로 초, 중등학교부터 대학원에 이르는 학교 교육에서 산업수학 교육을 위한 자료 및 교육과정 등을 다루고 있다고 해석할 수 있다.
이슈 U6는 금융으로 'market', economy, stock* 'bank' 등으로 구성되어 있다. 이는 산업수학 관련 이슈로 주식, 보험과 같은 금융현상을 상대로 파생상품 개발, 그리고 은행의 자산 건전성 등을 다루고 있다고해석할 수 있다.
이슈 U7은 공학으로 computer, science 'technology, engineering 등으로 구성되어 있다. 이는 산업수학 관련 이슈로 산업이 고도화되면서 수학과 공학이 융합하여 산업의 기술적 문제를 해결하는 데필요한 분야로 정보통신을 비롯해 데이터 분석과 프로그래밍을 포함한 컴퓨터공학 등을 다루고 있다고 해석할 수 있다.
이슈 U8은 의학으로 'robot' 'deep', algorithm' image 등으로 구성되어 있다. 이는 산업수학 관련 이
슈가 수술 및 치료에 딥러닝 등의 수학적 기법을 활용한 로봇을 투입하고, 의료영상 및 진단, 소프트웨어 등의료장비 등을 다루고 있다고 해석할 수 있다.
이슈U9은 정치로 government, tax administration' 'budget' 등으로 구성되어 있다. 이는 산업수학 관련 이슈로 세무국의 업무와 납부, 이의 신청, 파산 선언 등 납세자의 현재 상태를 토대로 추후행동을 예측하는 최적화된 세금징수 솔루션 등을 다루고 있다고 해석할 수 있다[37].
이슈 U10은 건축으로 'building' 'house*, town architecture 등으로 구성되어 있다. 이는 산업수학관련 이슈로 엄청난 양의 에너지를 소비하는 빌딩과같은 건축물에서 설계 단계에서부터 에너지를 최대한 절약할 수 있도록 통풍구와 열 감지기의 적절한 위치를 파악하며, 수학의 원리를 바탕으로 실용적이고, 아름답 고, 안전한 건축 등을 다루고 있다고 해석할 수 있다.
이슈 U11은 무역으로 country, jjapan, china 'tariff 등으로 구성되어 있다. 이는 산업수학 관련 이슈로 장기적인 경기 침체 및 국가 간의 보호무역 조치로 무역 거래에서 이익을 얻을 수 있도록 관세와 환율문제를 다루고 있다고 해석할 수 있다.
이슈 U12는 환경으로 'carbon', supercomputer pollution', 'climate' 등으로 구성되어 있다. 이는산업수학 관련 이슈로 탄소배출에 따른 기후 변화와 관련하여 저탄소, 저오염, 그리고 저공해 청정 기술 등을다루고 있다고 해석할 수 있다.
표 6. 미국에서의 산업수학 관련 이슈 및 주제어
매체에 따라 미국에서 산업수학 관련 이슈가 다른지 를 분석하기 위해 매체를 독립변수로, 그리고 논문에 등장하는 이슈의 발현확률을 종속변수로 정하여 STM 을 분석한 결과는 [표 7]과 [그림 3]과 같다. 구체적으로 [표 7]에 제시된 것처럼 모든 산업수학 관련 이슈가 매 체에 따라 통계적으로 유의한 차이가 나타났다. 구체적 으로 U1-국방(b = -.035.p<.001), U2-여성수학 자(b = -.029 , p<.01), U4-문화(b = - .044, p < .001), U5-교육(b = -.035, p<.05), U6-금융 (b -:04,p <.01), U9-정치(b = -.032.p<.01), U10-건축(b = -.036, p<.001), U11-무역 (b = -.066,p< .001), U12-환경 (b = 一.025.p< .05)는 온라인 포럼보다 뉴스에서 해당 산업수학 관련 이슈를 많이 다루는 것으로 나타났 다. 반면에 U3-전공도서(b = .119,p<:001), U7-공 학(b = .137, p<.001), U8-의학(b = .039 ) p< .01)은 온라인 뉴스보다 포럼에서 해당 산업수학 관련 이슈를 많이 다루는 것으로 나타났다. 또한 [그림 3]에 제시되어있는 것처럼 U4-문화, U6-금융, U11-무 역은 온라인 포럼보다 뉴스에서, 그리고 U3-전공도서 와 U7-공학은 온라인 뉴스보다 블로그에서 많이 다루 고 있는 주제인 것으로 나타났다.
표7. 미국에서의 STM 토픽모델링 분석 결괴
주1.*p <.05,**p <.01,***p <.001. 주2. init.type은 spectral, max.em.its는 75, runs는 20으로 stm을 분석했음
그림3. 미국의 매체별 산업수학 이슈 발현확률
V. 결론 및 제언
본 연구는 한국의 주요 포털 사이트인 네이버의 온라 인 뉴스 기사, 온라인 포럼인 클리앙의 게시글과 댓글, 미국의 NewYork Times와 CNN의 온라인 뉴스 기사, 온라인 포럼인 Reddit의 게시글과 댓글에서 '산업 수 학'과 관련한 텍스트 데이터를 수집하여 STM 기법의 토픽모델링 분석을 수행함으로써 한국과 미국의 산업 수학 이슈를 비교 분석하였다. 주요 연구 결과는 다음 과 같다.
첫째, 한국과 미국의 온라인 뉴스에서 '산업 수학'과공출현한 빈도가 높은 단어는 교수(professor)"로 나타 났다. 반면에 한국의 온라인 뉴스는 산업수학의 필요성과 정부의 지원 측면에 대해, 반면에 미국에서는 산업수학이 활용되는 다양한 분야에 대해 다루고 있는 것으로 나타났다.
둘째, 한국과 미국의 온라인 포럼에서 '산업 수학'과공출현한 빈도가 높은 단어는 '공학(engineering)' 과 과학(science), 전공(course), 컴퓨터(computer) 물리(physics)'로 나타났다. 반면에 한국의 온라인 포럼에서는 일반적인 수학, 대학 입학과 취업과 관련한시험에 대해, 그리고 미국에서는 고등교육을 받은 석사, 박사들이 자신들의 관심을 바탕으로 산업수학 분야와 관련한 직업에 대한 토론이 이루어지는 것으로 나타났다. 셋째, 한국의 온라인 뉴스와 포럼, 그리고 미국의 온라인 뉴스와 포럼에서 '산업 수학'과 관련된 텍스트 데이터를 STM으로 분석한 결과, 모든 이슈에서 매체별
로 통계적으로 유의한 차이가 나타났다. 또한 산업수학과 관련하여 한국에서는 온라인 뉴스와 포럼에서 각기다른 이슈로 동일하게 6개가 나타났지만, 미국에서는온라인 포럼보다 뉴스에서 더 많은 이슈를 다루고 있는것으로 나타났다. 또한 온라인 포럼에서는 개인의 의견이 표출될 수 있다는 특성으로 인해 미시적인 관점이 있었다면, 온라인 뉴스의 경우에는 좀 더 거시적으로산업수학에 대한 정부의 개입과 산업수학이 다양한 산업에 미치는 영향을 다루고 있는 것으로 나타났다.
이상의 연구결과를 바탕으로 본 논문의 의의와 시사점을 제시하면 다음과 같다.
학술적 측면에서 본 연구는 STM 기법의 토픽모델링분석을 수행함으로써 LDA 기법을 포함해 기존의 산업수학 관련 연구들[6[[11][12]이 텍스트 데이터에 대한탐색적 기술에 치중했던 분석방법의 한계를 보완했다는 것이다. 즉, 텍스트 데이터와 모형 적합도, 문서의 메타 데이터 정보가 문서 내 잠재된 특정 이슈의 발현확률에 미치는 영향을 선형회귀모형에 기반한 통계적 유의성을 검정하였다는 데에 의의가 있다. 특히 메타 데이터 정보를 구체적으로 국가와 매체로 분리하여 산업수학과 관련한 이슈를 비교함으로써 두 국가의 다른환경에 따른 이슈의 유사점과 차이점뿐만 아니라 매체의특성에 따른 부분이 있는지도 함께 고려하였다는 데서본 논문의 의의가 있다. 이를 통해 도출된 한국과 미국의 산업수학 이슈에 대해 보다 다양한 비교를 가능하게 하였다. 또한 본 논문에서 활용한 데이터 처리과정 및분석 방법은 다른 학문 분야에도 적용 가능하며, 산업수학 관련 페이스북, 트위터 및 블로그 데이터에 적용하여 실제 산업현장의 수요를 반영한 산업수학 이슈를 파악하는데, 그리고 전체적인 산업수학 생태계를 정착시키는 데 활용할 수 있을 것이다.
실무적 측면에서 본 논문은 산업수학을 정착시키기위해 정부기관에 정책성 방향성을 제시할 수 있다는 점에서 의의가 있다. 한국의 경우 산업수학 활성화가 정부 주도하에 이루어지고 있다는 점에서 산업수학이 정착할 수 있도록 산업수학과 관련한 산업분야와 인력 양성을 위한 투자를 확대하는 전략이 필요하다. 특히 미국의 산업수학 이슈로 뉴스에서 도출된 '국방' 여성수 학자' 문화' 건축' 무역', 환경' 관련 분야에서 실제
정책으로 시행되고 그 효과를 거둘 수 있도록 세심한지원이 필요하다고 제안할 수 있다. 이러한 지원은 공학과 금융 산업 현장에서 발생하는 문제를 해결하고자하는 기업들뿐만 아니라 문화, 건축, 무역, 환경 분야에이르기까지 다양한 분야의 기업들에게 신기술 개발등의 기술적 어려움을 극복하거나 기업경영에서 최적의의사결정을 하는 과정에 수학적 이론과 방법을 바탕으로 도움을 줄수 있을 것이다. 여성수학자와 관련하여서도 성별 격차가 세계 최하위권에 머무르고 있는[38] 한국 사회의 상황에서 증거기반의 정책방향과 예산집행의 우선순위를 결정하는 객관적인 기초자료를 제공할수 있다. 또한 온라인 포럼보다 뉴스에서 더 많은 이슈를 다루고 있는 미국의 경우처럼 산업수학이 한국에정착하기 위해 여전히 거시적인 관점에서 홍보의 필요성을 제안할 수 있다. 즉, 뉴스 기사를 통해 특정 이슈에 대한 국민의 관심을 조절하는 기능이 있음을 고려할 때[39II40], 뉴스 기사를 통한 홍보를 통해 산업수학과관련한 산업계, 학계, 연구계의 지속적인 관심과 협동을이끌어내기를 기대할 수 있다.
마지막으로 본 연구의 한계점과 향후 연구방안을 제시하면 다음과 같다. 본 연구에서는 한국과 미국의 온라인 뉴스와 포럼을 대상으로 하였기 때문에 산업수학이슈 양상을 비교할 수 있는 유럽을 비롯한 다양한 국가 간의 비교를 통해 산업수학에 대한 보다 심층적 접근이 가능한 연구가 수행될 필요가 있다. 또한 본 연구에서는 시간의 흐름에 따른 산업수학 이슈 동향을 파악하지 못하였기 때문에 STM 분석 수행 시 코로나19와관련한 연도 또는 시기를 독립변수로 고려함으로써 산업수학 이슈에 대한 포괄적인 이해와 예측을 할수 있는 연구가 수행될 필요가 있다.
References
- 윤강준, 산업수학, 수학을 통한 사회와의 소통, 중도일보, 2020.
- 미래창조과학부, 산업현장에서 필요한 수학, 정부가 나서서 키운다, 미래창조과학부 보도자료, 2016.
- 박기범, 산업수학 활성화를 위한 국내 산업수학 생태계 분석, 정책연구, 2015.
- 김준래, 산업과 공공 영역 문제를 수학으로 푼다, The Science Times, 2021.
- 정다연, 데이터 시대에 의료수학은 의료현장에서 어떤 역할을 할까, 메디게이트뉴스, 2019.
- 김성연, "텍스트마이닝 기법을 활용한 미국산업응용수학 학회지의 연구 현황 및 동향 분석," 한국콘테츠학회논문지, 제20권, 제7호, pp.212-222, 2020.
- 원용국, 김용우, "토픽 모델링을 활용한 한국 영어교육 학술지에 나타난 연구동향 분석," 한국콘테츠학회논문지, 제21권, 제4호, pp.50-59, 2021.
- 석혜은, 김수영, 이연수, 조현영, 이수경, 김경화, "토픽 모델링을 활용한 한국콘텐츠학회 논문지 연구 동향 탐색," 한국콘테츠학회논문지, 제21권, 제12호, pp.95-106, 2021.
- 노준형, 백영민, "기업 루머 이슈에서 등장하는 토픽변화 및 위기 커뮤니케이션 과정의 담론 경쟁: 토픽모델링 접근," 한국광고홍보학보, 제21권, 제1호, pp.147-189, 2019.
- M. E. Roberts, B. M. Stewart, and E. M. Airoldi, "A model of text for experimentation in the social sciences," Journal of the American Statistical Association, Vol.111, pp.988-1003, 2016. https://doi.org/10.1080/01621459.2016.1141684
- 김성연, "토픽모델링을 적용한 한국산업응용수학회지의 연구 동향 및 산업수학 교육의 시사점," 중등교육연구, 제68권, 제2호, pp.267-293, 2020.
- 김성연, "토픽모델링을 활용한 SIAM Journal on Applied Mathematics의 연구 동향 분석," 한국산학기술학회논문지, 제21권, 제7호, pp.607-615, 2020. https://doi.org/10.5762/KAIS.2020.21.7.607
- 김명환, 국가 정책으로서의 산업응용수학 활성화 전략 수립, 미래창조과학부, 2015.
- 김준혁, 허소윤, 강신익, 김건일, 강동묵, "의학교육에 서 기계학습방법 교육: 석면 언론 프레임 연구사례를 중심으로," 의학교육논단, 제19권, 제3호, pp.158-168, 2017. https://doi.org/10.17496/KMER.2017.19.3.158
- 설동훈, 고재훈, 유승환, "한국사회학회와 사회학연구, 1964-2017년: 한국사회학회 발표 논문의 연구분야별 내용분석," 한국사회학, 제52권, 제1호, pp.153-213, 2018.
- 염유식, 성연찬, 김준솔, 장상철, "[보건과 사회과학] 연구의 주제 및 방법론 동향: 1997 년부터 2017 년까지," 보건과 사회과학, 제49권, 제1호, pp.65-90, 2018.
- 박한샘, 김동현, 장성주, "구조적 토픽 모델링 기반 스마트 시티 연구 동향 분석," 한국디지털콘텐츠학회 논문지, 제20권, 제9호, pp.1839-1846
- 설동훈, 이유경, 변종석, 강정한, "한국조사연구학회 학술활동 분석, 1999-2019," 조사연구, 제20권, 제4호, pp.85-108, 2019.
- J. Bohr and R. E. Dunlap, "Key topics in environmental sociology, 1990 2014: - results from a computational text analysis," Environmental Sociology, Vol.4, pp.181-195, 2018. https://doi.org/10.1080/23251042.2017.1393863
- M. Chandelier, "Content analysis of newspaper coverage of wolf recolonization in France using structural topic modeling," Biological Conservation, Vol.220, pp.254-261, 2018. https://doi.org/10.1016/j.biocon.2018.01.029
- J. Reich, D. Tingley, J. Leder-Luis, M. Roberts, and B. Stewart, "Computer-assisted reading and discovery for student generated text in massive open online courses," Journal of Learning Analytics, Vol.2, pp.156-184, 2015.
- E. Tvinnereim and K. Flottum, "Explaining topic prevalence in answers to open-ended survey questions about climate change," Nature Climate Change, Vol.5, pp.744-747, 2015. https://doi.org/10.1038/nclimate2663
- S. Das, K. Dixon, X. Sun, A. Dutta, and M. Zupancich, "Trends in transportation research: Exploring content analysis in topics," Transportation Research Record, Vol.2614, pp.27-38, 2017. https://doi.org/10.3141/2614-04
- X. Chen, D. Zou, G. Cheng, and H. Xie, "Detecting latent topics and trends in educational technologies over four decades using structural topic modeling: A retrospective of all volumes of computer & education," Computers & Education, Vol.151, pp.103855, 2020. https://doi.org/10.1016/j.compedu.2020.103855
- 손새야, 전병진, 김희웅, "텍스트 마이닝을 활용한 한국과 미국의 블록체인 이슈 비교 분석," 한국경영정보학회 학술대회, pp.130-141, 2018.
- H. Jeon and T. Kim, "Package KoNLP," https://CRAN.R-project.org/package=KoNLP, 2016.
- M. Bouchet-Valat and M. M. Bouchet-Valat, "Package SnowballC," https://CRAN.R-project.org/package=SnowballC, 2020
- I. Feinerer and K. Hornik, "tm: Text Mining Package," https://CRAN.R-project.org/package=tm, 2019
- A. Cambrosio, C. Limoges, J. Courtial, and F. Laville, "Historical scientometrics? Mapping over 70 years of biological safety research with coword analysis," Scientometrics, Vol.27, pp.119-143, 1993. https://doi.org/10.1007/BF02016546
- J, Bischof and E. M. Airoldi, "Summarizing topical content with word frequency and exclusivity," In proceedings of the 29th International Conference on Machine Learning, pp.201-208, 2012.
- M. E. Roberts, B. M. Stewart, and D. Tingley, "Stm: An R package for structural topic models," Journal of Statistical Software, Vol.91, pp.1-40, 2019.
- A. Shin, Y. L. Yu, and Y. K. Kim, "Keyword Network Analysis on Free Semester Policy with Korean Newspaper Articles," The SNU Journal of Education Research, Vol.26. pp.17-42, 2017.
- 국가수리과학연구소, https://www.nims.re.kr/
- 크레버서, 기하학적 계산의 대가, 조선의 하늘을 열다, 크레버스 수리사고력, 2019.
- 고교학점제, https://www.hscredit.kr/
- 이용진, 산업수학센터 교수님들을 만나다-천정희 교수(수리과학부), IMDARC, 2021.
- 전준범, "수학은 어떻게 허리케인 재난민을 도왔나," 조선일보, 2015.
- 이철승, "세대, 계급, 위계-386 세대의 집권과 불평등의 확대," 한국사회학, 제53권, 제1호, pp.1-48, 2019.
- M. McCombs and A. Reynolds, "How the news shapes our civic agenda," Media Effects, Routledge, pp.17-32, 2009.
- 임종섭, "국내 디지털 뉴스의제의 흐름에 대한 거시적 분석: 전통 언론사, 인터넷 언론사, 소셜 미디어를 중심으로," 한국언론학지, 제60권, 제5호, pp.91-120, 2016.