• 제목/요약/키워드: Scientific data

검색결과 2,657건 처리시간 0.028초

머신 러닝을 활용한 과학 논변 구성 요소 코딩 자동화 가능성 탐색 연구 (Exploratory Research on Automating the Analysis of Scientific Argumentation Using Machine Learning)

  • 이경건;하희수;홍훈기;김희백
    • 한국과학교육학회지
    • /
    • 제38권2호
    • /
    • pp.219-234
    • /
    • 2018
  • 본 연구에서는 국내 교육학 연구에서 거의 사용되지 않던 머신 러닝 기술을 과학 교육 연구에 접목하여, 학생들의 과학 논변 활동에서 나타나는 논변의 구성 요소를 분석하는 과정을 자동화할 수 있는 가능성을 탐색해보았다. 학습 데이터로는 Toulmin이 제안하였던 틀에 따라 학생들의 과학 논변 구성 요소를 코딩한 국내 선행 문헌 18건을 수합하고 정리하여 990개의 문장을 추출하였으며, 테스트 데이터로는 실제 교실 환경에서 발화된 과학 논변 전사 데이터를 사용하여 483개의 문장을 추출하고 연구자들이 사전 코딩을 수행하였다. Python의 'KoNLPy' 패키지와 '꼬꼬마(Kkma)' 모듈을 사용한 한국어 자연어 처리(Natural Language Processing, NLP)를 통해 개별 논변을 구성하는 단어와 형태소를 분석하였으며, 연구자 2인과 국어교육 석사학위 소지자 1인의 검토 과정을 거쳤다. 총 1,473개의 문장에 대한 논변-형태소:품사 행렬을 만든 후에 다섯 가지 방법으로 머신 러닝을 수행하고 생성된 예측 모델과 연구자의 사전 코딩을 비교한 결과, 개별 문장의 형태소만을 고려하였을 때에는 k-최근접 이웃 알고리즘(KNN)이 약 54%의 일치도(${\kappa}=0.22$)를 보임으로써 가장 우수하였다. 직전 문장이 어떻게 코딩되어 있는지에 관한 정보가 주어졌을 때, k-최근접 이웃 알고리즘(KNN)이 약 55%의 일치도(${\kappa}=0.24$)를 보였으며 다른 머신 러닝 기법에서도 전반적으로 일치도가 상승하였다. 더 나아가, 본 연구의 결과는 과학 논변 활동의 분석에서 개별문장을 고려하는 단순한 방법이 어느 정도 유용함과 동시에, 담화의 맥락을 고려하는 것 또한 필요함을 데이터에 기반하여 보여주었다. 또한 머신 러닝을 통해 교실에서 한국어로 이루어진 과학 논변 활동을 분석하여 연구자와 교사들에게 유용하게 사용될 수 있는 가능성을 보여준다.

연소에 대한 초등교사의 개념 - 기체변화를 중심으로 - (Elementary School Teachers' Concept of Combustion - Focus on Change of Gases -)

  • 신애경;문현숙;강민석
    • 한국과학교육학회지
    • /
    • 제31권6호
    • /
    • pp.942-957
    • /
    • 2011
  • 이 연구는 연소에 대해 초등교사가 가지고 있는 개념 수준을 파악하는데 그 목적이 있다. 성별, 경력, 6학년 과학교과의 지도 경험, 과학 관련 학력이 고루 분포되도록 하여 12명의 초등교사를 연구 대상으로 선정 하였다. 연구 대상자들에게 5개의 주관식 문항으로 구성된 개념 검사지를 투입하여 개념 정도를 알아본 후, 좀 더 구체적으로 개념 수준 정도를 알아보기 위해 반구조화된 면담을 실시하여 데이터를 수집하였다. 개념 검사지의 내용은 '연소의 정의', '집기병으로 덮었을 때 촛불이 꺼지는 이유', '집기병 속 연소 전과 후의 산소와 이산화탄소', '철솜의 연소', '연소 후 생성물'에 관한 것으로 구성되었다. 그리고 교사별 각 문항에 대한 응답을 과학적 개념(S), 부분개념(P), 오개념(M)의 수준으로 분류하여 정리하였다. 그 결과 모든 문항에서 오개념 또는 부분개념을 가진 교사가 50% 이상이었다. 또한 6학년 과학 교과 지도 경험이 있는 교사들이 경험이 없는 교사들에 비해 연소에 대한 과학적 개념 형성 비율이 높다는 것도 알 수 있었다. 눈에 보이지 않는 기체를 다루는 연소 개념을 눈으로 볼 수 있는 시각화 자료가 개발되어야 하며, 이를 이용해 교사 연수 또는 예비교사 교육이 이루어진다면 교사들의 과학적 개념 형성에 도움이 될 것이다.

야외지질답사와 과학적 모델링에서 중학생들의 표상적 능력에 관한 이해 (Understanding of Middle School Students' Representational Competence in Learning in Geological Field Trip with Scientific Modeling)

  • 최윤성
    • 대한지구과학교육학회지
    • /
    • 제14권1호
    • /
    • pp.1-20
    • /
    • 2021
  • 이 연구는 과학적 모델을 적용한 두 차례 야외지질학습(관악산과 한탄강 형성과정)에서 학생들이 보여주는 표상적 능력에 대한 이해를 목적으로 하였다. 수도권 소재 대학부설 영재원 10명의 학생들이 자발적으로 참여하였다. 야외학습환경과 교실학습환경에서 학생들이 작성한 서면 자료, 수업 과정에 대한 모든 영상녹음 및 음성 녹음 자료, 수업 종료 후 면담 자료를 수집하였다. 표상적 능력 수준을 구분하는 분석틀로 학생들의 표상 능력의 단계를 구분하고 과학적 모델 형성 과정에서 표상적 능력의 수준과 최종모델과의 결과론적인 해석을 덧붙였다. 그 결과 학생들의 표상적 능력은 1~6수준까지 다양하게 나타났다. 다만, 학생들은 야외학습환경에서 교실학습환경보다 상대적으로 낮은 수준의 표상적 능력을 보였다. 즉, 야외학습환경에서 상대적으로 낮은 수준의 표상적 능력으로부터 시작되어 교실학습환경에서 학생들이 표상적 능력의 수준을 높인 것을 결과론적으로 보였다. 궁극적으로 학생들의 표상적 능력을 이해하는 것은 과학적 모델 형성과정에서 현상을 설명하기 위한 도구로써 학술적인 의미를 지녔다.

물리적, 화학적 원인에 의한 섬유 손상 데이터 분석 (Analysis of Fiber Damage data Due to Physical and Chemical Causes)

  • 서지영;유재두;이동민;박초원;윤영욱
    • 산업융합연구
    • /
    • 제21권2호
    • /
    • pp.93-101
    • /
    • 2023
  • 본 연구에서는 칼과 가위 및 화학약품에 의한 물리·화학적 섬유 손상을 분석하여 손상의 원인 파악을 위한 기술 데이터 자료로써 활용하고자 하였다. 칼 4종류 및 가위 5종류와 4종류의 화학약품(황산, 염산, 수산화나트륨, 수산화칼륨)을 이용하여 면(Cotton), 울(Wool), 폴리에스터(Polyester), 레이온(Rayon), T/C(Polyester 50%, Cotton 50%), T/W(Polyester 50%, Wool 50%)에 물리·화학적 손상을 생성하여 공구와 화학약품에 따른 손상을 분석하였다. 칼과 가위에 의한 관통 손상은 칼의 날 부분이 관통한 경우 공통으로 "V" 유형의 손상이 나타났으며, 칼의 등 부분이 관통한 칼의 경우 "T", "ㅁ", 갈고리, "ㄷ" 유형의 손상이 나타났다. 또한, 가위의 경우 모두 "Y" 유형의 손상이 공통으로 나타났다. 화학약품에 의한 섬유 손상은 유류 흔적, 부식, 분해, 수축, 변색 등 다양한 손상이 나타났으며, 화학약품과 섬유의 종류에 따라 나타나는 손상에 차이를 보였다. 섬유의 물리적 손상은 공구의 형태적 특성에 따라 나타나는 특징에 차이를 보였으며, 화학적 손상은 화학약품과 섬유의 종류에 따른 특징 차이를 보임을 확인하였다.

재난사고 정보공유를 위한 LTE-VPN기반 현장조사시스템 성능평가 (Performance Evaluation of LTE-VPN based Disaster Investigation System for Sharing Disaster Field Information)

  • 김성삼;신동윤;노현주
    • 한국산학기술학회논문지
    • /
    • 제21권11호
    • /
    • pp.602-609
    • /
    • 2020
  • 지진, 태풍, 산사태, 건물 붕괴와 같은 대규모 재난 사고 발생시 신속한 현장 상황 파악과 실시간 재난 정보 공유는 현장 통제나 주민 대피 등 재난 대응과 재난 관리 의사결정 단계에서 핵심적인 역할을 수행한다. 본 논문에서는 긴박한 재난 사고 상황에서 효과적인 현장 대응과 재난 사고 현장에서 취득된 관측 데이터와 분석정보를 실시간적으로 연계하고 공유하기 위하여 기존의 국립재난안전연구원에서 운용 중인 재난 사고 현장조사 시스템을 LTE-VPN 기반의 개선된 무선 통신 시스템 환경으로 구축하고, 통신 트래픽 데이터 전송 실험을 통해 현장 조사 시스템의 무선 통신 전송 요구 성능을 분석, 평가하였다. 개선된 무선통신 시스템의 현장 데이터 전송 성능 실험을 수행한 결과, 재난 현장과 끊김 없는 영상 회의 시스템을 보장하기 위해서 최소 4.1 Mbps 이상의 UDP(User Datagram Protocol) 대역 폭이, 현재 조사 차량에 탑재된 조사 장비간 통신과 현장 데이터를 원활하게 공유하기 위해서 약 10 Mbps의 무선 통신 대역폭이 확보되어야 할 것으로 사료된다.

융합적 연구를 위한 도자기 보존과학과 도자사학 언어의 접목: 『경기도 광주관요 종합분석 보고서』를 중심으로 (Making a Linguistic Connection for Interdisciplinary Research between Conservation Science and Ceramic History: The Case of 『Analytical Report of the Royal Kiln Complex at Gwangju in Gyeonggi Province』)

  • 문지호
    • 보존과학회지
    • /
    • 제36권6호
    • /
    • pp.578-590
    • /
    • 2020
  • 한국에서는 1960-70년대를 거치며 도자기라는 유물을 역사적으로 또는 과학적으로 분석하는 학자들이 등장하여 오늘날 각각 도자사와 보존과학이라고 불리는 분과가 형성되었다. 그러나 두 분과는 도자기라는 같은 대상을 연구함에도 독자적인 연구 스타일을 형성한 결과 서로의 연구를 이해하고 소통하는 데 어려움을 겪고 있다. 본고는 백자를 분석한 사례들에 초점을 맞추어, 『경기도 광주관요 종합분석 보고서』와 이 보고서의 분석을 담당한 보존과학자의 다른 연구를 역사적으로 추적함으로써 두 분과가 가진 연구의 특징과 역사를 살피면서 다음과 같은 질문에 답하고자 한다. 첫째, 도자기를 연구하는 두 분과의 설명 스타일이 지닌 특징과 차이는 무엇일까? 둘째, 두 분과의 소통이 점차 어려워지는 이유는 무엇일까? 셋째, 두 분과가 다시 소통할 수 있는 교역지대가 있다면 그 가능 조건과 산물은 무엇일까? 본고에서는 도자기를 분석하는 두 분과의 설명 스타일을 언어적 관점에서 분석한 뒤, 보존과학이 도자사와 공통언어를 공유하고 있음에도 분석기법이 세분화되고 정량화됨에 따라 그 과정에서 생산되는 과학 데이터가 점차 도자사와 무관한 것처럼 보이게 되었음을 주장한다. 그러나 두 분과가 공유한 공통언어의 존재는 보존과학 데이터가 새로이 해석되어 다시 도자사 연구로 확장될 수 있는 가능성을 보여주었다.

K-평균 군집분석을 활용한 중학생의 군집화 및 특성 분석 (Analysis of Characteristics of Clusters of Middle School Students Using K-Means Cluster Analysis)

  • 이재봉
    • 한국과학교육학회지
    • /
    • 제42권6호
    • /
    • pp.611-619
    • /
    • 2022
  • 최근 교육에서 교육 데이터마이닝에 관한 관심이 높아지고 있는 시점에 과학교육에서 평가 결과를 활용하여 학생들에게 적합한 피드백을 제공하기 위해 빅데이터 분석의 적용 가능성을 탐색해 보고자 하였다. 연구에서는 국가수준 학업성취도 평가의 24문항에 응시한 2,576명의 평가 자료를 활용하여 비지도 기계학습의 한 가지 방법인 K-평균 군집분석을 이용하여 학생들을 군집화하였다. 학업성취도 평가 자료를 활용한 군집화 결과, 학생들을 6개의 군집으로 나누어 볼수 있었다. 상위권이나 하위권에 비해 중위권 학생들이 다양하게 다른 군집으로 구분됨을 알 수 있다. 군집분석의 결과를 보면, 군집화에서 가장 중요하게 영향을 주는 요인은 학업 성취였으며, 군집별로는 교육과정의 내용 영역별, 교과 역량별, 정의적 특성 면에서 서로 다른 특성을 보이고 있었다. 하위 군집에서는 정의적 영역 중에서 학습의욕이 중요하게 영향을 주고, 교과 역량 면에서는 과학적 탐구 및 문제 해결력과 과학적 의사소통 능력이 중요하게 영향을 주고 있었다. 내용 영역 면에서는 운동과 에너지와 물질 영역에 대한 성취가 군집의 특성을 구분하는 중요한 요인으로 작용하고 있었다. 따라서 평가 자료를 활용해 학생을 군집화한 후, 이러한 군집별 특성을 바탕으로 학생들에게 학습을 위한 맞춤형 피드백을 제공할 수 있을 것으로 판단된다. 본 연구에서는 이러한 연구 결과를 바탕으로 군집분석 연구 결과 활용의 가능성, 내용 영역별 균형 있는 학습, 교과 역량 증진, 과학적 태도의 향상 등 과학교육의 시사점을 제안하였다.

데이터 특성을 고려한 과학데이터 아카이브 시스템 설계를 위한 Data Curation Profile 분석 (Analysis of Data Curation Profiles for Desinging a Science Data Archive System Considering Data Characteristics)

  • 임종태;서인덕;송희섭;유승훈;정재윤;조중권;;고건식;김병훈;박윤정;송진우;이서희;전현욱;최민웅;노연우;최도진;김연우;복경수;김선태;최명석;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2016년도 춘계 종합학술대회 논문집
    • /
    • pp.23-24
    • /
    • 2016
  • 본 논문에서는 과학 데이터 특성을 고려한 아카이브 시스템 설계를 위한 Data Curation Profile을 분석한다. Data Curation Profile은 생명과학데이터, 천문우주 데이터, 지질 데이터화학데이터, 사회과학데이터 등과 같은 13개의 과학데이터로 이루어져 있다. 13개의 과학데이터의 분석된 내용을 바탕으로 아카이브 시스템 설계시 고려해야 할 과학데이터 특성을 도출하고 이를 아카이브 요소 기술과 연계한다.

  • PDF

과학적 문제해결과정과 컴퓨팅 사고의 관련성 탐색을 통한 컴퓨팅 사고 기반 과학 탐구(CT-SI) 모형의 제안 (Suggestion of Computational Thinking-Scientific Inquiry (CT-SI) Model through the Exploration of the Relationship Between Scientific Problem Solving Process and Computational Thinking)

  • 황요한;문공주
    • 과학교육연구지
    • /
    • 제44권1호
    • /
    • pp.92-111
    • /
    • 2020
  • 컴퓨팅 사고(computational thinking)는 2015 개정 과학교육과정 및 미국의 차세대 과학교육표준(NGSS)에서 새로운 탐구 기능 혹은 역량으로 제시되고 있다. 특히, 2014년부터 교육부가 소프트웨어 교육을 필수화함에 따라 컴퓨팅 사고에 관한 관심은 더욱 커지고 있다. 그러나 과학교육 분야에서 컴퓨팅 사고를 어떻게 접목할 것인가에 대한 논의는 아직 부족한 실정이다. 이에, 본 연구에서는 다양한 관련 분야의 문헌 분석을 통해 컴퓨팅 사고 요소들을 과학 탐구에 접목하는 방안을 마련하고자 하였다. 이를 위해 먼저 컴퓨팅 사고의 요소에 대한 여러 정의를 정리하였고, 이를 활용한 모형을 개발하기 위해 일반 문제해결 과정과 과학적 탐구과정들을 종합적으로 분석하였다. 마지막으로 컴퓨터 과학 분야에서 문제해결에 접목한 사례들과 비교하여 컴퓨팅 사고 기반 과학 탐구(CT-SI) 모형의 요소들을 정리하였다. 정리된 요소들을 이학 전문가들에게 제공하여 각 분야의 연구 과정과 컴퓨팅 사고 요소들을 접목하여 설명하게 한 후, 이를 기반으로 문제발견형 CT-SI 모형과 문제해결형 CT-SI 모형을 개발하였다. 개발된 두 모형은 이학 전문가들에 의해 모형의 단계가 각 분야의 연구에 활용 가능하다고 검토받았으며, '문제발견형'은 과학 연구 과정에서 정보를 선별하고 문제를 분석하는 과정과 이론적 연구에서 근거를 기반으로 하는 추론 연구 과정에 적합하다고 응답하였다. '문제해결형'은 과학의 일반적인 연구 과정 및 공학설계를 활용한 공학적 문제해결과정에 적합하다고 응답하였다. 또한, 현장 교사 2인에 의해 중고등학교 현장 탐구 수업에 적용 가능함을 확인하였다. 본 연구에서 개발된 모형은 다양한 과학 교과의 탐구 활동과 연계할 수 있으며 이를 통해 2015 개정 교육과정에서 제시하고 있는 '자료의 수집, 분석 및 해석', ' 수학적 사고와 컴퓨터 활용' 역량을 길러줄 수 있을 것이다.

A small review and further studies on the LASSO

  • Kwon, Sunghoon;Han, Sangmi;Lee, Sangin
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권5호
    • /
    • pp.1077-1088
    • /
    • 2013
  • High-dimensional data analysis arises from almost all scientific areas, evolving with development of computing skills, and has encouraged penalized estimations that play important roles in statistical learning. For the past years, various penalized estimations have been developed, and the least absolute shrinkage and selection operator (LASSO) proposed by Tibshirani (1996) has shown outstanding ability, earning the first place on the development of penalized estimation. In this paper, we first introduce a number of recent advances in high-dimensional data analysis using the LASSO. The topics include various statistical problems such as variable selection and grouped or structured variable selection under sparse high-dimensional linear regression models. Several unsupervised learning methods including inverse covariance matrix estimation are presented. In addition, we address further studies on new applications which may establish a guideline on how to use the LASSO for statistical challenges of high-dimensional data analysis.