• 제목/요약/키워드: 정답 특징

검색결과 57건 처리시간 0.025초

OECD 주관 학생 성취도 국제 비교 연구(PISA 2000) 지구 환경 과학 영역 성취도에서의 성(性) 차이 (Gender Differences in Achievement of Earth and Environmental Area in PISA 2000)

  • 신동희;박정;노국향
    • 한국과학교육학회지
    • /
    • 제22권1호
    • /
    • pp.40-53
    • /
    • 2002
  • 이 연구의 목적은 만 15세 학생들의 과학적 소양을 평가하는 학생 성취도 국제 비교 연구인 PISA 2000의 지구 환경 과학 영역에 해당하는 13개 문항에 대한 우리 나라 여학생과 남학생의 성취도 차이, 여학생과 남학생에게 유리한 문항의 특징, 우리 나라 학생들이 가지는 지구 과학 관련 오개념 등을 파악하는 것이다. 이를 위해 13개 지구 환경 과학 문항의 정답율 및 문항 반응 이론에 의한 정답 반응율을 분석하였다. 분석 결과, 남학생의 평균 정답율이 여학생의 평균 정답율보다 통계적으로 의미 있는 차이를 보이며 높게 나타났으나, 성취 능력이 높은 집단에서는 여학생이 남학생보다 전반적으로 높은 성취 수준의 경향을 보였다. 특히, 문항의 유형에 따라 여학생과 남학생의 정답 반응 경향이 뚜렷하게 차이가 났는데, 성취 능력이 높은 여학생의 경우 서술형 문항에서 가장 높은 성취도 결과를 나타냈다. 여학생에게 유리하게 작용한 문항은 긴 문장의 서술이 필요하거나 과학의 과정과 관련되는 경향을 보였고, 남학생에게 유리하게 작용한 문항은 과학적 지식을 묻거나 자료 해석과 관련되는 경향을 보였다. 한편, 우리 나라 학생들 중에는 지구의 자전축, 적도의 방향, 온실 효과의 원인 등 지구 환경 과학 관련 오개념을 지니고 있는 학생들이 매우 많다는 것도 밝혀졌다.

생성형 인공지능의 수학 문제 풀이에 대한 성능 분석: ChatGPT 4, Claude 3 Opus, Gemini Advanced를 중심으로 (Analysis of generative AI's mathematical problem-solving performance: Focusing on ChatGPT 4, Claude 3 Opus, and Gemini Advanced)

  • 오세준;윤정은;정유진;조윤주;심효섭;권오남
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제63권3호
    • /
    • pp.549-571
    • /
    • 2024
  • 디지털·AI 기반 교수·학습이 강조됨에 따라 생성형 AI의 교육적 활용에 대한 논의가 활발해지고 있다. 본 연구는 고등학교 1학년 수학 교과서 5종의 예제와 문제 풀이에 대한 ChatGPT 4, Claude 3 Opus, Gemini Advanced의 수학적 성능을 분석하였다. 총 1,317개 문항에 대해 전체 정답률과 기능별 특징을 살펴본 결과, ChatGPT 4의 전체 정답률이 0.85로 가장 높았고, Claude 3 Opus가 0.67, Gemini Advanced가 0.42 순으로 나타났다. 기능별로는 함수 구하기와 증명하기에서 세 모델 모두 높은 정답률을 보였으나, 설명하기와 그래프 그리기에서는 상대적으로 낮은 정답률을 보였다. 특히 경우의 수 세기에서 ChatGPT 4와 Claude 3 Opus가 1.00의 정답률을 보인 반면, Gemini Advanced는 0.56으로 낮았다. 또한 모든 모델이 벤 다이어그램을 이용한 설명하기와 이미지 생성이 필요한 문제에서 어려움을 겪었다. 연구 결과를 바탕으로 교사들은 각 AI 모델의 강점과 한계를 파악하고 이를 수업에 적절히 활용할 수 있을 것이다. 본 연구는 생성형 AI의 수학적 성능을 분석함으로써, 실제 수학 수업에서의 생성형 AI의 활용 가능성을 제시했다는 점에서 의의가 있다. 또한 인공지능시대의 수학 교육에서 교사의 역할을 재정립하는 데 중요한 시사점을 제공하였다. 향후 생성형 AI와 교사의 협력적 교육 모델 개발, AI를 활용한 개별화 학습 방안 연구 등이 필요할 것이다.

동적 메모리 네트워크의 시간 표현과 데이터 확장을 통한 질의응답 최적화 (Question Answering Optimization via Temporal Representation and Data Augmentation of Dynamic Memory Networks)

  • 한동식;이충연;장병탁
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.51-56
    • /
    • 2017
  • 질의응답 문제를 인공지능 모델을 통해 해결하는 연구는 메모리 네트워크의 등장으로 인해 방법론의 변화를 맞이하고 있으며, 그 중 동적 메모리 네트워크(DMN)는 인간 기억 체계에 착안하여 신경망 기반의 주의 기제를 적용하면서, 질의응답에서 일어나는 각 인지 과정들을 모듈화 했다는 특징들을 갖는다. 본 연구에서는 부족한 학습 데이터를 확장 시키고, DMN이 내포하고 있는 시간 인식의 한계를 개선해 정답률을 높이고자 한다. 실험 결과, 개선된 DMN은 1K-bAbI 문제의 테스트 데이터에서 89.21%의 정답률과, 95%를 질의응답 통과의 기준의 정답률으로 가정할 때 12개의 과제를 통과하는 성능을 보여 정확도 면에서 기존의 DMN에 비해 13.5%p 만큼 더 높고, 4개의 과제를 추가로 통과하는 성능 향상을 보여주었다. 또한 뒤이은 실험을 통해, 데이터 내에서 비슷한 의미 구조를 가지는 단어들은 벡터 공간상에서 강한 군집을 이룬다는 점과, 일화 기억 모듈 통과 횟수와 근거 사실 수의 성능에 큰 영향을 미치는 직접적인 연관성을 발견하였다.

지구과학 문제 풀이에서 활용되는 통합 사고 유형 (Types of Integrative Thinking Ability in Solving Earth Science Items)

  • 권수지;신동희
    • 과학교육연구지
    • /
    • 제42권3호
    • /
    • pp.322-333
    • /
    • 2018
  • 본 연구의 목적은 다양한 학습 배경을 가진 학습자가 지구과학 문제 풀이에서 활용하는 통합 사고의 유형과 특성을 파악하는 것이다. 중학교 2학년 4명을 대상으로 학습자의 과학 학습 관련 배경을 묻는 사전 설문조사지, 지구과학 교과를 중심으로 상황적 통합 영역의 문항이 포함된 검사지를 사용하여 조사했다. 검사지는 총 200문항으로, 10회에 걸쳐 시행되었다. 통합적 사고 능력을 파악하기 위한 문항은 40문항이었고 일반 문항이 160문항이었다. 학생들마다 일반 문항 정답율과 통합 문항 정답율에 있어 일관된 연관성을 드러내지 않았다. 각 연구 대상자의 통합 사고력의 유형을 파악하기 위하여 검사 문항 풀이 후, 유형별 정답률을 분석했고, 각 문항 풀이에 활용한 사고의 특징 파악을 위하여 연구 대상자를 면담하고 그 내용을 분석했다. 그 결과 문제 풀이에 사용한 통합 사고 유형을 지식 연계형, 실생활 연계형, 통합 탐구형으로 구분할 수 있었다. 과학 교수 학습에서 학생들의 특성을 고려하여 통합 사고력을 향상시킬 수 있는 다양한 방안이 연구되어야 할 것이다.

ICLAL: 인 컨텍스트 러닝 기반 오디오-언어 멀티 모달 딥러닝 모델 (ICLAL: In-Context Learning-Based Audio-Language Multi-Modal Deep Learning Models)

  • 박준영;여진영 ;이고은 ;최창환;최상일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.514-517
    • /
    • 2023
  • 본 연구는 인 컨택스트 러닝 (In-Context Learning)을 오디오-언어 작업에 적용하기 위한 멀티모달 (Multi-Modal) 딥러닝 모델을 다룬다. 해당 모델을 통해 학습 단계에서 오디오와 텍스트의 소통 가능한 형태의 표현 (Representation)을 학습하고 여러가지 오디오-텍스트 작업을 수행할 수 있는 멀티모달 딥러닝 모델을 개발하는 것이 본 연구의 목적이다. 모델은 오디오 인코더와 언어 인코더가 연결된 구조를 가지고 있으며, 언어 모델은 6.7B, 30B 의 파라미터 수를 가진 자동회귀 (Autoregressive) 대형 언어 모델 (Large Language Model)을 사용한다 오디오 인코더는 자기지도학습 (Self-Supervised Learning)을 기반으로 사전학습 된 오디오 특징 추출 모델이다. 언어모델이 상대적으로 대용량이기 언어모델의 파라미터를 고정하고 오디오 인코더의 파라미터만 업데이트하는 프로즌 (Frozen) 방법으로 학습한다. 학습을 위한 과제는 음성인식 (Automatic Speech Recognition)과 요약 (Abstractive Summarization) 이다. 학습을 마친 후 질의응답 (Question Answering) 작업으로 테스트를 진행했다. 그 결과, 정답 문장을 생성하기 위해서는 추가적인 학습이 필요한 것으로 보였으나, 음성인식으로 사전학습 한 모델의 경우 정답과 유사한 키워드를 사용하는 문법적으로 올바른 문장을 생성함을 확인했다.

수학사의 한 넓이 문제에 대한 초등 수학 우수아의 풀이 다양성 탐색 (Diversity of Problem Solving Methods about a Problem of Area from the History of Mathematics by High Achieving Elementary School Students)

  • 장혜원
    • 한국수학사학회지
    • /
    • 제21권4호
    • /
    • pp.153-168
    • /
    • 2008
  • 이 연구는 수학교육에서 문제해결의 중요성에 근거하여 초등 수학 우수아들의 문제 푸는 방법에 대해 조사하였다. 조선시대 수학책인 <산학입문>에서 발췌하여 수정한 문제인 노몬의 넓이 구하는 문제가 주어질 때 84명의 초등 수학 우수아의 반응 및 풀이 과정을 분석하여 분류하였다. 이 중 정답을 얻은 학생들(73.8%)이 사용한 접근 방법은 크게 수치적 접근과 재구성 접근의 두 가지로 나뉜다. 두 접근은 다시 각각 세 가지, 여섯 가지 방법으로 세분할 수 있어 각각의 특징을 학생 사례와 함께 고찰하였다. 그 중 동양 수학사에서 이용된 방법을 포함하여 도형의 재구성을 통한 방법은 특히 주목할 만하다 전체 정답자의 절반에 가까운 수가 수치적 접근을 이용하였음에도 불구하고 동일 문제에 대한 다양한 풀이를 관찰할 수 있었고, 그 분석을 통해 학생들의 사고 특징을 파악할 수 있었다.

  • PDF

본문-질의 비교를 활용한 오답 질의 분류 (Incorrect query classification via context-query comparison)

  • 한상도;유환조;이근배;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.440-442
    • /
    • 2019
  • 본 논문은 딥 러닝 기반의 독해 기술이 풀지 못하는 문제를 분류해내는 기술에 관한 것이다. 해당 연구에서는 독해 데이터 및 시스템 결과 분석을 통해 시스템이 풀지 못하는 문제들의 특징을 도출해내고, 이에 알맞은 전략들을 시도해 보았다. 분석 결과에 따른 시도들은 각 목적에 부합하는 결과를 나타냈으며, 특히 독해 기술의 특징에 기반한 방법론이 효과적이었다. 본 논문에서 제안하는 방법은 본문과 질의 간 유사도 행렬을 활용하는 것으로, 기존의 독해 기술이 본문과 질의의 유사도를 활용하여 정답을 내는 것에 영감을 얻었다.

  • PDF

TIMSS 2003 과학 공개 문항 내용 분석에서 나타난 성별 문항 응답 특성 (Gender Differences in Content Analysis of TIMSS 2003 Released Items)

  • 신동희;권오남;김희백
    • 한국과학교육학회지
    • /
    • 제26권6호
    • /
    • pp.732-742
    • /
    • 2006
  • 이 연구는 우리 나라 여학생들에게 취약한 과학 학습의 특징을 파악하고 개선 방향을 제시하기 위한 목적을 가진다. TIMSS 2003 과학 공개 문항 95개를 분석한 결과, 우리 나라 여학생들에게 유리한 문항은 추론과 분석 관련 문항, 아주 어렵거나 아주 쉬운 문항, 이미 학교에서 학습한 문항, 순수 과학적 상황의 문항 등이었다. 우리 나라 여학생들은 개념 이해나 사실적 지식 관련 문항에서 취약했는데, 여학생에게 유리한 추론과 분석 문항 중에서도 과학 지식이 개입될 경우 여학생에게 불리하게 작용했다. 정답율에 있어서도 정답율 80% 이상을 받은 쉬운 문항 또는 정답율이 20% 미만인 어려운 문항에서 여학생들이 상대적으로 유리했다. 한편, 학교 과학 교육의 과정에서 학습하지 않은 내용의 문항에서 남학생에 비해 현저하게 낮은 정답율을 보였는데, 이는 여학생들이 과학에 대한 전반적인 관심과 흥미 부족에서 기인할 수 있다. 또한, 여학생들은 상황적 지식보다는 탈상황적 지식에서 강해 과학에 대한 진정한 의미의 지식을 남학생보다 덜 갖추고 있음도 드러났다. 문항 분석 결과를 바탕으로, 여학생을 배려하는 과학 교육으로 개선되기 위해서 우선 여학생들도 학교 밖에서 이루어지는 일상생활에서 자연스럽게 과학을 경험할 수 있는 분위기를 조성하고, 여학생에게 취약한 과학 개념에 대한 교수-학습 프로그램을 개발해야 하며, 과학 교육에서 의 성 차이 쟁점을 교육 과정 개편이나 교사 교육 과정에 적극적으로 반영해야 할 것을 제안한다.

신뢰성이 부족한 FAQ 데이터셋에서의 강건성 개선을 위한 모델의 예측 강도 기반 손실 조정 정규화 (Loss-adjusted Regularization based on Prediction for Improving Robustness in Less Reliable FAQ Datasets)

  • 박예원;양동일;김수필;이강욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.18-22
    • /
    • 2019
  • FAQ 분류는 자주 묻는 질문을 범주화하고 사용자 질의에 대해 가장 유사한 클래스를 추론하는 방식으로 진행된다. FAQ 데이터셋은 클래스가 다수 존재하기 때문에 클래스 간 포함 및 연관 관계가 존재하고 특정 데이터가 서로 다른 클래스에 동시에 속할 수 있다는 특징이 있다. 그러나 최근 FAQ 분류는 다중 클래스 분류 방법론을 적용하는 데 그쳤고 FAQ 데이터셋의 특징을 모델에 반영하는 연구는 미미했다. 현 분류 방법론은 이러한 FAQ 데이터셋의 특징을 고려하지 못하기 때문에 정답으로 해석될 수 있는 예측도 오답으로 여기는 경우가 발생한다. 본 논문에서는 신뢰성이 부족한 FAQ 데이터셋에서도 분류를 잘 하기 위해 손실 함수를 조정하는 정규화 기법을 소개한다. 이 정규화 기법은 클래스 간 포함 및 연관 관계를 반영할 수 있도록 오답을 예측한 경우에도 예측 강도에 비례하여 손실을 줄인다. 이는 오답을 높은 확률로 예측할수록 데이터의 신뢰성이 낮을 가능성이 크다고 판단하여 학습을 강하게 하지 않게 하기 위함이다. 실험을 위해서는 다중 클래스 분류에서 가장 좋은 성능을 보이고 있는 모형인 BERT를 이용했으며, 비교 실험을 위한 정규화 방법으로는 통상적으로 사용되는 라벨 스무딩을 채택했다. 실험 결과, 본 연구에서 제안한 방법은 기존 방법보다 성능이 개선되고 보다 안정적으로 학습이 된다는 것을 확인했으며, 데이터의 신뢰성이 부족한 상황에서 효과적으로 분류를 수행함을 알 수 있었다.

  • PDF

가우시안 혼합 모델을 이용한 하드 디스크 결함 분포의 패턴 분류 (Pattern Classification of Hard Disk Defect Distribution Using Gaussian Mixture Model)

  • 전재영;김정헌;문운철;최광남
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.482-486
    • /
    • 2008
  • 본 논문에서는 하드 디스크 드라이브(Hard Disk Drive, HDD) 생산 공정 과정에서 발생할 수 있는 불량 HDD의 결함 분포에 대해서 패턴을 자동으로 분류해주는 기법을 제시한다. 이를 위해서 표준 패턴 클래스로 분류되어 있는 불량 HDD의 각 클래스의 확률 모델을 GMM(Gaussian Mixture Model)로 가정한다. 실험은 전문가에 의해 분류된 실제 HDD 결함 분포로부터 5가지의 특징 값들을 추출한 후, 결함 분포의 클래스를 표현할 수 있는 GMM의 파라미터(Parameter)를 학습한다. 각 모델의 파라미터를 추정하기 위해 EM(Expectation Maximization) 알고리즘을 사용한다. 학습된 GMM의 분류 테스트는 학습에 사용되지 않은 HDD 결함 분포에서 5가지의 특징 값을 입력 값으로 추정된 모델들의 파라미터 값에 의해 사후 확률을 구한다. 계산된 확률 값 중 가장 큰 값을 갖는 모델의 클래스를 표준 패턴 클래스로 분류한다. 그 결과 제시된 GMM을 이용한 HDD의 패턴 분류의 결과 96.1%의 정답률을 보여준다.

  • PDF