초록
본 연구에서는 평가도구의 구비조건을 갖춘 초등학교 고학년 학생의 과학탐구능력을 측정할 수 있는 과학탐구 능력 평가도구를 개발하고자 하였다. 평가도구를 구성하는 문항은 R&D 방법에 의해 개발되었으며, 2차례에 걸친 과학교육 전문가의 점검과 2번의 현장 검증을 통해 문항을 수정 보완하였다. 각 평가 문항은 교과 내용에 대한 지식이 없어도 해결할 수 있는 범교과적인 문항으로 제작하여 과학탐구능력의 하위 요소들을 측정하고자 하였다. SAPA 교육과정과 제7차 과학과 교육과정에서 제시한 과학탐구과정 요소를 근간으로 관찰, 분류, 측정, 예상, 추리,문제인식, 변인통제,자료해석,결론도출,실험설계의 10가지 하위 요소들을 선정하고 각 요소에 대한 조작적 정의와 평가 목표를 설정하였다. 물질과 에너지, 생명과 환경, 지구와 순환의 3가지 내용 영역의 소재를 중심으로 총 30문항을 개발하였다. 개발된 문항을 과학교육 전문가에게 2회 의뢰하여 타당도, 객관도, 문항의 명료성을 점검 받았으며 2번의 현장 검증을 통해 신뢰도, 변별도, 난이도를 검증하였다. 그 결과 타당도 91.6%, 신뢰도 지수 Cronbach ${\alpha}$-값 0.79, 객관도 93.3%, 변별도 지수 0.30, 난이도 지수 66.1%로 나타났다. 위와 같은 값들은 평가도구가 갖추어야 할 구비조건의 허용 범위내에 있는 것으로 보아 본 연구에서 개발한 과학탐구능력 평가도구는 양호한 것으로 볼 수 있다. 따라서 본 연구에서 개발한 과학탐구능력 평가도구는 초등학생들의 과학탐구능력 성취 수준의 진단, 과학과 교육과정과 교수 학습 자료 및 과학과 교수 학습 방법의 과학탐구능력 반영 수준을 평가하는 도구로도 이용될 수도 있을 것이다.
The purpose of this study is to develop a valid and reliable evaluating instrument for elementary school fifth and sixth graders. The instrument is developed through R&D procedure, which includes two checks of science specialist and two field trials of the instrument. Evaluating items are content-free for each science inquiry skill. Each science inquiry element is based on SAPA and the 7th curriculum. This study has selected 10 science inquiry skills(observing, classifying, measuring, predicting, inferring, recognizing of a problem, controlling variables, interpreting data, drawing a conclusion, designing an experiment), formulated a clear definition of the elements of science inquiry skills, and established the objectives of evaluation. The content areas are divided into three categories, material and energy, life and environment, and the earth and circulation. Each category contains 10 items. So the instrument consists of 30 items. The content validity of items, objectivity of the scoring keys, and clarity of the items has been checked twice by specialists in science education. At the same time, two field trials were performed to produce the reliability of the instruments, discrimination index, and item difficulty index. The instrument has the content validity is 91.6%, reliability 0.79, objectivity 93.3%, discrimination index 0.30, and item difficulty index 66.1%.