초.중.고등학교 확률과 통계 단원에 나타난 표본개념에 대한 분석

Features of sample concepts in the probability and statistics chapters of Korean mathematics textbooks of grades 1-12

  • 투고 : 2011.09.30
  • 심사 : 2011.11.18
  • 발행 : 2011.11.30


본 연구는 고등학교 수학교과에서 배우는 모평균의 신뢰구간 구하기와 같은 통계적 추론 능력을 기르기 위한 방안의 첫 단계연구이다. 통계적 추론과정을 비판적으로 분석하여 신뢰할만한 추론방법으로 이를 인정할 수 있는 표본개념의 형성을 위해, 연구자들은 우연과 필연, 귀납과 연역, 가능성원리, 통계량의 변이성, 통계적 모형 등의 하위 개념들이 형성되어야 한다고 보았다. 그리고 초중등 통계단원의 전 과정에서 이들 개념의 체계적인 발달을 도모해야 한다는 전제 아래, 초 중 고등학교 통계단원을 분석해 본 결과는 아래와 같았다. 첫째, 문제해결 방법 선택의 지도와 관련하여, 통계적 방법을 선택할 문제 상황으로서, 우연적 상황을 필연적 상황과 구분하기위한 설명이 있는 교과서가 초등학교에는 없고, 중등 수준에서도 매우 드물었다. 둘째 표본의 모집단 관련 의미를 이해시키려는 단계적 준비가 미흡하다고 할 수 있다. 전체와 부분의 모집단과 표본 구분이 고등학교에서 비로소 공식화되고 있으며, 초 중학교에서 사용되는 표본자료는 그것으로부터 얻어지는 계산적 결과에만 초점이 맞추어짐으로서, 학년이 올라감에 따라 모집단을 향한 귀납적 추론의 신뢰성에 대한 비판적 사고의 깊이가 더해지는 모습을 찾아보기 어려웠다. 셋째, 무작위 추출이 갖는 대표성의 의미에 대한 설명보다는 무작위 활동 자체에 대한 설명이 중심이 됨으로서 무작위 추출의 확률적 의미, 즉 무작위 표본을 통해 구해질 통계량의 표집분포에서의 (상속된) 무작위성을 위한 담보로서의 목적에 대한 설명이 없다는 점이다. 넷째 통계적 추론을 수학(연역)적 추론과 구분해 주는 설명이 없을 뿐 아니라, 학습자의 논리성 발달 수준에 맞게 변화하는 가능성원리에 대한 설명, 적용 등을 전혀 찾기 어렵다는 점이다. 다섯째 통계량의 우연변이성과 그에 따른 표집분포의 존재에 대한 이해를 추구하는 설명을 찾기 어렵다는 점이다. 표집분포를 수학적으로 구하는 것은 매우 어려운 과정이지만, 그것의 존재를 인식하느냐 못하느냐는 통계적 추론 자체의 이해 가능성을 달리하는 중요한 문제이기 때문이다.

This study is the first step for us toward improving high school students' capability of statistical inferences, such as obtaining and interpreting the confidence interval on the population mean that is currently learned in high school. We suggest 5 underlying concepts of 'discretion of contingency and inevitability', 'discretion of induction and deduction', 'likelihood principle', 'variability of a statistic' and 'statistical model', those are necessary to appreciate statistical inferences as a reliable arguing tools in spite of its occasional erroneous conclusions. We assume those 5 concepts above are to be gradually developing in their school periods and Korean mathematics textbooks of grades 1-12 were analyzed. Followings were found. For the right choice of solving methodology of the given problem, no elementary textbook but a few high school textbooks describe its difference between the contingent circumstance and the inevitable one. Formal definitions of population and sample are not introduced until high school grades, so that the developments of critical thoughts on the reliability of inductive reasoning could not be observed. On the contrary of it, strong emphasis lies on the calculation stuff of the sample data without any inference on the population prospective based upon the sample. Instead of the representative properties of a random sample, more emphasis lies on how to get a random sample. As a result of it, the fact that 'the random variability of the value of a statistic which is calculated from the sample ought to be inherited from the randomness of the sample' could neither be noticed nor be explained as well. No comparative descriptions on the statistical inferences against the mathematical(deductive) reasoning were found. Few explanations on the likelihood principle and its probabilistic applications in accordance with students' cognitive developmental growth were found. It was hard to find the explanation of a random variability of statistics and on the existence of its sampling distribution. It is worthwhile to explain it because, nevertheless obtaining the sampling distribution of a particular statistic, like a sample mean, is a very difficult job, mere noticing its existence may cause a drastic change of understanding in a statistical inference.
