초록
신뢰도 연구는 한 명의 평가자가 연구 대상을 반복 측정하거나 여러 명의 평가자가 한 대상을 평가할 때 평가자 내, 평가자 간 일치도를 알아보는 연구로 임상 의학 분야에서 빈번하게 쓰이고 있다. 이 같은 신뢰도 연구에서 적절한 표본수, 평가자수 및 반복수를 결정하는 것은 비용과 시간 측면에서 보다 더 효율적인 연구를 할 수 있게 해주는 중요한 요인이다. 본 연구의 목적은 신뢰도 연구에서 측정치가 정량적일 때 쓰이는 신뢰도 계수인 급내상관계수(ICC)와 관련한 기존의 표본수 산출 방법들을 비교분석하여 적절한 표본수나 반복수를 결정할 때 그 지침을 제공하는데 있다. 기존 논문에서 제시한 Walter 등 (1998), Giraudeau와 Mary (2001), Saito 등 (2006) 그리고 Bonett (2002)의 방법들을 비교하였다. 임의효과 일원배치 모형일 때 같은 조건에서 가장 적은 양의 정보를 필요로 하는 방법을 찾는 목적으로 요인을 변화시켜 가면서 표본수, 반복수, 신뢰구간 폭을 비교한다. 비교해 본 결과, 가장 작은 수의 표본을 필요로 하는 방법은 Giraudeau의 방법, 가장 작은 수의 반복을 필요로 하는 방법은 Saito의 방법으로 나타났다. 가장 많은 수의 표본과 반복을 필요로 한 방법은 Bonett의 방법이었다. 정도는 Giraudeau의 방법이 가장 높았고 Walter, Saito, Bonett 순으로 정도가 떨어졌다.
In medical practice and research, the problem of assessing reliability between two or more quantitative measures is quite common. Intraclass correlation coefficient(ICC) is commonly used to scale of reliability. Some methods were developed to calculate the required number of subjects, raters or replicates in one-way or two-way random ANOVA models. This paper, studies and compares the performance of four methods such as Walter et al. (1998), Giraudeau and Mary (2001), Saito et al. (2006) and Bonett (2002). In order to compare the efficiency of methods we compare the number of subjects, replicates and the width of confidence interval of ICC needed for some specific ICC values. In the case of subject size, Giraudeau's method is the best. In case of the number of replicates, Saito's method was superior to others. The width of confidence interval of ICC was narrower for Giraudeau's method than any others.