Unified Approach to Coefficient of Determination $R^2$ Using Likelihood Distancd

우도거리에 의한 결정계수 $R^2$에의한 통합적 접근

  • 허명회 (고려대학교 통계학과) ;
  • 이종한 (고려대학교 통계학과) ;
  • 정진환 (고려대학교 통계학과 석사과정 졸업)
  • Published : 1991.09.01

Abstract

Coefficient of determination $R^2$ is most frequently used descriptive measure in practical use of linear regression analysis. But there have been controversies on defining this measure in the cases of linear regression without the intercept, weighted linear regression and robust linear regression. Several authors such as Kvalseth(1985) and Willet and Singer(1988) proposed many variations of $R^2$ to meet the situations. However, theire measures are not satisfactory due to the lack of a universal principle. In this study, we propose a unfied approach to defining the coefficient of determination $R^2$ using the concept of likelihood distance. This new measure is in good accordance with typical $R^2$ in linear regression and, moreover, can be applied to nonlinear regression models and generalized linear models such as logit and log-linear models.

결정계수 $R^2$은 회귀분석에서 실제적으로는 매우 이용도가 높은 기술 측도라고 하겠으나, 회귀모형이 절편향을 포함하는 표준적인 선형회귀모형 이외인 경우에는 결정계수의 정의에 관하여 여러 논란이 있어 왔다. 절편항이 없는 선형회귀모형에서와 가중선형회귀모형, 로버스트 선형회귀모형에서의 결정계수의 적절한 정의와 용법이 대표적인 문제라고 하겠다. 기존의 여러 연구, 예를 들어 Kvalseth(1985) 나 Willet and Singer(1988)에서는 이러한 각 경우에 각기 적용될 수 있는 결정계수의 여러 변형들을 제안 $\cdot$ 이런 기존의 연구들이 일반적인 원칙이 없이 경우별로 단편적으로 대응하고 있을뿐더러 약간의 오류를 포함하고 있어 오히려 통계전문가가 아닌 통계 이용자들에게 혼란을 불러 일으킬 염려가 있다. 따라서 결정계수의 일반적 정의를 제안한 본 연구는 현재와 같은 결정계수의 여러변종의 범람으로 인한 혼란을 없애는 데 기여하리라고 생각된다. 이 통합결정계수는 尤度거리(likelihood distance)를 이용하여 정의되는데, 선형회귀모형 이외에도 비선형 회귀모형과 일반화 선형모형에 일관되게 적용 가능하다는 장점을 갖는다.

Keywords