DOI QR코드

DOI QR Code

Statistical Matching Techniques Using the Robust Regression Model

로버스트 회귀모형을 이용한 자료결합방법

  • 전명식 (고려대학교 통계학과) ;
  • 정시송 (미래에셋증권 마케팅지원본부) ;
  • 박혜진 (고려대학교 통계학과)
  • Published : 2008.12.31

Abstract

Statistical matching techniques whose aim is to achieve a complete data file from different sources. Since the statistical matching method proposed by Rubin (1986) assumes the multivariate normality for data, using this method to data which violates the assumption would involve some problems. This research proposed the statistical matching method using robust regression as an alternative to the linear regression. Furthermore, we carried out a simulation study to compare the performance of the robust regression model and the linear regression model for the statistical matching.

서로 다른 출처로부터 얻어진 데이터 파일들을 하나의 데이터 파일로 만드는 통계적 자료결합방법은 공통변수와 서로 다른 고유변수를 포함하여 변수들 간에 존재하는 관련성에 대해 살펴볼 수 있다. Robin (1986)이 제안한 일반회귀모형의 예측값을 이용한 통계적 결합방법은 자료에 대한 다변량 정규성을 가정하기 때문에 이 가정을 위반하는 자료를 이용하는 것은 많은 문제를 수반한다. 본 연구는 제공파일의 고유변수에 모분포를 반영하지 못하는 특이점이 존재하는 경우, 일반회귀모형을 이용한 통계적 결합방법의 대안으로 로러스트 회귀추정방법을 이용한 자료결합방법을 제안하였다. 나아가 로버스트 회귀모형을 이용한 결합방법과 일반회귀모형을 이용한 결합방법에서의 상관관계 및 결정계수 보존에 관한 성능을 비교하기 위하여 모의실험을 수행하였다.

Keywords

References

  1. Kadane, J. B. (1978). Some statistical problems in merging data files, In 1978 Compendium of Tax Research, Washington, DC:U.S. Department of the Treasury, 159-171. (Reprinted in Journal of Offcial Statistics, 17, 423-433.)
  2. Moriarity, C. and Scheuren, F. (2001). Statistical matching: A paradigm for assessing the uncertainty in the procedure, Journal of official Statistics, 17, 407-422
  3. Rassler, S. (2002). Statistical Matching: A Frequentist Theory, Practical Applications, and Alternative Bayesian Approaches, Springer-Verlag, New York
  4. Rassler, S. (2004). Data fusion: Identification problems, validity and multiple imputation, Austrian Journal of Statistics, 33, 153-171
  5. Rubin, D. B. (1986). Statistical matching using file concatenation with adjusted weights and multiple imputations, Journal of Business & Economic Statistics, 4, 87-94 https://doi.org/10.2307/1391390