DOI QR코드

DOI QR Code

Stratification Method Using κ-Spatial Medians Clustering

κ-공간중위 군집방법을 활용한 층화방법

  • Published : 2009.08.31

Abstract

Stratification of population is widely used to improve the efficiency of the estimation in a sample survey. However, it causes several problems when there are some variables containing outliers. To overcome these problems, Park and Yun (2008) proposed a rather subjective method, which finds outliers before $\kappa$-means clustering for stratification. In this study, we propose the $\kappa$-spatial medians clustering method which is more robust than $\kappa$-means clustering method and also does not need the process of finding outliers in advance. We investigate the characteristics of the proposed method through a case study used in Park and Yun (2008) and confirm the efficiency of the proposed method.

표본조사에서 널리 쓰이는 모집단의 층화는 추정의 효율을 높이는 방법 중의 하나지만, 이상점을 포함하는 변수가 있는 경우에 여러 가지 문제점을 유발시킬 수 있다. 특히, 이상점이 존재하는 다변량 자료의 경우, 층화를 위한 $\kappa$-평균 군집방법은 이상점에 매우 민감하여 추정의 효율을 떨어뜨릴 수 있다. 본 연구에서는 이상점이 존재하는 다변량 자료의 층화를 위해 $\kappa$-평균 군집방법보다 강건하며 이상점을 따로 식별하는 과정이 배제된 $\kappa$-공간중위수 군집방법을 제안한다. 기존 관련연구인 박진우와 윤석훈 (2008)과 동일한 자료에 대한 사례분석을 통해 층화과정들을 비교, 검토하였으며 이들의 효율성을 추정량의 분산을 통해 비교하였다.

Keywords

References

  1. 농촌진흥청 (2006). <2006 농촌생활지표>, 농촌진흥청
  2. 박진우, 윤석훈 (2008). 이상점을 고려한 다변량 층화, <응용통계연구>, 21, 377-385 https://doi.org/10.5351/KJAS.2008.21.3.377
  3. 통계청 (2006). <2005 인구주택총조사>, 통계청
  4. Brown, B. M. (1983). Statistical uses of the spatial median, Journal of the Royal Statistical Society. Series B, 45, 25-30
  5. Cuests-Albertos, J. A., Gordaliza, A. and Matran, C. (1997). Grand tour and projection pursuit, Journal of Computational and Graphical Statistics, 4, 155-172 https://doi.org/10.2307/1390844
  6. Golder, P. A. and Yeomans, K. A. (1973). The use of cluster analysis for stratification, Applied Statistics, 22, 213-219 https://doi.org/10.2307/2346922
  7. Jarque, C. M. (1981). A solution to the problem of optimum stratification in multivariate sampling, Journal of the Royal Statistical Society. Series C (Applied Statistics), 30, 163-169 https://doi.org/10.2307/2346387
  8. Jin, S. (1999). A study on the partitioning method for cluster analysis, 박사학위논문, 고려대학교
  9. Lavallee, P. and Hidiroglou, M. A. (1998). On the stratification of skewed populations, Survey Methodology, 14, 33-43
  10. Milligan, G. W. (1980). An examination of the effect of six types of error perturbation of fifteen clustering algorithms, Psychometrika, 45, 325-342 https://doi.org/10.1007/BF02293907
  11. Milligan, G. W. (1981). A review of Monte Carlo tests of cluster analysis, Multivariate Behavioral Research, 16, 379-407 https://doi.org/10.1207/s15327906mbr1603_7
  12. Schuenemeyer, J. H. (1975). Maximum eccentricity as a union-intersection test in multivariate analysis, Geogia University, Athens