초록
여러 통계작성기관에서 실시하는 대부분의 표본조사들은 하나의 표본을 통해 서로 다른 여러 항목들을 조사하는 다목적조사이다. 다목적표본설계에서 층화변수들은 다변량이고 또한 서로 이질적인 속성을 지니는 관심변수들을 종합적으로 고려해야 하므로 층화는 매우 복잡한 양상을 띤다. 본 연구는 K-평균군집법을 적용한 다변량 층화에서 이상점의 효과를 지적하고, 층화 단계에서 사전에 이상점을 고려할 것을 제안하는 연구이다. 농촌생활지표조사를 위한 표본설계의 사례를 통해 이상점을 고려한 층화의 효과를 실증적으로 보인다.
Most of the sample surveys conducted by several statistics preparation agencies are multipurpose surveys inquiring into several distinguishing items through a single sample. In a multipurpose sample design, the stratification tends to be very complex since the stratification variables which are both multivariate and heterogeneous must be considered collectively. In this paper we point out an outlier effect in a multivariate stratification to which the K-means clustering method is applied and propose to consider outliers prior to the stratification step. We also show an empirical stratification effect under consideration of outliers through a case study of sample design for The Rural Living Indicators.