DOI QR코드

DOI QR Code

A study on the determination of substrata using the information of exponential response rate by simulation studies

모의실험을 기반으로 지수형 응답률 보정을 위한 세부 층 결정에 관한 연구

  • Min, Joo-Won (Department of Statistics, Hankuk University of Foreign Studies) ;
  • Shin, Key-Il (Department of Statistics, Hankuk University of Foreign Studies)
  • 민주원 (한국외국어대학교 통계학과) ;
  • 신기일 (한국외국어대학교 통계학과)
  • Received : 2018.07.23
  • Accepted : 2018.09.09
  • Published : 2018.10.31

Abstract

Research on the application of informative sampling technique has been conducted in order to reduce the influence of non-response. Chung and Shin (Korean Journal of Applied Statistics, 30, 993-1004, 2017) showed that the estimation accuracy improved when using exponential response rate information for the parameter estimation if the distribution of errors included in the super population model follows normal distribution. However this method divides the stratum into equally spaced substrata to obtain the sample weight of the informative sampling technique and shows that the accuracy of the estimation improves as the number of substrata increases. In this study, with the given number of total sample size, the optimal substratum boundary points are calculated using equal space, quantile, and LH algorithm; consequently, the results using those methods are compared through simulation. We also studied the criteria to determine the number of substrata and substratum boundaries that can be used in practice with various types of auxiliary variable distributions.

정보적 표본설계 기법을 적용하여 무응답의 영향을 줄이기 위한 연구가 진행되고 있다. 특히 초모집단모형(super population model)에 포함된 오차의 분포가 정규분포를 따르고 응답률이 지수함수를 따를 때 지수형 응답률 정보를 모수추정에 사용함으로써 추정의 정확성이 향상되는 것으로 알려져 있다. 최근 Chung과 Shin (2017)은 정보적 표본설계의 가중치를 구하기 위해 세부 층을 등간격으로 나누는 방법을 고려하였으며 세부 층의 개수가 추정의 정확성에 영향을 주는 것을 확인하였다. 이에 본 연구에서는 주어진 표본 규모에 따른 최적의 세부 층 개수와 최적의 층 경계를 구하기 위해 등간격, 분위수, LH 알고리즘을 이용하여 층을 나누는 방법을 살펴보았으며 모의실험을 통하여 각 방법의 결과를 비교하였다. 또한 다양한 형태의 보조변수 분포를 이용하여 실무에서 사용할 수 있는 세부 층 경계와 세부 층 개수를 정하는 기준을 제안하였다.

Keywords

References

  1. Baillargeon, S. and Rivest L.-P. (2011). The construction of stratified designs in R with the package stratification, Survey Methodology, 37, 53-65.
  2. Chung, H. Y. and Shin, K. I. (2017). Estimation using informative sampling technique when response rate follows exponential function of variable of interest, Korean Journal of Applied Statistics, 30, 993-1004.
  3. Lavallee, P. and Hidiroglou, M. (1988). On the stratification of skewed populations, Survey Methodology, 14, 33-43.
  4. Lee, Y. and Shin, K. I. (2017). A study on sensitivity of representativeness indicator in survey sampling, The Korean Journal of Applied Statistics, 30, 69-82. https://doi.org/10.5351/KJAS.2017.30.1.069
  5. Pfeffermann, D. Krieger, A. M., and Rinott, Y. (1998). Parametric distributions of complex survey data under informative probability sampling, -em Statistica Sinica, 8, 1087-1114.
  6. Pfeffermann, D., Moura, F. A. D. S., and Silva, P. L. D. N. (2006). Multi-level modelling under informative sampling, Biometrika, 93, 943-959. https://doi.org/10.1093/biomet/93.4.943
  7. Pfeffermann, D. and Sverchkov, M. (2003), Small area estimation under informative sampling, 2003 Joint Statistical Meeting-Section on Survey Research Methods, 3284-3295.
  8. Rivest, L. P. (2002). A generalization of Lavallee and Hidiroglou algorithm for stratifications in business survey, Survey Methodology, 28, 191-198.
  9. Schouten, B., Cobben, F., and Bethlehem, J. (2009). Indicators for the representativeness of survey response, Survey Methodology, 35, 101-113.
  10. Sim, S. H. and Shin, K. I. (2014). A composite estimate for cut-off sampling using cost function, The Korean Journal of Applied Statistics, 27, 43-59. https://doi.org/10.5351/KJAS.2014.27.1.043