DOI QR코드

DOI QR Code

The Reanalysis of the Donation Data Using the Zero-Inflated Possion Regression

0이 팽창된 포아송 회귀모형을 이용한 기부회수 자료의 재분석

  • Published : 2009.08.31

Abstract

Kim et al. (2006) analyzed the donation data surveyed by Voluneteer 21 in year 2002 at South Korea using a Poisson regression based on the mixture of two Poissons and detected significant variables for affecting the number of donations. However, noting the large deviation between the predicted and the actual frequencies of zero, we developed in this note a Poisson regression model based on a distribution in which zero inflated Poisson was added to the mixture of two Poissons. Thus the population distribution is now a mixture of three Poissons in which one component is concentrated on zero mass. We used the EM algorithm for estimating the regression parameters and detected the same variables with Kim et al's for significantly affecting the response. However, we could estimate the proportion of the fixed zero group to be 0.201, which was the characteristic of this model. We also noted that among two significant variables, the income and the volunteer experience(yes, no), the second variable could be utilized as a strategric variable for promoting the donation.

김인영 등 (2006)은 두 개 포아송 분포의 혼합모형에 기초한 회귀모형으로써 2002년 (사)볼런티어 21에서 실시한 설문조사 자료를 분석하여 우리나라 개인들이 기부한 횟수에 영향을 미치는 유의적 변수들을 식별하였다. 본고에서는 김인영 등 (2006)에서도 언급하였듯이 기부횟수 0의 관찰 빈도와 예측 빈도간 차이가 유독 큰 점을 감안하여, 0이 팽창된 포아송(zero inflated Poisson: ZIP)을 기존의 두 개의 포아송 혼합분포에 추가하여 일종의 세 개 포아송 혼합분포 형태로 모집단 분포를 구성하며 동 모형의 회귀모형으로써 기부횟수 자료를 재분석하고자 한다. 회귀계수에 대한 추정은 두 단계 EM 알고리즘으로 이루어 졌고, 유의적 설명 변수의 검색은 김인영 등 (2006)과 같았으나 본 연구에서는 고정된 령(零)군의 비율을 0.201로 추정할 수 있었으며, 두 가지 유의적 설명변수인 소득과 자원봉사 중에서 자원봉사가 기부 횟수를 늘리는 안정적 도구 변수로써 작용할 수 있음을 보고하고 있다.

Keywords

References

  1. 김인영, 박수범, 강병수, 박태규 (2006). 포아송 분포의 혼합모형을 이용한 기부 횟수 자료 분석, <응용통계연구>, 19, 1-12 https://doi.org/10.5351/KJAS.2006.19.1.001
  2. Bohning, D., Dietz, E., Schlattmann, P., Mendonca, L. and Kirchner, U. (1999). The zero-inflated Poisson model and the decayed, missing and filled teeth index in dental epidemiology, Journal of the Royal Statistical Society: Series A (Statistics in Society), 162, 195-209 https://doi.org/10.1111/1467-985X.00130
  3. Dempster, A. P., Laird, N. M. and Rubin, D. B. (1977). Maximum likelihood from incomplete data via the EM algorithm (with discussion), Journal of the Royal Statistical Society: Series B, 39, 1-38
  4. Efron, B. and Tibshirani, R. J. (1993). An Introduction to the Bootstrap, Chapman & Hall, New York
  5. Hurvich, C. M. and Tasi, C. L. (1989). Regression and time series model selection in small samples, Biometrika, 76, 297-307 https://doi.org/10.1093/biomet/76.2.297
  6. Johnson, N. L., Kotz, S. and Kemp, A. W. (1992). Univariate Discrete Distributions, Second Ed. Wiley, New York
  7. Jung, B. C., Juhn, M. and Lee, J. W. (2005). Bootstrap tests for overdispersion in a zero-inflated Poisson regression model, Biometrics, 61, 626-629 https://doi.org/10.1111/j.1541-0420.2005.00368.x
  8. Lam, K. F., Xue, H. and Cheung, Y. B. (2006). Semiparametric analysis of zero-inflated count data, Biometrics, 62, 996-1003 https://doi.org/10.1111/j.1541-0420.2006.00575.x
  9. Lambert, D. (1992). Zero-inflated Poisson regression, with an application to defects in manufacturing, Technometrics, 34, 1-14 https://doi.org/10.2307/1269547
  10. Wang, P., Puterman, M. L., Cockburn, I. and Le, N. (1996). Mixed Poisson regression models with covariate dependent rates, Biometrics, 52, 381-400 https://doi.org/10.2307/2532881

Cited by

  1. Reanalysis of 2002 Donation Frequency Data: Corrections and Supplements vol.27, pp.5, 2014, https://doi.org/10.5351/KJAS.2014.27.5.743