DOI QR코드

DOI QR Code

Mixed-effects zero-inflated Poisson regression for analyzing the spread of COVID-19 in Daejeon

혼합효과 영과잉 포아송 회귀모형을 이용한 대전광역시 코로나 발생 동향 분석

  • Kim, Gwanghee (Department of Information and Statistics, Chungnam National University) ;
  • Lee, Eunjee (Department of Information and Statistics, Chungnam National University)
  • 김광희 (충남대학교 정보통계학과) ;
  • 이은지 (충남대학교 정보통계학과)
  • Received : 2021.02.17
  • Accepted : 2021.05.26
  • Published : 2021.06.30

Abstract

This paper aims to help prevent the spread of COVID-19 by analyzing confirmed cases of COVID-19 in Daejeon. A high volume of visitors, downtown areas, and psychological fatigue with prolonged social distancing were considered as risk factors associated with the spread of COVID-19. We considered the weekly confirmed cases in each administrative district as a response variable. Explanatory variables were the number of passengers getting off at a bus station in each administrative district and the elapsed time since the Korean government had imposed distancing in daily life. We employed a mixed-effects zero-inflated Poisson regression model because the number of cases was repeatedly measured with excess zero-count data. We conducted k-means clustering to identify three groups of administrative districts having different characteristics in terms of the number of bars, the population size, and the distance to the closest college. Considering that the number of confirmed cases might vary depending on districts' characteristics, the clustering information was incorporated as a categorical explanatory variable. We found that Covid-19 was more prevalent as population size increased and a district is downtown. As the number of passengers getting off at a downtown district increased, the confirmed cases significantly increased.

본 연구는 대전광역시에서 나타난 확진자 증가 현상을 분석하여 COVID-19의 확산을 방지할 대책 마련에 도움이 되고자 계획되었다. 확진자 증가의 원인이 시민들의 잦은 이동과 장기간 지속한 사회적 거리두기로 인한 피로와 방심에 있다고 보고, 각 행정동의 주별 확진자 수를 반응변수로, 생활 속 거리두기로 전환된 시점으로부터 흐른 시간, 행정동의 버스 하차 인원을 설명변수로 하여 이들의 관계를 모형화하였다. 행정동별 확진자 수가 주 단위로 반복측정 되었고, 포아송분포로 기대되는 0보다 더 많은 0이 관측될 수 있기 때문에 혼합효과 영과잉 포아송 회귀모형을 적용하였다. 행정동의 성격에 따라 확진자 발생 동향이 다를 수 있어서서 서로 유사한 성격을 갖는 행정동을 군집화하여 이를 범주형 설명변수로 사용하였다. 또한 버스 하차 인원의 효과가 행정동의 성격에 따라 달라질 수 있다는 점을 고려하여 두 변수 간의 교호작용항을 포함하였고 상대적으로 번화한 행정동에서 그 효과가 유의한 것으로 나타났다 (유의수준=0.1). 모형 적합 결과 인구수의 증가와 번화한 행정동이라는 요인, 그리고 버스 하차 인원의 증가가 확진자 수의 증가와 중요한 연관 관계를 가진다는 것을 보였다. 한편, 추정된 모형에 따르면 인구수와 버스 하차량이 고정되었을 때 번화한 집단의 확진자 수가 그렇지 않은 집단에 비해 훨씬 적을 것으로 기대되었는데, 이는 코로나 고위험 지역에 대한 시 차원의 강력한 대응이 효과를 발휘한 것으로 해석할 수 있다.

Keywords

Acknowledgement

이 논문은 2018년도 정부(미래창조과학부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임 (NRF-2018R1C1B5086268).

References

  1. Agresti A (2020). An Introduction to Categorical Data Analysis, Wiley.
  2. Hall DB (2000). Zero-inflated poisson and binomial regression with random effects: a case study, Biometrics, 54, 1030-1039. https://doi.org/10.1111/j.0006-341X.2000.01030.x
  3. Han JH and Kim CH (2015). Zero inflated Poisson model for spatial data, The Korean Journal of Applied Statistics, 28, 231-239. https://doi.org/10.5351/KJAS.2015.28.2.231
  4. Kim JT, Lee NY, Oh MA, and Lee SI (2018). A study on the transition of population movement and centroid in Korea, Journal of The Korean Official Statistics, 23, 1-23.
  5. Kim YK and Hwang BS (2018). A Bayesian zero-inflated Poisson regression model with random effects with application to smoking behavior, The Korean Journal of Applied Statistics, 31, 287-301. https://doi.org/10.5351/KJAS.2018.31.2.287
  6. Lambert D (1992). Zero-inflated Poisson regression, with an application to defects in manufacturing, Technometrics, 34, 1-14. https://doi.org/10.2307/1269547
  7. Liu J, Yanyuan M, and Jill J (2020). A goodness-of-fit test for zero-inflated Poisson mixed effects models in tree abundance studies, Computational Statistics & Data Analysis, 144.
  8. Moon, et al. (2020). Time-variant reproductive number of COVID-19 in Seoul, Korea, Epidemiology and Health, 42.
  9. Wang K, Yau KK, and Lee AH (2002). A zero-inflated Poisson mixed model to analyze diagnosis related groups with majority of same-day hospital stays, Computer Methods and Programs in Biomedicine, 68, 195-203. https://doi.org/10.1016/S0169-2607(01)00171-7
  10. Min Y and Agresti A (2005). Random effect models for repeated measures of zero-inflated count data, Statistical Modelling, 5, 1-19. https://doi.org/10.1191/1471082X05st084oa
  11. Zhu H, Luo S, and Stacia MD (2015). Zero-inflated count models for longitudinal measurements with heterogeneous random effects, Statistical Methods in Medical Research, 26, 1774-1786. https://doi.org/10.1177/0962280215588224