• 제목/요약/키워드: zero-inflated negative binomial regression

검색결과 33건 처리시간 0.024초

영과잉을 고려한 중심상업지구 교통사고모형 개발에 관한 연구 (Safety Performance Functions for Central Business Districts Using a Zero-Inflated Model)

  • 이상혁;우용한
    • 한국도로학회논문집
    • /
    • 제18권4호
    • /
    • pp.83-92
    • /
    • 2016
  • PURPOSES : The purpose of this study was to develop safety performance functions (SPFs) that use zero-inflated negative binomial regression models for urban intersections in central business districts (CBDs), and to compare the statistical significance of developed models against that of regular negative binomial regression models. METHODS : To develop and analyze the SPFs of intersections in CBDs, data acquisition was conducted for dependent and independent variables in areas of study. We analyzed the SPFs using zero-inflated negative binomial regression model as well as regular negative binomial regression model. We then compared the results by analyzing the statistical significance of the models. RESULTS : SPFs were estimated for all accidents and injury accidents at intersections in CBDs in terms of variables such as AADT, Number of Lanes at Major Roads, Median Barriers, Right Turn with an Exclusive Turn Lane, Turning Guideline, and Front Signal. We also estimated the log-likelihood at convergence and the likelihood ratio of SPFs for comparing the zero-inflated model with the regular model. In he SPFs, estimated log-likelihood at convergence and the likelihood ratio of the zero-inflated model were at -836.736, 0.193 and -836.415, 0.195. Also estimated the log-likelihood at convergence and likelihood ratio of the regular model were at -843.547, 0.187 and -842.631, 0.189, respectively. These figures demonstrate that zero-inflated negative binomial regression models can better explain traffic accidents at intersections in CBDs. CONCLUSIONS : SPFs that use a zero-inflated negative binomial regression model demonstrate better statistical significance compared with those that use a regular negative binomial regression model.

고속도로 연결로의 교통사고예측모형 개발 (Traffic Crash Prediction Models for Expressway Ramps)

  • 최윤환;오영태;최기주;이철기;윤일수
    • 한국도로학회논문집
    • /
    • 제14권5호
    • /
    • pp.133-143
    • /
    • 2012
  • PURPOSES: Using the collected data for crash, traffic volume, and design elements on ramps between 2007 and 2009, this research effort was initiated to develop traffic crash prediction models for expressway ramps. METHODS: Three negative binomial regression models and three zero-inflated negative binomial regression models were developed for individual ramp types, including direct, semi-direct and loop, respectively. For validating the developed models, authors compared the estimated crash frequencies with actual crash frequencies of twelve randomly selected interchanges, the ramps of which have not been used for model developing. RESULTS: The results show that the negative binomial regression models for direct, semi-direct and loop ramps showed 60.3%, 63.8% and 48.7% error rates on average whereas the zero-inflated negative binomial regression models showed 82.1%, 120.4% and 57.3%, respectively. CONCLUSIONS: Conclusively, the negative binomial regression models worked better in traffic crash prediction than the zero-inflated negative binomial regression models for estimating the frequency of traffic accidents on expressway ramps.

A simple zero inflated bivariate negative binomial regression model with different dispersion parameters

  • Kim, Dongseok
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.895-900
    • /
    • 2013
  • In this research, we propose a simple bivariate zero inflated negative binomial regression model with different dispersion for bivariate count data with excess zeros. An application to the demand for health services shows that the proposed model is better than existing models in terms of log-likelihood and AIC.

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

Analysis of Food Poisoning via Zero Inflation Models

  • Jung, Hwan-Sik;Kim, Byung-Jip;Cho, Sin-Sup;Yeo, In-Kwon
    • 응용통계연구
    • /
    • 제25권5호
    • /
    • pp.859-864
    • /
    • 2012
  • Poisson regression and negative binomial regression are usually used to analyze counting data; however, these models are unsuitable for fit zero-inflated data that contain unexpected zero-valued observations. In this paper, we review the zero-inflated regression in which Bernoulli process and the counting process are hierarchically mixed. It is known that zero-inflated regression can efficiently model the over-dispersion problem. Vuong statistic is employed to compare performances of the zero-inflated models with other standard models.

영과잉 음이항회귀 모형을 이용한 보험설계사들의 이직횟수 적합 (Fit of the number of insurance solicitor's turnovers using zero-inflated negative binomial regression)

  • 전희주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1087-1097
    • /
    • 2017
  • 본 연구는 계수자료 (count data)를 반응변수로 갖는 포아송회귀 모형, 음이항회귀 모형, 영과잉 포아송회귀 모형, 영과잉 음이항회귀 모형의 4 모형의 비교를 통해 보험 설계사들의 이직횟수 적합을 위한 최적모형을 찾고자 한다. 보험설계사 이직횟수의 분산이 평균보다 큰 과대산포가 존재하고 0인 경우의 비중이 높을 경우에 영과잉 음이항회귀 모형을 적합하는 것이 타당함을 보여주고 보험 설계사들의 이직횟수에 영향을 주는 요인을 규명하고자 한다. 로그우도값, AIC, SBC 등을 고려하여 보험설계사 이직횟수 적합을 최적의 모형은 영과잉 이항모형과 음이항회귀모형의 결합인 영과잉 음이항 모형이 선택되었다. 영과잉 이항모형에 포함된 변수로는 성별, 총 보험설계사 근무연월, 교차모집 설계사 등록, 보유고객 수, 소속회사 유형이었고, 음이항회귀 모형에 포함된 변수로는 직무만족, 조직몰입, 채널경영만족, 총 보험설계사 근무연월, 현 직장에서 근무연월, 소속회사 유형이었다. 영과잉 음이항회귀 모형의 적합결과, 이직횟수에 유의한 영향을 주는 요인으로는 현 직장에서 근무연월, 총 보험설계사 근무연월, 소속회사 유형, 채널경영만족, 직무만족 순으로 나타났다.

서로 다른 산포를 허용하는 이변량 영과잉 음이항 회귀모형 (Bivariate Zero-Inflated Negative Binomial Regression Model with Heterogeneous Dispersions)

  • 김동석;정슬기;이동희
    • Communications for Statistical Applications and Methods
    • /
    • 제18권5호
    • /
    • pp.571-579
    • /
    • 2011
  • 본 연구에서는 두 반응 변수에 서로 다른 산포를 허용하는 새로운 이변량 영과잉 음이항 회귀모형을 제안하고, Deb과 Trivedi (1997)에 나타난 헬스케어 자료를 이용하여 두 반응변수가 갖는 서로 다른 산포도를 무시한 Wang (2003)이 제안한 이변량 영과잉 음이항 회귀모형과의 효율성을 로그우도와 AIC의 관점에서 비교 하였다. 모형적합결과, 본 연구에서 제안한 모형이 모형선택기준 관점에서 기존모형에 비하여 월등히 우수한 결과를 보여주었다.

영과잉 가산자료(Zero-inflated Count Data) 분석 방법을 이용한 지역사회 거주 노인의 노인학대 발생과 심각성에 미치는 위험요인 분석 (Risk Factors Influencing Probability and Severity of Elder Abuse in Community-dwelling Older Adults: Applying Zero-inflated Negative Binomial Modeling of Abuse Count Data)

  • 장미희;박창기
    • 대한간호학회지
    • /
    • 제42권6호
    • /
    • pp.819-832
    • /
    • 2012
  • Purpose: This study was conducted to identify risk factors that influence the probability and severity of elder abuse in community-dwelling older adults. Methods: This study was a cross-sectional descriptive study. Self-report questionnaires were used to collect data from community-dwelling Koreans, 65 and older (N=416). Logistic regression, negative binomial regression and zero-inflated negative binomial regression model for abuse count data were utilized to determine risk factors for elder abuse. Results: The rate of older adults who experienced any one category of abuse was 32.5%. By zero-inflated negative binomial regression analysis, the experience of verbal-psychological abuse was associated with marital status and family support, while the experience of physical abuse was associated with self-esteem, perceived economic stress and family support. Family support was found to be a salient risk factor of probability of abuse in both verbal-psychological and physical abuse. Self-esteem was found to be a salient risk factor of probability and severity of abuse in physical abuse alone. Conclusion: The findings suggest that tailored prevention and intervention considering both types of elder abuse and target populations might be beneficial for preventative efficiency of elder abuse.

ZAM 모형을 이용한 청주시 간선가로 구간의 사고모형 개발 (Developing the Accident Models of Cheongju Arterial Link Sections Using ZAM Model)

  • 박병호;김준용
    • 한국도로학회논문집
    • /
    • 제12권2호
    • /
    • pp.43-49
    • /
    • 2010
  • 본 연구는 청주시의 가로구간 교통사고를 다루고 있다. 연구의 목적은 가로구간의 사고모형을 개발하는 데 있다. 이를 위해서 이 연구에서는 전체 322개 세부구간으로 분리된 간선도로의 사고 자료를 이용하여 ZAM 모형을 개발하는데 중점을 두고 있다. ZAM 모형의 일종인 ZIP(zero inflated Poisson model)과 ZINB(zero inflated negative binomial model)를 중심으로 분석한 연구의 주요결과는 다음과 같다. 첫째, 모형의 적합성을 결정하는 Vuong 통계 값과 과분산계수 ${\alpha}$의 t 통계 값을 바탕으로 개발된 다양한 모형을 평가한 결과, 포아송, 음이항, ZIP 및 ZINB 회귀모형 중 ZINB 모형이 최적인 것으로 나타난다. 둘째, ZINB 모형은 t, ${\rho}$${\rho}^2$값 (0.63)의 관점에서 보면, 다른 모형에 비해서 통계적으로 매우 의미 있는 모형으로 평가된다. 마지막으로, 개발된 ZINB 모형의 사고 요인은 교통량, 진출입구 수 그리고 중앙분리대 길이로 분석된다. 교통량과 진출입구 수는 사고발생에 '+'요인, 그리고 중앙분리대 길이는 '-'요인으로 평가된다.

제로팽창 음이항 회귀모형에 대한 베이지안 추론 (Bayesian Inference for the Zero In ated Negative Binomial Regression Model)

  • 심정숙;이동희;정병철
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.951-961
    • /
    • 2011
  • 본 논문에서는 제로팽창 음이항(ZINB) 회귀모형에서 회귀계수에 대한 추론방법으로 마코프체인몬테카를로(MC MC) 기법을 이용한 베이지안 추론방법을 제안하였다. 본 연구에서 고려한 ZINB 회귀모형은 반응변수의 평균뿐만 아니라 제로팽창확률에 대한 회귀모형을 고려한 것으로서 Jang, et al.(2010)의 연구를 확장한 것이다. 아울러 실제사례에 본 연구에서 제안한 베이지안 추론방법을 적용하고 과대산포를 허용하지 않는 제로팽창 포아송(ZIP) 회귀모형과 적합결과를 DIC를 이용하여 비교하였다. 실제 사례분석 결과 ZINB 회귀모형의 DIC가 ZIP모형보다 작게 나타나 ZINB 회귀모형이 ZIP 회귀모형보다 잘 적합되었음을 알 수 있었다.