• 제목/요약/키워드: zero-inflated Poisson model

검색결과 43건 처리시간 0.02초

영과잉 경시적 가산자료 분석을 위한 허들모형 (Hurdle Model for Longitudinal Zero-Inflated Count Data Analysis)

  • 진익태;이근백
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.923-932
    • /
    • 2014
  • 허들모형은 영이 과잉 가산자료를 분석하기 위해서 사용되어 왔다. 이 모형은 이산부분을 위한 로짓모형과 절삭된 가산부분을 위한 절삭된 포아송모형의 혼합모형이다. 이 논문에서 우리는 경시적 영과잉 가산자료를 분석하기 위해서 수정된 콜레스키 분해을 이용하여 일반적인 이분산성을 가지는 변량효과 공분산행렬을 제안한다. 수정된 콜레스키 분해는 변량효과 공분산행렬을 일반화자기상관 모수와 혁신분산모수로 분리되면, 이러한 모수들은 베이지안 일반화 선형모형을 통해 추정된다. 그리고 실제 자료분석을 통하여 설명한다.

이변량 포아송분포를 이용한 K-리그 골 점수의 예측 (Prediction of K-league soccer scores using bivariate Poisson distributions)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1221-1229
    • /
    • 2014
  • 30년 동안의 K-리그 자료를 득점과 실점이 서로 상관이 있다는 가정과 R 패키지를 사용하여 12개의 서로 다른 이변량 포아송모형에 적합시켰다. 그 결과 AIC와 BIC 판정기준 아래에서 공변량 효과가 상수인 이변량 포아송모형이 가장 타당하며, 영과잉 및 대각확대 모형은 필요하지 않은 것으로 나타났다. 제안된 모형은 홈경기의 효과, 팀별 공격능력과 수비능력 및 적합도를 구하는 데 사용될 수 있다.

영과잉 회귀모형에 대한 베이지안 분석 (Bayesian Analysis for the Zero-inflated Regression Models)

  • 장학진;강윤회;이수범;김성욱
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.603-613
    • /
    • 2008
  • 셀 수 있는 이산 자료 중에서 일반적인 모형에 비하여 영의 빈도가 과도하게 많이 관측되는 자료가 있다. 이러한 경우에 포아송 또는 음이항회귀모형과 같은 일반적인 회귀모형에 의한 분석은 적절하지 못하다. 본 논문에서는 영과잉 포아송회귀모형과 영과잉 음이항회귀모형에 대하여 베이지안 분석을 하였다. 또한, 마코브 연쇄 몬테카롤로 방법으로 계산한 베이즈 요인을 이용하여 모형선택을 하였다. 실제 교통사고 자료를 분석하여 이론적인 결과들을 뒷받침하였다.

어가의 고용량 결정요인 분석 (An Analysis on the Determinants of Employed Labour Quantity in the Fishing Industry)

  • 김태현;박철형;남종오
    • 자원ㆍ환경경제연구
    • /
    • 제27권3호
    • /
    • pp.545-567
    • /
    • 2018
  • 본 연구는 포아송모형, 음이항모형, 영과잉 포아송모형, 영과잉 음이항모형을 이용하여 어가의 고용량 결정요인을 분석하고, 개별모형 간 고용량 결정요인을 비교 분석한다. 이들 모형의 추정에 사용된 자료는 통계청에서 제공하는 2010년과 2015년의 농림어업총조사 마이크로 데이터이며, 이들 자료를 풀링(Pooling)하여 고용량 결정요인과 그 변화분에 대해 추정한다. 분석모형의 선정 결과, 과대 산포 경향을 갖고 있으면서 자가 노동 및 가족 경영으로 고용을 대체하고 있는 수산업의 특성을 모형에 동시에 반영하고 있는 영과잉 음이항모형이 선정되었다. 또한 2010년 대비 2015년 고용량 결정요인의 변화분을 분석해 본 결과, 어선을 보유한 어가와 판매금액이 많은 어가는 고용량 감소에 유의한 영향을 미치는 것으로 나타난 반면, 어가의 종사경력은 길수록 고용량 증가에 유의한 영향을 미치는 것으로 나타났다. 결론적으로 자본화된 어가와 고령화의 가속화가 수산업의 어가 고용량 수 변화에 유의한 영향을 미친 것으로 나타났다.

Sample size calculations for clustered count data based on zero-inflated discrete Weibull regression models

  • Hanna Yoo
    • Communications for Statistical Applications and Methods
    • /
    • 제31권1호
    • /
    • pp.55-64
    • /
    • 2024
  • In this study, we consider the sample size determination problem for clustered count data with many zeros. In general, zero-inflated Poisson and binomial models are commonly used for zero-inflated data; however, in real data the assumptions that should be satisfied when using each model might be violated. We calculate the required sample size based on a discrete Weibull regression model that can handle both underdispersed and overdispersed data types. We use the Monte Carlo simulation to compute the required sample size. With our proposed method, a unified model with a low failure risk can be used to cope with the dispersed data type and handle data with many zeros, which appear in groups or clusters sharing a common variation source. A simulation study shows that our proposed method provides accurate results, revealing that the sample size is affected by the distribution skewness, covariance structure of covariates, and amount of zeros. We apply our method to the pancreas disorder length of the stay data collected from Western Australia.

고속도로 연결로의 교통사고예측모형 개발 (Traffic Crash Prediction Models for Expressway Ramps)

  • 최윤환;오영태;최기주;이철기;윤일수
    • 한국도로학회논문집
    • /
    • 제14권5호
    • /
    • pp.133-143
    • /
    • 2012
  • PURPOSES: Using the collected data for crash, traffic volume, and design elements on ramps between 2007 and 2009, this research effort was initiated to develop traffic crash prediction models for expressway ramps. METHODS: Three negative binomial regression models and three zero-inflated negative binomial regression models were developed for individual ramp types, including direct, semi-direct and loop, respectively. For validating the developed models, authors compared the estimated crash frequencies with actual crash frequencies of twelve randomly selected interchanges, the ramps of which have not been used for model developing. RESULTS: The results show that the negative binomial regression models for direct, semi-direct and loop ramps showed 60.3%, 63.8% and 48.7% error rates on average whereas the zero-inflated negative binomial regression models showed 82.1%, 120.4% and 57.3%, respectively. CONCLUSIONS: Conclusively, the negative binomial regression models worked better in traffic crash prediction than the zero-inflated negative binomial regression models for estimating the frequency of traffic accidents on expressway ramps.

영과잉 음이항회귀 모형을 이용한 보험설계사들의 이직횟수 적합 (Fit of the number of insurance solicitor's turnovers using zero-inflated negative binomial regression)

  • 전희주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1087-1097
    • /
    • 2017
  • 본 연구는 계수자료 (count data)를 반응변수로 갖는 포아송회귀 모형, 음이항회귀 모형, 영과잉 포아송회귀 모형, 영과잉 음이항회귀 모형의 4 모형의 비교를 통해 보험 설계사들의 이직횟수 적합을 위한 최적모형을 찾고자 한다. 보험설계사 이직횟수의 분산이 평균보다 큰 과대산포가 존재하고 0인 경우의 비중이 높을 경우에 영과잉 음이항회귀 모형을 적합하는 것이 타당함을 보여주고 보험 설계사들의 이직횟수에 영향을 주는 요인을 규명하고자 한다. 로그우도값, AIC, SBC 등을 고려하여 보험설계사 이직횟수 적합을 최적의 모형은 영과잉 이항모형과 음이항회귀모형의 결합인 영과잉 음이항 모형이 선택되었다. 영과잉 이항모형에 포함된 변수로는 성별, 총 보험설계사 근무연월, 교차모집 설계사 등록, 보유고객 수, 소속회사 유형이었고, 음이항회귀 모형에 포함된 변수로는 직무만족, 조직몰입, 채널경영만족, 총 보험설계사 근무연월, 현 직장에서 근무연월, 소속회사 유형이었다. 영과잉 음이항회귀 모형의 적합결과, 이직횟수에 유의한 영향을 주는 요인으로는 현 직장에서 근무연월, 총 보험설계사 근무연월, 소속회사 유형, 채널경영만족, 직무만족 순으로 나타났다.

변화시점이 있는 영과잉-포아송모형에서 돌출대립가설에 대한 우도비검정 (Likelihood Ratio Test for the Epidemic Alternatives on the Zero-Inflated Poisson Model)

  • 김경무
    • Journal of the Korean Data and Information Science Society
    • /
    • 제9권2호
    • /
    • pp.247-253
    • /
    • 1998
  • 영과잉-포아송모형에서 변화시점이 있는 경우, 돌출대립가설에 대한 우도비검정을 이용하여 변화시점의 유 무를 알아보았다. 변화시점에 대한 추정은 최소제곱법을 이용하였고 이를 최우추정법을 이용하기 위한 초기치로 활용하였다. 또한 대립가설에 대한 몇가지 흥미있는 모수들을 적률법을 이용하여 추정하였다. 모의실험을 통하여 이들 추정 량을 비교하였고 결과 변화시점에 대한 추정은 최소제곱법보다는 최우추정법이 바람직하게 나타났고 흥미있는 몇가지 모수들에 대해서는 최우추정량이 적률추정량보다 우수하게 나타났다.

  • PDF

도시부 4지 신호교차로 유턴 사고모형 개발 (Development of the U-turn Accident Model at 4-Legged Signalized Intersections in Urban Areas)

  • 강종호;김경환;하만복;김성문
    • 한국도로학회논문집
    • /
    • 제16권2호
    • /
    • pp.119-129
    • /
    • 2014
  • PURPOSES : The purpose of this study is to develop the U-turn accident model at 4-legged signalized intersections in urban areas. METHODS : In order to analyze the characteristics of the accidents which are associated with U-turn operation at 4-legged signalized intersections in urban areas and develop an U-turn accident model by regression analysis, the tests of overdispersion and zero-inflation are conducted about the dependent variables of number of accidents and EPDO (Equivalent Property Damage Only). RESULTS : As their results, the Poisson model fits best for number of accident and the ZIP (Zero Inflated Poisson) fits best for EPOD, the variables of conflict traffic, width of opposing road, traffic passing speed are adopted as independent variable for both models. The variables of number of bus berths and rate of U-turn signal time at which the U-turn is permitted are adopted as independent variable only for EPDO. CONCLUSIONS : These study results suggest that U-turn would be permitted at the intersection where the width of opposing road is wider than 11.9 meters, the passing vehicle speed is not high and U-turn operation is not hindered by the buses stopping at bus stops.

제로팽창 음이항 회귀모형에 대한 베이지안 추론 (Bayesian Inference for the Zero In ated Negative Binomial Regression Model)

  • 심정숙;이동희;정병철
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.951-961
    • /
    • 2011
  • 본 논문에서는 제로팽창 음이항(ZINB) 회귀모형에서 회귀계수에 대한 추론방법으로 마코프체인몬테카를로(MC MC) 기법을 이용한 베이지안 추론방법을 제안하였다. 본 연구에서 고려한 ZINB 회귀모형은 반응변수의 평균뿐만 아니라 제로팽창확률에 대한 회귀모형을 고려한 것으로서 Jang, et al.(2010)의 연구를 확장한 것이다. 아울러 실제사례에 본 연구에서 제안한 베이지안 추론방법을 적용하고 과대산포를 허용하지 않는 제로팽창 포아송(ZIP) 회귀모형과 적합결과를 DIC를 이용하여 비교하였다. 실제 사례분석 결과 ZINB 회귀모형의 DIC가 ZIP모형보다 작게 나타나 ZINB 회귀모형이 ZIP 회귀모형보다 잘 적합되었음을 알 수 있었다.