• 제목/요약/키워드: poisson and negative binomial regression models

검색결과 52건 처리시간 0.019초

과대산포 가산자료의 새로운 표본선택모형 (A new sample selection model for overdispersed count data)

  • 조성은;조준;김형문
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.733-749
    • /
    • 2018
  • 어떠한 연구에서 관심의 대상이 되는 관찰치가 부분적으로 관측 가능할 때 표본선택의 문제가 일어난다. 이러한 자료를 분석하기 위해 헤크만은 표본선택 모형을 개발하였고 이변량 정규분표의 가정 하에 최대우도방법을 사용하여 모수를 추정하였다. 최근 이항자료와 포아송 자료에 대한 표본선택모형이 제안되었다. 이를 분포조정에 기초하여 과대산포 자료에 대한 모형으로 확장하고자 한다. 표본선택이 없는 과대산포 자료는 흔히 음이항 분포로 분석되어진다. 따라서 음이항 분포를 이용하고 분포조정을 도입한 과대산포 자료에 대한 새로운 모형을 제시하고자 한다. 실제 자료를 이용하여 분석을 하였다. 모의실험 결과 프로파일 우도함수를 이용하여 모수에 대해 추정한 결과는 안정적이다.

Application of discrete Weibull regression model with multiple imputation

  • Yoo, Hanna
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.325-336
    • /
    • 2019
  • In this article we extend the discrete Weibull regression model in the presence of missing data. Discrete Weibull regression models can be adapted to various type of dispersion data however, it is not widely used. Recently Yoo (Journal of the Korean Data and Information Science Society, 30, 11-22, 2019) adapted the discrete Weibull regression model using single imputation. We extend their studies by using multiple imputation also with several various settings and compare the results. The purpose of this study is to address the merit of using multiple imputation in the presence of missing data in discrete count data. We analyzed the seventh Korean National Health and Nutrition Examination Survey (KNHANES VII), from 2016 to assess the factors influencing the variable, 1 month hospital stay, and we compared the results using discrete Weibull regression model with those of Poisson, negative Binomial and zero-inflated Poisson regression models, which are widely used in count data analyses. The results showed that the discrete Weibull regression model using multiple imputation provided the best fit. We also performed simulation studies to show the accuracy of the discrete Weibull regression using multiple imputation given both under- and over-dispersed distribution, as well as varying missing rates and sample size. Sensitivity analysis showed the influence of mis-specification and the robustness of the discrete Weibull model. Using imputation with discrete Weibull regression to analyze discrete data will increase explanatory power and is widely applicable to various types of dispersion data with a unified model.

차량유형별 로터리 사고모형 (Accident Models of Rotary by Vehicle Type)

  • 한수산;박병호
    • 대한교통학회지
    • /
    • 제29권6호
    • /
    • pp.67-74
    • /
    • 2011
  • 이 연구는 차량유형별 로터리 교통사고를 다루고 있다. 이 논문은 차량유형별 교통사고 특성을 비교 분석하고, 사고모형을 개발하는데 그 목적이 있다. 이를 위해 이 연구에서는 차량유형을 세 그룹으로 나누어 그 차이점을 분석하고, 국내 로터리 자료를 이용하여 포아송 및 음이항 회귀모형과 ZAM모형을 개발하는데 중점을 두고 있다. 주요 연구결과는 다음과 같다. 첫째, 승용차량과 화물 및 승합차, 원동기의 사고건수를 종속변수로 하는 통계적으로 의미있는 2개의 ZIP 모형과 1개의 음이항 모형이 개발되었다. 둘째, 모형별 채택된 독립변수를 활용하여 세 모형의 차이가 비교 분석되었다. 마지막으로 로터리 사고를 예방하기 위해 조명시설, 과속방지턱과 같은 교통안전시설물 설치가 필요한 것으로 평가되었다.

고령운전자 교통안전성 평가모형 개발 (The Development of Traffic Accident Severity Evaluation Models for Elderly Drivers)

  • 김태호;이기영;최윤환;박제진
    • 한국ITS학회 논문지
    • /
    • 제8권2호
    • /
    • pp.118-127
    • /
    • 2009
  • 본 연구는 최근 사회적으로 이슈가 되고 있는 고령자 교통사고 인적요인을 평가할 수 있는 모형 개발을 목적으로 한다. 본 연구의 수행을 위해 교통안전공단의 운전자적성검사(Simulation, 설문조사) 자료를 수집하였으며, 교통사고영향 모형개발을 위해 포아송 및 음이항 회귀분석(Poisson Regression Analysis)을 실시하였다. 교통안전성 평가모형 분석결과, 고령운전자의 경우 선택적 주의능력, 속도예측능력, 주의배분능력이 교통사고에 유의한 정(+)의 영향을 미치는 것으로 분석되었다. 다음으로 비고령운전자의 경우 선택적 주의능력, 속도예측능력, 거리지각능력, 주의배분능력, 주의전환능력이 교통사고와 유의한 정(+)의 영향을 미치는 것으로 분석되었다. 이러한 분석결과를 바탕으로 고령운전자와 비고령운전자의 사고발생에 미치는 영향요인은 서로 다르게 나타났으며, 교통사고를 미연에 방지하기 위한 최소한의 방편으로 고령운전자와 비고령운전자를 구분하여 교통사고 예방교육을 실시해야 할 것으로 판단된다.

  • PDF

Effects on Regression Estimates under Misspecified Generalized Linear Mixed Models for Counts Data

  • Jeong, Kwang Mo
    • 응용통계연구
    • /
    • 제25권6호
    • /
    • pp.1037-1047
    • /
    • 2012
  • The generalized linear mixed model(GLMM) is widely used in fitting categorical responses of clustered data. In the numerical approximation of likelihood function the normality is assumed for the random effects distribution; subsequently, the commercial statistical packages also routinely fit GLMM under this normality assumption. We may also encounter departures from the distributional assumption on the response variable. It would be interesting to investigate the impact on the estimates of parameters under misspecification of distributions; however, there has been limited researche on these topics. We study the sensitivity or robustness of the maximum likelihood estimators(MLEs) of GLMM for counts data when the true underlying distribution is normal, gamma, exponential, and a mixture of two normal distributions. We also consider the effects on the MLEs when we fit Poisson-normal GLMM whereas the outcomes are generated from the negative binomial distribution with overdispersion. Through a small scale Monte Carlo study we check the empirical coverage probabilities of parameters and biases of MLEs of GLMM.

사고유형에 따른 교통사고 심각도 모형 개발 (Developing the Traffic Accident Severity Models by Accident Type)

  • 김경환;박병호
    • 한국안전학회지
    • /
    • 제26권6호
    • /
    • pp.118-123
    • /
    • 2011
  • This study deals with the traffic accidents of the arterial link sections. The purpose is to comparatively analyze the characteristics and models by accident type using the data of 24 arterial links in Cheongju. In pursuing the above, this study gives particular emphasis to modeling such the accidents as the side-right-angle collision, rear-end collision and side-swipe collision. The main results are the followings. First, six accident models are developed, which are all analyzed to be statistically significant. Second, the models are comparatively evaluated using the common and specific variables by accident type.

주·야간 교통사고의 특성 및 사고모형 비교분석 -청주시 4지 신호교차로를 중심으로 - (Comparative Analysis on the Characteristics and Models of Traffic Accidents by Day and Nighttime in the Case of Cheongju 4-legged ignalized Intersections)

  • 유두선;오상진;김태영;박병호
    • 대한토목학회논문집
    • /
    • 제28권2D호
    • /
    • pp.181-189
    • /
    • 2008
  • 본 연구는 주간과 야간의 교통사고 특성과 사고모형을 비교 분석하는데 그 목적이 있다. 이를 위해 본 연구에서는 청주시 4지 신호교차로를 중심으로 주 야간 교통사고의 차이를 검증하고, 주야간별 다중선형, 다중비선형 과 포아송 및 음이항회귀모형을 개발하는데 중점을 두고 있다. 분석된 주요 연구결과는 다음과 같다. 첫째, 사고특성 분석을 통해 주간과 야간 사고의 차이점이 파악되었다. 둘째, 통계적으로 설명력이 높은 주 야간 총 12개의 사고모형이 개발되었다. 마지막으로 공통변수와 특정변수를 활용하여 주야간 사고모형의 차이가 비교 분석되었다.

고령운전자 교차로 사고의 특성 및 모형 - 청주시 4지 신호교차로를 중심으로 - (Characteristics and Models of Intersection Accidents by Elderly Drivers in the Case of Cheongju 4-legged Signalized Intersections)

  • 박병호;한상욱;김경환
    • 한국도로학회논문집
    • /
    • 제11권4호
    • /
    • pp.33-40
    • /
    • 2009
  • 이 연구는 고령운전자의 사고를 다루고 있다. 본 논문은 고령운전자와 일반운전자 사이의 교통사고 특성을 비교 분석하고, 사고모형을 개발하는데 목적이 있다. 이를 위해 본 연구에서는 청주시 4지 신호교차로를 중심으로 두 운전자 집단 간의 차이를 검증하고, 포아송 및 음이항 회귀모형을 개발하는데 중점을 두고 있다. 분석된 주요 연구결과는 다음과 같다. 첫째, 고령운전자와 일반운전자 사고의 차이점이 시간대별, 사고유형별 등으로 파악되었다. 둘째, 통계적으로 설명력이 높은 고령 및 일반운전자 총 3개의 사고모형이 개발되었다. 마지막으로 공통변수와 특정변수를 활용하여 고령 일반 운전자 사고모형의 차이가 비교 분석되었다.

  • PDF

고속도로 화물차 교통사고 건수 예측모형 및 안전등급 개발 연구 (Study on the Development of Truck Traffic Accident Prediction Models and Safety Rating on Expressways)

  • 윤정은;정하림;박장호;강동효;윤일수
    • 한국ITS학회 논문지
    • /
    • 제22권1호
    • /
    • pp.1-15
    • /
    • 2023
  • 본 연구에서는 전국 고속도로를 대상으로 화물차 교통사고에 영향을 미치는 주요 요인을 파악하고자 한다. 이를 위해, 고속도로 교통사고 자료들과 포아송 및 음이항 회귀모형을 이용하여 화물차 교통사고 건수 예측모형을 개발하였다. 모형에서 유의한 것으로 확인된 변수는 화물차 연속주행시간지수, 구간연장, 화물차 교통량, 구간내 교량 수, 졸음쉼터 개수이다. 또한, 구축된 예측모형을 이용하여 고속도로 구간별 안전등급(level of service of safety, LOSS)을 도출하였다. 이후 LOSS를 전국 고속도로 네트워크에 표출하여 고속도로 구간별 화물차 교통사고 위험도를 진단하였다. 본 연구에서 개발된 모형과 LOSS는 고속도로에서의 화물차 교통사고 저감을 위한 정책수립의 기초자료로 활용될 것으로 기대된다.

가산자료모형(Count Data Model)을 이용한 버스이용횟수추정에 관한 연구 (서울시 통근.통학자를 대상으로) (Count Data Model for The Estimation of Bus Ridership (Focusing on Commuters and Students in Seoul))

  • 문진수;김순관;임강원
    • 대한교통학회지
    • /
    • 제17권5호
    • /
    • pp.123-135
    • /
    • 1999
  • 개인교통수단의 선호로 인한 자가용 승용차의 급증은 서울시의 교통혼잡을 가중시키는 주요한 요인이 되고 있다. 이러한 서울시의 교통혼잡을 완화하기 위해서는 대중교통 중심의 교통체계가 구축되어야 하며 승용차 이용자를 대중교통수단으로 유인할 수 있는 대중교통 활성화정책이 필요하다. 이러한 인식하에 버스를 이용하는 통근 및 통학목적 통행자의 버스이용횟수에 대한 개별행태모형을 통하여 버스 이용에 영향을 미치는 요인을 파악함으로써 승용차 이용자를 대중교통수단으로 유인할 수 있는 정책적인 시사점을 도출하고자 하였다. 본 연구의 목적은 일주일간 버스이용횟수 추정에 적합한 가산자료모형의 적용이다. 국내에서는 가산자료모형을 이용한 연구가 많지 않은 실정이며, 또한 모형의 설정시 과산포(overdispersion)에 대한 검정을 통하여 자료에 적합한 모형을 설정하는 것이 중요함에도 불구하고 적절한 검정없이 일반적으로 사용되고 있는 포와송 회귀모형을 주로 사용하여 왔다. 그러나 본 연구에서는 가산자료모형을 선정하기 전에 과산포에 대한 통계적인 검정을 시행한 결과 음이항 회귀모형이 본 연구의 자료에 적합한 것으로 판정되었으며, 모형설정의 중요성을 살펴보기 위하여 음이항 회귀모형을 이용하여 추정한 결과와 포와송 회귀모형을 이용하여 추정한 결과를 비교하여 보았다.

  • PDF