• 제목/요약/키워드: poisson regression

검색결과 243건 처리시간 0.025초

제로팽창 모형을 이용한 보험데이터 분석 (A Zero-Inated Model for Insurance Data)

  • 최종후;고인미;전수영
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.485-494
    • /
    • 2011
  • 계수(Count) 데이터는 반응변수가 음이 아닌 계수로, 자동차 사고건수나 지진이 일어난 횟수, 보험처리 발생건수 등을 말한다. 이런 경우에는 주로 포아송 회귀모형을 사용하지만, 평균과 분산이 동일한 경우만 이용될 수 있다는 제약이 따른다. 실증적 자료에서는 그룹 간 이질성으로 인해 분산이 매우 큰 과대산포(Overdispersion) 현상을 볼 수 있는데, 이를 무시할 경우 회귀계수나 표준오차가 편의되는 현상이 발생한다. 보험은 보장성 개념이 강하기 때문에 실제로 보험처리가 발생하지 않는 경우가 많아, 보험처리 건수에 '0'값이 있을 수 있다. 본 논문에서는 '0'값이 많은 자료의 분석을 위해 제로팽창 모형(Zero-Inflated Model)을 고려하고, 여러 모형들의 효율성을 실증자료를 통하여 비교하였다. 실증 자료 분석 결과, 과대산포와 제로팽창 현상이 존재하는 자료에서 제로팽창 음이항 모형(Zero-Inflated Negative Binomial Regression Model)이 가장 효율적인 모형임을 보여 주었다.

고속도로 화물차 교통사고 건수 예측모형 및 안전등급 개발 연구 (Study on the Development of Truck Traffic Accident Prediction Models and Safety Rating on Expressways)

  • 윤정은;정하림;박장호;강동효;윤일수
    • 한국ITS학회 논문지
    • /
    • 제22권1호
    • /
    • pp.1-15
    • /
    • 2023
  • 본 연구에서는 전국 고속도로를 대상으로 화물차 교통사고에 영향을 미치는 주요 요인을 파악하고자 한다. 이를 위해, 고속도로 교통사고 자료들과 포아송 및 음이항 회귀모형을 이용하여 화물차 교통사고 건수 예측모형을 개발하였다. 모형에서 유의한 것으로 확인된 변수는 화물차 연속주행시간지수, 구간연장, 화물차 교통량, 구간내 교량 수, 졸음쉼터 개수이다. 또한, 구축된 예측모형을 이용하여 고속도로 구간별 안전등급(level of service of safety, LOSS)을 도출하였다. 이후 LOSS를 전국 고속도로 네트워크에 표출하여 고속도로 구간별 화물차 교통사고 위험도를 진단하였다. 본 연구에서 개발된 모형과 LOSS는 고속도로에서의 화물차 교통사고 저감을 위한 정책수립의 기초자료로 활용될 것으로 기대된다.

3지 신호교차로의 교통사고 발생모형 - 청주시를 사례로 - (Traffic Accident Models of 3-Legged Signalized Intersections in the Case of Cheongju)

  • 박병호;한상욱;김태영
    • 한국안전학회지
    • /
    • 제24권2호
    • /
    • pp.94-99
    • /
    • 2009
  • This study deals with the traffic accidents at the 3-legged signalized intersections in Cheongu. The goals are to analyze the geometric, traffic and operational conditions of intersections and to develop a various functional forms that predict the accidents. The models are developed through the correlation analysis, the multiple linear, the multiple nonlinear, Poisson and negative binomial regression analysis. In this study, two multiple linear, two multiple nonlinear and two negative binomial regression models were calibrated. These models were all analyzed to be statistically significant. All the models include 2 common variables(traffic volume and lane width) and model-specific variables. These variables are, therefore, evaluated to be critical to the accident reduction of Cheongju.

Sample size calculations for clustered count data based on zero-inflated discrete Weibull regression models

  • Hanna Yoo
    • Communications for Statistical Applications and Methods
    • /
    • 제31권1호
    • /
    • pp.55-64
    • /
    • 2024
  • In this study, we consider the sample size determination problem for clustered count data with many zeros. In general, zero-inflated Poisson and binomial models are commonly used for zero-inflated data; however, in real data the assumptions that should be satisfied when using each model might be violated. We calculate the required sample size based on a discrete Weibull regression model that can handle both underdispersed and overdispersed data types. We use the Monte Carlo simulation to compute the required sample size. With our proposed method, a unified model with a low failure risk can be used to cope with the dispersed data type and handle data with many zeros, which appear in groups or clusters sharing a common variation source. A simulation study shows that our proposed method provides accurate results, revealing that the sample size is affected by the distribution skewness, covariance structure of covariates, and amount of zeros. We apply our method to the pancreas disorder length of the stay data collected from Western Australia.

규제 순응도와 산업재해 발생 수준간의 관계 분석 - 로지스틱 회귀분석과 포아송 회귀분석을 중심으로 - (Analysis of the relationship between regulation compliance and occupational injuries - Focusing on logistic and poisson regression analysis -)

  • 이경용;김기식;윤영식
    • 대한안전경영과학회지
    • /
    • 제15권2호
    • /
    • pp.9-20
    • /
    • 2013
  • OSHA(Occupational Safety and Health Act) generally regulates employer's business principles in the workplace to maintain safety environment. This act has the fundamental purpose to protect employee's safety and health in the workplace by reducing industrial accidents. Authors tried to investigate the correlation between 'occupational injuries and illnesses' and level of regulation compliance using Survey on Current Status of Occupational Safety & Health data by the various statistical methods, such as generalized regression analysis, logistic regression analysis and poison regression analysis in order to compare the results of those methods. The results have shown that the significant affecting compliance factors were different among those statistical methods. This means that specific interpretation should be considered based on each statistical method. In the future, relevant statistical technique will be developed considering the distribution type of occupational injuries.

Model Checking for Time-Series Count Data

  • Lee, Sung-Im
    • Communications for Statistical Applications and Methods
    • /
    • 제12권2호
    • /
    • pp.359-364
    • /
    • 2005
  • This paper considers a specification test of conditional Poisson regression model for time series count data. Although conditional models for count data have received attention and proposed in several ways, few studies focused on checking its adequacy. Motivated by the test of martingale difference assumption, a specification test via Ljung-Box statistic is proposed in the conditional model of the time series count data. In order to illustrate the performance of Ljung- Box test, simulation results will be provided.

음이항회귀모형을 이용한 꽃게 출하량에 관한 연구 (A Study on Shipments of Swimming Crab Using Negative Binomial Regression Model)

  • 남영은;서지현;최가영;이경준
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2941-2951
    • /
    • 2018
  • 본 연구는 해양기상관측자료인 평균 풍속, 평균 기압, 평균 상대습도, 평균 기온, 평균 수온, 평균 최대파고, 평균 유의파고, 최고 유의파고, 최고 최대파고, 평균 파주기, 최고 파주기 등의 요인들이 꽃게의 출하건수에 미치는 영향을 음이항 회귀모형을 통해 확인하고 모형적합을 시도하였다. 염분과 수온이 갑각류의 성숙 및 산란에 영향을 미치며, 특히 수온은 성장에 관여하는 대사 작용에 영향을 끼친다고 알려져 있고 최근 지구온난화로 인해, 얼음이 녹으면서 바다의 유의, 최대, 평균파고와 파주기, 그리고 수온까지 영향을 미치고 있어 꽃게 출하건수를 예측하는데 있어 중요한 변수라고 생각할 수 있다. 분석결과 꽃게의 출하건수에 영향을 주는 요인은 평균 풍속, 평균 기압, 평균 상대습도, 평균 해수온도, 최대 파고, 평균 파주기, 최대 파주기로 결정되었다. 꽃게의 출하건수는 평균 풍속, 평균 기압, 평균 상대습도, 평균 해수온도, 평균 파주기가 높을수록 증가하는 경향을 보이고 있고, 최대 파고, 최대 파주기가 낮을수록 꽃게의 출하건수는 증가하는 경향을 보이고 있었다.

사고유형에 따른 교통사고 심각도 모형 개발 (Developing the Traffic Accident Severity Models by Accident Type)

  • 김경환;박병호
    • 한국안전학회지
    • /
    • 제26권6호
    • /
    • pp.118-123
    • /
    • 2011
  • This study deals with the traffic accidents of the arterial link sections. The purpose is to comparatively analyze the characteristics and models by accident type using the data of 24 arterial links in Cheongju. In pursuing the above, this study gives particular emphasis to modeling such the accidents as the side-right-angle collision, rear-end collision and side-swipe collision. The main results are the followings. First, six accident models are developed, which are all analyzed to be statistically significant. Second, the models are comparatively evaluated using the common and specific variables by accident type.

Footing settlement formula based on multi-variable regression analyses

  • Hamderi, Murat
    • Geomechanics and Engineering
    • /
    • 제17권1호
    • /
    • pp.11-18
    • /
    • 2019
  • The formulas offered so far on the settlement of raft footings provide only a rough estimate of the actual settlement. One of the best ways to make an accurate estimation is to conduct 3-dimensional finite element analyses. However, the required procedure for these analyses is comparatively cumbersome and expensive and needs a bit more expertise. In order to address this issue, in this study, a raft footing settlement formula was developed based on ninety finite element model configurations. The formula was derived using multi-parameter exponential regression analyses. The settlement formula incorporates the dimensions and the elastic modulus of a rectangular raft, vertical uniform pressure and soil moduli and Poisson's ratios up to 5 layers. In addition to this, an equation was offered for the estimation of average deflection of the raft. The proposed formula was checked against 3 well-documented case studies. The formula that is derived from 3D finite element analyses is useful in optimising the raft properties.

사고유형에 따른 원형교차로 사고모형 (Accident Models of Circular Intersections by Type in Korea)

  • 한수산;김경환;박병호
    • 한국도로학회논문집
    • /
    • 제13권3호
    • /
    • pp.103-110
    • /
    • 2011
  • 이 논문은 사고유형에 따른 교통사고를 다루고 있다. 연구의 목적은 두 가지 사고유형의 특성을 분석하고, 유형별 모형을 개발하는데 있다. 이를 위해 이 연구는 두 집단 사이의 차이점을 분석하고, 국내 원형교차로 자료를 사용하여 포아송 및 음이항 회귀모형을 개발하는데 그 목적이 있다. 주요 결과는 다음과 같다. 첫째, 차대차 사고가 73.41%로 가장 많은 비중을 차지하는 것으로 분석되었다. 둘째, 차대사람과 차대차 사고건수 및 EPDO를 종속변수로 통계적으로 의미 있는 2개의 포아송 모형과 2개의 음이항 모형이 개발되었다. 셋째, 사고유형별 심각도모형의 공통변수는 교통량, 그리고 특정변수로는 우회전 별도차로 수, 과속방지턱, 진출입구 수 및 횡단보도 수가 채택되었다.