• 제목/요약/키워드: 음이항회귀분석

검색결과 89건 처리시간 0.023초

고속도로 평면선형상 사고빈도분포 추정을 통한 음이항회귀모형 개발 (기하구조요인을 중심으로) (Fitting Distribution of Accident Frequency of Freeway Horizontal Curve Sections & Development of Negative Binomial Regression Models)

  • 강민욱;도철웅;손봉수
    • 대한교통학회지
    • /
    • 제20권7호
    • /
    • pp.197-204
    • /
    • 2002
  • 교통사고예측 및 예방을 위해서는 실제적으로 도로설계과정에서 제어가 가능한 도로 기하구조요소에 대한 사고관계를 파악함이 타당하다. 즉, 도로의 설계자는 도로건설에 앞서 기하구조요소와 사고와의 관계를 현장자료를 통해 정확히 밝혀 도로설계에 반영해야 한다. 이를 위해, 교통사고의 빈도분포를 박히는 것은 가장 기본이 되는 일이며, 교통사고 예측모형개발에 선행되어야 한다. 일반적으로 교통사고건수의 경우 분산이 평균보다 큰 과분산(overdispersion)의 특징을 가지고 있어 음이항 분포를 따른다고 알려져 있다. 따라서 본 논문은 사고모형의 개발에 앞서, 사고발생지점에 대한 도로설계요소와 기타 잠재적인 사고발생 관련요인이 비교적 잘 파악되어있는 호남고속도로를 중심으로 평면 선형상 곡선부에 대하여 교통사고의 분포를 적합도 검정을 통해 알아보고자 하였다. 사고자료는 한국도로송사의 호남고속도로 5년(1996∼2000)간 자료를 분석에 맞게 정리하였으며, 강민욱과 송봉수(2002)에서 제시한 평면선형에 있어서의 구간분할법을 이용하여 배향곡선구간과 단일곡선구간에 대한 사고분석을 하였다. 적합도 분석결과, 예상대로 음이항분포가 사고건수를 설명하기에 가장 적합한 확률분포로 제시되었으며, 이를 통해 최우추정법을 이용한 음이항회귀모형을 개발하였다. 구간분할법을 적용한 음이항회귀모형의 경우, 기존의 확률회귀토형에 비하여 높은 결정계수를 갖았으며, 모형에서 적용된 기하구조요소로는 차량 노출계수, 곡선반경, 단위거리 당 편경사변화값 등이다.

기계학습을 활용한 데이터 기반 경찰신고건수 예측 (The Data-based Prediction of Police Calls Using Machine Learning)

  • 최재훈
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.101-112
    • /
    • 2018
  • 본 연구는 기계학습의 하나인 신경망 분석과 음이항 회귀분석을 활용하여 경찰신고건수를 예측하고자 2016년 6월부터 2017년 5월까지 충남지방경찰청에 접수된 112신고 데이터를 이용하여 예측모델을 개발하였다. 모델을 개발하기 위해 경찰신고건수에 영향을 줄 수 있는 시간, 휴일, 휴일 전날, 계절, 기온, 강수량, 풍속, 관할면적, 인구, 외국인 수, 단독주택비율, 기타주택비율 변수 등을 활용하였다. 변수의 종류에 따라 몇몇은 경찰신고건수와 양의 상관관계 또는 음의 상관관계가 확인되었다. 사용된 두 개의 방법론을 비교한바, 신경망분석의 예측 결과는 예측 값과 실제 값의 상관계수 0.7702, RMSE 2.557이고, 음이항 회귀분석은 상관계수 0.7158, RMSE 2.831으로 나타났다. 신경망분석은 해석가능성은 낮지만, 음이항 회귀분석에 비해 예측력이 뛰어나다는 것이 확인되었다. 향후 경찰관서에서 본 연구의 예측모델을 기초로 하여 최적의 경찰력 배치를 할 수 있을 것으로 기대된다.

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

음이항 회귀모형을 이용한 공간구문론 및 도시특성요소가 범죄발생에 미치는 영향 연구 (A Study on the Influence of the Space Syntax and the Urban Characteristics on the Incidence of Crime Using Negative Binomial Regression)

  • 김형준;최열
    • 대한토목학회논문집
    • /
    • 제36권2호
    • /
    • pp.333-340
    • /
    • 2016
  • 본 연구는 부산광역시를 대상으로 범죄발생에 영향을 미치는 요인 특히, 공간구문론에 의한 영향을 분석한 실증적 연구이다. 정확한 분석을 위해 본 연구에서는 가산자료 분석의 대표적 방법인 포아송 회귀분석과 음이항 회귀분석을 활용하여 분석을 수행하였다. 5대 범죄발생에 미치는 영향을 분석한 결과, 총 13개 변수 중 8개 변수가 유의하게 나타났다. 인구학적 특성변수에서는 여성인구비율, 65세 노인인구 비율이, 토지이용 특성변수에서는 행정구역면적과 상업지면적비가 통계적으로 유의하게 나타났다. 범죄대응 특성변수인 CCTV는 그 수가 증가할수록 범죄발생은 감소한다고 나타났다. 공간구문 특성변수에서는 연결도, 국부통합도, 전체통합도가 통계적으로 유의하게 나타났다. 그 중에서 연결도는 그 수치가 낮을수록 연결된 다른 공간이 적기 때문에 갑작스런 방해자의 출현 가능성이 낮고, 통행인에 의한 감시도가 낮아져 범죄발생 요인이 되는 것으로 나타났다. 이러한 분석들을 통해 본 연구는 차후 범죄예방적 측면의 도시계획 입안 및 실천에 기여할 수 있는 기초적 자료를 제공하고자 한다.

중소기업 청년인턴 이직횟수 결정요인 분석 (The study on the determinants of the number of job changes)

  • 박성익;류장수;김종한;조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.387-397
    • /
    • 2015
  • 본 연구에서는 청년인턴 DB와 고용보험 DB를 사용하여 중소기업 청년인턴의 이직횟수에 영향을 미치는 요인을 분석하였다. 이직횟수는 음수가 아닌 정수 값만 가지는 계수 데이터 (count data)이므로 일반적인 선형회귀모형을 적용하는 것은 문제가 있다. 따라서 계수 데이터에 적합한 회귀모형으로 포아송 회귀모형, 영과잉 포아송 회귀모형, 음이항 회귀모형, 영과잉 음이항 회귀모형 등 4개의 회귀모형을 적용하였다. 분석결과 최적모형으로 영과잉 음이항 회귀모형이 선택되었다. 주요 분석결과를 정리하면 다음과 같다. 첫째, 통제집단 (비인턴집단)에 비해서 처리집단 (인턴집단)이 통계적으로 유의하게 이직경험이 낮게 나타났다. 둘째, 연령이 작을수록 통계적으로 유의하게 이직경험이 낮게 나타났다. 셋째, 여자에 비해서 남자가 유의하게 이직횟수가 높게 나타났다. 마지막으로 기업규모가 클수록 이직횟수가 유의하게 감소하는 것으로 나타났다.

청주.청원 지방부 신호교차로의 후미추돌 사고모형 (Rear-end Accident Models of Rural Area Signalized Intersections in the Cases of Cheongju and Cheongwon)

  • 박병호;인병철
    • 한국도로학회논문집
    • /
    • 제11권2호
    • /
    • pp.151-158
    • /
    • 2009
  • 본 연구는 지방부에서의 후미추돌사고를 다루고 있다. 이 연구의 목적은 신호교차로의 후미주돌 사고특성을 분석하고 청주 청원에 대한사고모형을 개발하는 것이다. 이를 위해, 이 연구에서는 도시부와 지방부의 특성을 비교하는데 중점을 두고 있다. 이 연구에서 사용된 종속변수는 사고건수와 EFDO(equivalent property damage only)이며, 독립변수는 교통량과 기하구조 요소들로 이루어졌다. 주요 연구결과는 다음과 같다. 첫째, 사고건수를 종속변수로 이용한 포아송 회귀모형과 EFDO를 종속변수로 이용한 음이항 회귀모형이 통계적으로 적합한 것으로 분석된다. 둘째, 포아송 회귀분석 결과 나타난 독립변수들은 중차량비, 교통량 합계 그리고 차량 유출입구 합계이며 음이항 회귀분석으로 나타난 요인은 주도로 폭, 교통량 합계 그리고 중차량비로 분석된다. 마지막으로, 지방부에서의 특정 독립변수는 주도로 폭과 중차량비 그리고 차량 유출입구 합계이다.

  • PDF

차량유형별 로터리 사고모형 (Accident Models of Rotary by Vehicle Type)

  • 한수산;박병호
    • 대한교통학회지
    • /
    • 제29권6호
    • /
    • pp.67-74
    • /
    • 2011
  • 이 연구는 차량유형별 로터리 교통사고를 다루고 있다. 이 논문은 차량유형별 교통사고 특성을 비교 분석하고, 사고모형을 개발하는데 그 목적이 있다. 이를 위해 이 연구에서는 차량유형을 세 그룹으로 나누어 그 차이점을 분석하고, 국내 로터리 자료를 이용하여 포아송 및 음이항 회귀모형과 ZAM모형을 개발하는데 중점을 두고 있다. 주요 연구결과는 다음과 같다. 첫째, 승용차량과 화물 및 승합차, 원동기의 사고건수를 종속변수로 하는 통계적으로 의미있는 2개의 ZIP 모형과 1개의 음이항 모형이 개발되었다. 둘째, 모형별 채택된 독립변수를 활용하여 세 모형의 차이가 비교 분석되었다. 마지막으로 로터리 사고를 예방하기 위해 조명시설, 과속방지턱과 같은 교통안전시설물 설치가 필요한 것으로 평가되었다.

사고유형에 따른 청주시 4지 신호교차로 교통사고모형 (Traffic Accident Models of Cheongju Four-Legged Signalized Intersections by Accident Type)

  • 박병호;한상욱;김태영;김원호
    • 대한교통학회지
    • /
    • 제26권5호
    • /
    • pp.153-162
    • /
    • 2008
  • 본 연구는 청주시 4지 신호교차로를 대상으로 한 교통사고를 다루고 있다. 연구의 목적은 143개 교차로 사고자료를 이용하여 사고유형별 특성을 비교분석하고 모형을 개발에 있다. 이를 위해 본 연구에서는 정면충돌, 후미추돌, 측면직각, 접촉, 차로변경접촉 등의 모형을 개발하는데 중점을 두고 있다. 분석된 주요결과를 요약하면 다음과 같다. 첫째 가산자료모형 설정을 위해 과산포 검정을 한 결과 음이항 회귀모형이 선정되었다. 둘째, 통계적으로 설명력이 높은 5개의 음이항 모형이 개발되었다. 셋째, 공통변수(ADT)와 특정변수를 활용하여 모형의 차이가 비교 분석되었다.

포아송 및 음이항 회귀분석을 이용한 해상운임 결정요인이 해운선사의 블랭크 세일링에 미치는 영향 분석 연구 (A Study on Impact of Factors Influencing Maritime Freight Rates Using Poisson and Negative Binomial Regression Analysis on Blank Sailings of Shipping Companies)

  • 류원형;남형식
    • 한국항해항만학회지
    • /
    • 제48권1호
    • /
    • pp.62-77
    • /
    • 2024
  • 해상운송 산업에서는 공급과 수요의 불균형이 지속적으로 증가하면서 세계 주요 해운선사들이 해운 시황에 따른 선복량을 탄력적으로 조절하기 위해 블랭크 세일링을 주요 수단으로 사용하고 있다. 일반적으로 블랭크 세일링은 중국의 춘절 기간에 맞추어 많이 실시되어 왔지만, 2020년부터 시작된 글로벌 팬데믹과 미국·중국 간 무역 전쟁 등과 같은 특수한 상황으로 인해 최근 해운선사들은 기존 대비 큰 규모의 블랭크 세일링을 실시하였다. 이러한 블랭크 세일링은 화물 운송 지연에 직접적 영향을 미치기 때문에 기업과 소비자의 측면에서 부정적인 영향을 초래할 수 있다. 따라서 본 연구는 이에 선제적으로 대응하기 위해 포아송 회귀모형과 음이항 회귀모형을 활용하여 해상운임 결정요인이 해운선사의 블랭크 세일링에 미치는 영향력을 분석하였다. 분석 결과, 포아송 회귀분석의 2M의 경우 유의한 변수로 글로벌 컨테이너 해상물동량, 컨테이너 선복량, 컨테이너선 해체량, 컨테이너선 신조선가지수, OECD 인플레이션을 도출하였고, 음이항 회귀분석의 Ocean Alliance의 경우 글로벌 컨테이너 해상물동량과 컨테이너선 발주량을, THE Alliance의 경우 컨테이너선 선복량과 금리를, Non-Alliance의 경우 국제유가, 글로벌 공급망 압력지수, 컨테이너선 선복량, OECD 인플레이션을, Total Alliance의 경우 컨테이너선 선복량과 금리를 유의한 변수로 도출할 수 있었다.

제로팽창 음이항 회귀모형에 대한 베이지안 추론 (Bayesian Inference for the Zero In ated Negative Binomial Regression Model)

  • 심정숙;이동희;정병철
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.951-961
    • /
    • 2011
  • 본 논문에서는 제로팽창 음이항(ZINB) 회귀모형에서 회귀계수에 대한 추론방법으로 마코프체인몬테카를로(MC MC) 기법을 이용한 베이지안 추론방법을 제안하였다. 본 연구에서 고려한 ZINB 회귀모형은 반응변수의 평균뿐만 아니라 제로팽창확률에 대한 회귀모형을 고려한 것으로서 Jang, et al.(2010)의 연구를 확장한 것이다. 아울러 실제사례에 본 연구에서 제안한 베이지안 추론방법을 적용하고 과대산포를 허용하지 않는 제로팽창 포아송(ZIP) 회귀모형과 적합결과를 DIC를 이용하여 비교하였다. 실제 사례분석 결과 ZINB 회귀모형의 DIC가 ZIP모형보다 작게 나타나 ZINB 회귀모형이 ZIP 회귀모형보다 잘 적합되었음을 알 수 있었다.