• 제목/요약/키워드: zero-inflated model

검색결과 66건 처리시간 0.023초

발명자 네트워크의 공간적 결정요인 분석 (An Analysis of Spatial Determinants of Inventor Networks in Korea)

  • 정준호
    • 한국경제지리학회지
    • /
    • 제19권1호
    • /
    • pp.1-17
    • /
    • 2016
  • 본 논문은 내국인 특허출원 자료에서 복수 발명자들의 주소지들을 파악하고 가산자료의 특성을 통제할 수 있는 영과잉 음이항 회귀모형을 사용하여 230개 시군구 간 발명자 네트워크의 공간구조와 그것의 결정요인을 분석한다. 발명자 네트워크의 공간적 연계에 영향을 미치는 몇 가지 요인들이 확인된다. 이출지역이 민간 R&D, 고등교육수준, 인구규모, 특허 생산성 등과 같은 R&D 관련 지역 특수적 자산들을 많이 보유하면 동태적인 수요효과를 통해 공간적 연계는 다른 지역으로 확대된다. 그리고 물리적 거리뿐만 아니라 기술적 거리에서도 거리조락현상이 나타난다. 이입지역이 R&D 관련 지역 특수적 자산을 많이 보유하면 유사한 논리로 공간적 연계에서 정(+)의 효과가 발생한다.

  • PDF

사업체노동력조사를 활용한 빈 일자리 수 추정에 대한 정합성 연구 (A Study of Consistency in Estimating the Number of Vacant Jobs Using the Labor Force Survey at Establishments)

  • 박승환
    • 아태비즈니스연구
    • /
    • 제13권3호
    • /
    • pp.329-341
    • /
    • 2022
  • Purpose - The purpose of this study was to investigate consistency in estimating the number of vacant jobs using the two business labor force survey with two different time points of survey. Design/methodology/approach - We studied the cause of the differences in estimating the number of vacant jobs between the monthly sample and the new sample in business labor force survey. Findings - To summarize our findings, As the size of the company increases, the number of vacant jobs in the company also increases, and the probability that the number of vacant jobs in the company is zero decreases. The monthly sample was assessed to have a higher likelihood that the number of vacant jobs in the company was zero and the number of vacant jobs was considerable compared to the local sample. Research implications or Originality - Because local survey sample companies tend to minimize the number of vacant jobs even when they reply under the same conditions, the estimation result of the number of vacant jobs in the current monthly survey differs significantly from the estimation result of the local survey. Divergent "degrees of knowledge of question items," survey methodologies, or investigators could be the causes of the various response trends.

Modeling clustered count data with discrete weibull regression model

  • Yoo, Hanna
    • Communications for Statistical Applications and Methods
    • /
    • 제29권4호
    • /
    • pp.413-420
    • /
    • 2022
  • In this study we adapt discrete weibull regression model for clustered count data. Discrete weibull regression model has an attractive feature that it can handle both under and over dispersion data. We analyzed the eighth Korean National Health and Nutrition Examination Survey (KNHANES VIII) from 2019 to assess the factors influencing the 1 month outpatient stay in 17 different regions. We compared the results using clustered discrete Weibull regression model with those of Poisson, negative binomial, generalized Poisson and Conway-maxwell Poisson regression models, which are widely used in count data analyses. The results show that the clustered discrete Weibull regression model using random intercept model gives the best fit. Simulation study is also held to investigate the performance of the clustered discrete weibull model under various dispersion setting and zero inflated probabilities. In this paper it is shown that using a random effect with discrete Weibull regression can flexibly model count data with various dispersion without the risk of making wrong assumptions about the data dispersion.

Threshold-asymmetric volatility models for integer-valued time series

  • Kim, Deok Ryun;Yoon, Jae Eun;Hwang, Sun Young
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.295-304
    • /
    • 2019
  • This article deals with threshold-asymmetric volatility models for over-dispersed and zero-inflated time series of count data. We introduce various threshold integer-valued autoregressive conditional heteroscedasticity (ARCH) models as incorporating over-dispersion and zero-inflation via conditional Poisson and negative binomial distributions. EM-algorithm is used to estimate parameters. The cholera data from Kolkata in India from 2006 to 2011 is analyzed as a real application. In order to construct the threshold-variable, both local constant mean which is time-varying and grand mean are adopted. It is noted via a data application that threshold model as an asymmetric version is useful in modelling count time series volatility.

경유지를 고려한 서울시 공공자전거 통행발생량 추정 모형 개발 (Estimating Travel Frequency of Public Bikes in Seoul Considering Intermediate Stops)

  • 박종한;고준호
    • 한국ITS학회 논문지
    • /
    • 제22권3호
    • /
    • pp.1-19
    • /
    • 2023
  • 최근 탄소중립의 대안으로 떠오르고 있는 자전거의 통행행태를 파악하기 위하여 경유지를 고려한 통행발생량을 추정하고자 하였다. 서울시 공공자전거인 '따릉이'의 GPS 주행궤적 데이터를 이용하여 통행에서의 중간 경유지인 체류 지점을 파악하고, 인구, 토지이용, 물리적인 특성을 반영한 통행발생량 모형을 분석하였다. 맵매칭과 체류 지점 탐지 알고리즘을 이용하여 체류 지점을 추정한 결과, 전체 통행의 약 12.1%에서 체류 지점이 나타났다. 체류가 발생한 통행은 비체류에 비해 평균 이용거리와 이용시간이 더 길며, 체류 지점이 집중되는 시간대는 오전 첨두시와 오후 첨두시 사이의 비첨두시인 것으로 나타났다. 시각화 분석에 따르면 공원 및 레저 시설, 업무시설에서 주로 체류 지점이 나타났다. 체류 지점을 고려하기 위하여 기존의 대여소 기반이 아닌 육각격자를 분석단위로 설정하였으며, 영과잉 음이항(Zero-Inflated Negative Binomial, ZINB) 모형을 이용하여 체류 지점을 고려한 통행발생량을 추정하였다. 분석결과, 자전거전용도로 및 자전거·보행자겸용도로(분리형)와 같이 자전거 이용자의 안전이 확보된 자전거 인프라에서 통행발생량 및 체류 지점에서 발생한 통행이 많은 것으로 나타났다. 또한 공공자전거는 대중교통의 접근수단으로서 퍼스트&라스트 마일 수단의 역할을 하며, 생활중심지와 고용중심지에서 통행발생량이 커지는 것으로 나타났다. 이러한 분석 결과를 토대로 자전거 인프라의 추가 확충 계획 시 이용자의 안전시설 및 공간 확보가 우선돼야 하며, 대중교통과 연계한 자전거 인프라 시설 보급방안의 수립이 필요한 것으로 보인다.

ZAM을 이용한 국내 회전교차로 오토바이 사고모형 (Motorcycle Accident Model at Roundabout in Korea using ZAM)

  • 박병호;임진강;나희
    • 한국안전학회지
    • /
    • 제29권3호
    • /
    • pp.107-113
    • /
    • 2014
  • The goal of this study is to develop the accident models of motorcycle at roundabouts. In the pursuing the above, this study gives particular attentions to developing the appropriate models using ZAM. The main results are as follows. First, the evaluation of various developed models by the Vuong statistic and over-dispersion parameter shows that ZINB is analyzed to be optimal among Poisson, NB, ZIP(zero-inflated Poisson) and ZINB regression models. Second, the traffic volume, width of central island and width of approach are evaluated to be important variables to the accidents. Finally, the common variables that affect to the accident are selected to be traffic volume and width of approach. This study might be expected to give some implications to the accident research on the roundabout by motorcycle.

Application of discrete Weibull regression model with multiple imputation

  • Yoo, Hanna
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.325-336
    • /
    • 2019
  • In this article we extend the discrete Weibull regression model in the presence of missing data. Discrete Weibull regression models can be adapted to various type of dispersion data however, it is not widely used. Recently Yoo (Journal of the Korean Data and Information Science Society, 30, 11-22, 2019) adapted the discrete Weibull regression model using single imputation. We extend their studies by using multiple imputation also with several various settings and compare the results. The purpose of this study is to address the merit of using multiple imputation in the presence of missing data in discrete count data. We analyzed the seventh Korean National Health and Nutrition Examination Survey (KNHANES VII), from 2016 to assess the factors influencing the variable, 1 month hospital stay, and we compared the results using discrete Weibull regression model with those of Poisson, negative Binomial and zero-inflated Poisson regression models, which are widely used in count data analyses. The results showed that the discrete Weibull regression model using multiple imputation provided the best fit. We also performed simulation studies to show the accuracy of the discrete Weibull regression using multiple imputation given both under- and over-dispersed distribution, as well as varying missing rates and sample size. Sensitivity analysis showed the influence of mis-specification and the robustness of the discrete Weibull model. Using imputation with discrete Weibull regression to analyze discrete data will increase explanatory power and is widely applicable to various types of dispersion data with a unified model.

주거지역 가로환경 및 일상 걷기가 정신 건강에 미치는 영향 - 서울시 대상으로 - (Estimation of the Effects of Daily Walking Hours and Days on the Mental Health of Urban Residents - The Case in Seoul -)

  • 구본유;백승주;윤희연
    • 한국조경학회지
    • /
    • 제52권1호
    • /
    • pp.87-100
    • /
    • 2024
  • 본 연구는 도시민의 가로환경 이용을 매개로 하여 주거지역 가로환경 질이 도시민의 정신 건강에 미치는 영향을 밝히고자 하였다. 영과잉 음이항 회귀모형을 통해 보행 활동과 가로환경이 도시민의 우울 증세에 미치는 영향을 확인하였다. 연구 범위는 2017년 대한민국 서울특별시로 한정하였으며, 우울 유병 증세를 종속 변수, 가로환경 변수 및 보행 변수, 개인 특성을 독립 변수로 이용하였다. 나아가, 가로 녹지와 보행 빈도의 상호작용 효과를 살펴, 녹지에서 걷는 행위가 정신 건강에 미치는 상승효과를 분석하였다. 연구 결과, 가로 녹지 면적 비율이 높을수록 우울증세가 나타나지 않았다. 보행 빈도가 높을수록 우울 증세가 나타나지 않거나, 우울 증세가 존재할 경우에도 약하게 나타났다. 또한, 가로 녹지에서의 보행 빈도가 늘어날수록 우울 증세가 약하게 나타나는 상호작용 효과를 확인하였다. 시각적 복잡성은 낮을수록 우울 증세가 나타나지 않았다. 본 연구는 도시민의 정신 건강 문제를 지역사회차원에서 다루는 데에 기여하며, 가로 녹지와 보행 빈도의 시너지 효과를 발견함으로써 주거지역 가로 녹지 환경이 도시민 정신 건강 증진에 미치는 중요성을 강조하였다.

자원봉사활동의 지속성에 관한 연구 (A Study on the Duration of Volunteering)

  • 송기영;김욱진
    • 한국콘텐츠학회논문지
    • /
    • 제17권4호
    • /
    • pp.444-460
    • /
    • 2017
  • 자원봉사활동의 지속성은 헌신도와 부착성의 측면으로 나누어 살필 수 있다. 선행연구들은 대부분 헌신도의 측면에서 자원봉사활동의 지속성을 조사하였다. 본 논문은 선행연구들이 간과한 부착성 개념에 초점을 맞추어, 비록 약한 강도에 비정기적이라 할지라도 평생 혹은 그에 버금가는 긴 시간 동안 봉사를 일종의 '업'으로 삼아 꾸준히 활동을 수행해 나가는 일부 지속적 자원봉사자들의 특징을 밝히고, 이를 토대로 부착성의 관련요인들을 알아내는 것을 연구의 주된 목적으로 삼았다. 분석자료는 한국복지패널 1차년도부터 10차년도까지 10년 간 실시된 설문조사에 모두 참여한 8,415명의 20세 이상 성인응답자 표본에서 추출하였다. 주된 분석방법으로는 영과잉 음이항 회귀모형을 활용하였다. 연구결과, 산발적이고 비정기적일지라도 자원봉사로서의 사회적 역할에 단단히 부착되어 봉사현장에 꾸준히 나타나는 소수의 지속적 자원봉사자들은 종교가 있고 상호호혜의식이 강한 저학력자들인 것으로 조사되었다. 연구결과를 바탕으로 자원봉사 관리조직의 운영체계 효율화 방안을 제시하였다.

가산자료모형을 기초로 한 통행행태의 한계효과분석 (Marginal Effect Analysis of Travel Behavior by Count Data Model)

  • 장태연
    • 대한교통학회지
    • /
    • 제21권3호
    • /
    • pp.15-22
    • /
    • 2003
  • 교통수요예측의 통행발생단계에서 일반적으로 선형회귀모형이 활용되고 있다. 이러한 선형회귀모형은 여러가지 방법론적 한계성과 실용적 지속성을 가지지 못하는 경향을 보인다. 첫째, 종속변수로 이용되는 통행발생의 경우 비음정수(non-negative integer : 0, 1, 2 등)의 이산분포특징을 보이나, 선형회귀모형에서는 종속변수가 연속확률분포 인 정규분포의 특징을 가진 것으로 가정한다. 둘째, 모형이 자료측정에 적용되었을 때 음(-)의 결과를 산정 할 수 있으며, 독립변수의 증감에 따라 결과 값을 너무 높게 혹은 낮게 예측하는 경우가 있다 셋째, 예측된 값이 정상적인 범위 내에 있을 지라도 예측된 통행수만을 제시 할 뿐, 통행발생빈도에 대한 이산확률분포는 제공하지 않는다. 이같은 한계점을 극복하기 위해 주로 활용되어온 가산자료모형이 포와송모형이다. 그러나 포와송모형의 경우 자료의 평균과 분산이 동일하다는 가정하에 활용되고 있어 자료상에 과산포가 존재할 경우 오차를 과소평가 할 경향이 높아 모형의 신뢰성에 문제가 발생됨으로 기타 다른 가산자료모형의 적용을 고려해야한다. 연구에서는 과산포검정을 통해 통행발생빈도상에 과산포 존재를 밝혀내고 포와송모형의 부적합함을 제시하였으며 Vuong 검정을 통해 최적의 모형을 선정하였다. 선정된 모형을 대상으로 우도비검정과 Theil 부등계수에 의해 모형의 신뢰도와 정확성을 조사하였다. 최종적으로 가구의 사회경제적 속성의 변화에 따른 통행발생의 변화를 측정하기 위한 민감도 분석을 실시하였다.