• Title/Summary/Keyword: 단계적 회귀분석모형

Search Result 222, Processing Time 0.031 seconds

Trip Generation Model based on Geographically Weighted Regression (공간가중회귀분석을 이용한 통행발생모형)

  • Kim, Jin-Hui;Park, Il-Seop;Jeong, Jin-Hyeok
    • Journal of Korean Society of Transportation
    • /
    • v.29 no.2
    • /
    • pp.101-109
    • /
    • 2011
  • In most of the urbanized cities, socio-economic attributes tend to cluster as patterns of similarity in space, namely spatial autocorrelation, by agglomeration forces. The classical linear regression model, the most frequently adopted in the trip generation step, cannot sufficiently represent this effect. In order to take into account the effect properly, we need a model which adequately deals with the spatial dependence patterns. In this study, the Geographically Weighted Regression (GWR) model is adopted as an alternative method for the local analysis of relationships in multivariate data sets; that is GWR extends this traditional regression framework by estimating local rather than global parameters. This study shows the existence of spatial effects in the production and attraction of home base/non-home based trips through the GWR model using travel data collected in Daegu metropolitan area. Furthermore, LISA is employed to verify the fact that the local spatial autocorrelation exists.

A Comparative Analysis of the Forecasting Performance of Coal and Iron Ore in Gwangyang Port Using Stepwise Regression and Artificial Neural Network Model (단계적 회귀분석과 인공신경망 모형을 이용한 광양항 석탄·철광석 물동량 예측력 비교 분석)

  • Cho, Sang-Ho;Nam, Hyung-Sik;Ryu, Ki-Jin;Ryoo, Dong-Keun
    • Journal of Navigation and Port Research
    • /
    • v.44 no.3
    • /
    • pp.187-194
    • /
    • 2020
  • It is very important to forecast freight volume accurately to establish major port policies and future operation plans. Thus, related studies are being conducted because of this importance. In this paper, stepwise regression analysis and artificial neural network model were analyzed to compare the predictive power of each model on Gwangyang Port, the largest domestic port for coal and iron ore transportation. Data of a total of 121 months J anuary 2009-J anuary 2019 were used. Factors affecting coal and iron ore trade volume were selected and classified into supply-related factors and market/economy-related factors. In the stepwise regression analysis, the tonnage of ships entering the port, coal price, and dollar exchange rate were selected as the final variables in case of the Gwangyang Port coal volume forecasting model. In the iron ore volume forecasting model, the tonnage of ships entering the port and the price of iron ore were selected as the final variables. In the analysis using the artificial neural network model, trial-and-error method that various Hyper-parameters affecting the performance of the model were selected to identify the most optimal model used. The analysis results showed that the artificial neural network model had better predictive performance than the stepwise regression analysis. The model which showed the most excellent performance was the Gwangyang Port Coal Volume Forecasting Artificial Neural Network Model. In comparing forecasted values by various predictive models and actually measured values, the artificial neural network model showed closer values to the actual highest point and the lowest point than the stepwise regression analysis.

A Comparative Study on the Genetic Algorithm and Regression Analysis in Urban Population Surface Modeling (도시인구분포모형 개발을 위한 GA모형과 회귀모형의 적합성 비교연구)

  • Choei, Nae-Young
    • Spatial Information Research
    • /
    • v.18 no.5
    • /
    • pp.107-117
    • /
    • 2010
  • Taking the East-Hwasung area as the case, this study first builds gridded population data based on the municipal population survey raw data, and then measures, by way of GIS tools, the major urban spatial variables that are thought to influence the composition of the regional population. For the purpose of comparison, the urban models based on the Genetic Algorithm technique and the regression technique are constructed using the same input variables. The findings indicate that the GA output performed better in differentiating the effective variables among the pilot model variables, and predicted as much consistent and meaningful coefficient estimates for the explanatory variables as the regression models. The study results indicate that GA technique could be a very useful and supplementary research tool in understanding the urban phenomena.

Development of Multiple Linear Regression Model to Predict Agricultural Reservoir Storage based on Naive Bayes Classification and Weather Forecast Data (나이브 베이즈 분류와 기상예보자료 기반의 농업용 저수지 저수율 전망을 위한 저수율 예측 다중선형 회귀모형 개발)

  • Kim, Jin Uk;Jung, Chung Gil;Lee, Ji Wan;Kim, Seong Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.112-112
    • /
    • 2018
  • 최근 이상기후로 인한 국부적인 혹은 광역적인 가뭄이 빈번하게 발생하고 있는 추세이며 발생횟수 뿐 아니라 가뭄 심도 및 지속기간이 과거보다 크게 증가하여 그에 따른 피해가 커질 것으로 예측되고 있다. 특히, 2014~2015년도의 유례없는 가뭄으로 인해 저수지 용수공급이 제한되면서 많은 농가들이 피해를 입었다. 본 연구의 목적은 전국 농업용 저수지를 대상으로 기상청 3개월 예보자료를 활용 할 수 있는 농업용 저수지 저수율 다중선형 회귀 모형을 개발하여 저수율 전망정보를 생산하는 것이다. 본 연구에서는 전국에 적용 가능한 저수율 다중선형 회귀 모형개발을 위해 5개의 기상요소(강수량, 최고기온, 최저기온, 평균기온, 평균풍속)와 관측 저수지 저수율을 활용했다. 기상자료는 2002년부터 2017년까지의 기상청 63개 지상관측소로부터 기상관측자료를 수집하였다. 본 연구에서는 저수율 전망 단계를 세 단계로 나누었다. 첫 번째 단계로 농어촌공사에서 전국 511개 용수구역을 대상으로 군집분석 및 의사결정나무 분석을 통해 제시한 65개 대표저수지를 대상으로 기상자료 및 관측 저수율 자료를 이용하여 다중선형 회귀분석을 실시하였다. 수집한 기상요소와 저수율을 독립변수로 하여 월별 회귀식을 산정한 결과 결정계수($R^2$)는 0.51~0.95로 나타났다. 두 번째 단계로 대표저수지의 회귀분석 결과를 전국의 저수지로 확대하기 위해 나이브 베이즈 분류법을 적용하여 전국 3098개의 저수지를 65의 군집으로 분류하고 각각의 군집에 해당되는 월별 회귀식을 산정하였다. 마지막으로 전국 저수지로 산정된 회귀식과 농업 가뭄 예측을 위해 기상청의 GS5(Global Seasonal Forecasting System 5) 3개월 예보자료를 수집하여 회귀식에 적용해 2017년 전국 저수지의 3개월 저수율 전망정보를 생산하였다. 본 연구의 전국 저수지 군집결과 기반의 저수율 전망기술은 2017년도 관측 저수율과 비교한 결과 유의한 상관성을 나타냈으며 이 결과는 추후 농업용 저수지의 물 공급 및 농업가뭄 전망 자료로서 이용이 가능할 것으로 판단된다.

  • PDF

Semi-Markov 모형에 기초한 다중상태 생존자료의 준모수적 분석

  • 여성칠
    • Communications for Statistical Applications and Methods
    • /
    • v.5 no.3
    • /
    • pp.777-792
    • /
    • 1998
  • 병원의 임상연구실험에서 종종 환자들의 치료에 따른 병세의 호전상태를 여러단계로 분류하여 상이한 치료방법에 대한 치료효과간의 차이론 알고자 하는 경우가 있다. 이와 같이 다중상태의 생존자료를 분석하기 위해서 본 논문에서는 semi-Markov 모형에 Cox 회귀모형을 적용하여 회귀계수와 기저생존함수를 추정하고 이를 바탕으로 반응확률함수를 추정하였다. 그리고 본 논문의 결과를 실제 임상실험에서 얻어진 자료에 적용하여 분석하였다.

  • PDF

Alalysis of flood damage type by climate change using stepwise regression model (단계적 회귀모형을 이용한 기후변화에 따른 홍수피해 유형분석)

  • Kim, Myojeong;Kim, Gwangseob
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.394-394
    • /
    • 2018
  • 최근 기후변화로 인하여 강수량 및 집중호우 발생 횟수의 증가에 따라 홍수의 발생 빈도 및 강도가 증가한다. 기후변화에 따른 미래의 강수량 예측은 2013년에 발간된 IPCC(Intergovernmental Panel on Climate Change) 5차 평가보고서 (AR5)를 활용하여 분석하고 있다. 기후변화 시나리오에 따라 기온 상승률 및 강수량의 증가량, 극한 강우사상의 발생 빈도 및 발생정도가 다르게 결정되며, 극한 강우사상으로 유발되는 홍수의 피해 정도가 홍수피해 유형별로 다르게 나타난다. 본 연구에서는 기후변화에 따른 미래의 홍수 피해 정도를 예측하기 위하여 홍수에 영향을 미치는 인자 및 홍수를 감소시키는 인자들을 활용하여 단계적 회귀모형을 이용하여 인명피해, 피해면적, 피해액, 발생빈도 등 홍수피해 유형 별로 현재 및 미래의 홍수피해정도를 예측 및 분석하였다. 홍수에 영향을 미치는 인자로 연평균강수량, 일최대강수량, 1시간최대강수량, 10분최대강수량, 호우일수, 인구밀도, 자산밀도, 도로현황, 시가화율 등을 사용하였고, 홍수 피해를 감소시키는 치수대책으로는 하천개수율, 하수도보급률, 양수량, 유수지용량 등을 사용하였다.

  • PDF

Applying regional regression analysis of the hydrologic model parameters for assessing climate change impacts in the ungaged watershed (미계측 유역의 기후변화 영향평가를 위한 수문모형 매개변수의 지역회귀분석 적용)

  • Kim, Youngil;Seo, Seung Beom;Kim, Sung Jin;Kim, Young-Oh
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.219-219
    • /
    • 2017
  • 상대적으로 유역의 관측 자료가 충분하지 못하거나 검증되지 않았을 경우 미계측 유역으로 정의되며 수문모형의 매개변수 검정을 할 수 없으므로 다른 방법을 고안해야 한다. 이를 위해 기존 연구에서는 지역적 특성을 고려한 지역회기분석을 통해 미계측 유역의 유량을 산정하였는데, 대부분 유역의 특성과 연 평균 유출량 자료의 관계를 이용한 회귀식으로 실시간 유량의 변화를 고려하기 어려웠다. 본 연구에서는 개념적 강우-유출모형으로 많이 사용되고 있는 개념적 수문모형인 GR4J의 매개변수에 대해 미계측 유역의 특성을 고려한 변수들을 이용하여 회귀식을 구하고 그 적용성을 평가하였다. 이를 통해 미계측 유역의 유량 시계열 자료를 생성할 수 있었다. 또한 IPCC에서 발간한 AR5의 RCP 4.5 시나리오를 적용하여 미래 유출량을 산정하였다. 우선 지역회귀분석을 적용하기 위해 수문모형을 이용한 계측 유역의 유출량을 구하였으며 22개의 전국 댐 상류 지점을 기준으로 SCE 알고리즘을 이용하여 GR4J의 최적 매개변수를 구하고 각 유역별로 물리적, 지형적, 기상학적 특성을 고려하여 11개의 변수를 선택하였다. 각 변수간 다중공선성(Multicollinearity)를 고려하기 위해 VIF(Variation Inflation Factor) test를 적용하여 최종 7개의 변수를 선정하고 단계별 회귀방법(Stepwise regression)을 이용하여 GR4J의 매개변수별 회귀식을 생성하였다.

  • PDF

A Development of Formula on Time of Concentration and Storage Constant in Sumjin River Basin (섬진강 유역의 도달시간 및 저류상수 산정공식 개발)

  • 이신재;박양래;김명수;박상우
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2004.05b
    • /
    • pp.1193-1197
    • /
    • 2004
  • 본 연구는 강우에 내한 유역의 반응시간에 관한 연구로써 우리나라 자연하천유역에 적합한 도달시간 및 저류상수 산정공식을 개발하기 위하여 섬진강 유역을 대상으로 유역특성인자 및 강우 특성인자를 분석하고, 이를 다중회귀분석방범 중 최적의 회귀모형을 추출하기 위한 단계별 회귀분석방법을 이용하여 산정공식을 개발하였다. 그리고 개발된 산정공식으로부터의 도달시간 및 저류 상수들을 기존 경험공식의 값들과 비교하였으면, 또한 이를 Clark 모형에 적용하여 실제 호우사상들에 대한 유출수문곡선을 분석하여 관측수문곡선과 비교 검토하였다. 그 걸과 계산된 유출수문곡선과 관측수문곡선은 첨두유량 및 첨두발생시간에서 비교적 적은 오차를 보였으며, 유출수문곡선의 양상에서도 상호 높은 상관성을 보여 개발된 산정공식에 대한 적합성을 잘 나타내주고 있다.

  • PDF

Completion of the Missing Rainfall Data by a Multi-regression method (다중회귀분석을 이용한 강우량 결측치 보정)

  • Lee, Myoung-Woo;Lee, Bong-Hee;Kim, Hung-Soo;Shim, Myung-Pil
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.775-779
    • /
    • 2006
  • 강우자료의 구축은 수문해석에 있어 가장 기본적이며 중요한 단계라 할 수 있다. 하지만 수문 관측 자료의 경우 결측치가 존재하여 그에 대한 보정이 필요한 경우가 종종 발생하게 된다. 따라서 수문자료의 분석을 수행하기에 앞서 우선 자료에 대한 검정을 실시하고, 결측치가 존재할 경우는 이를 보정하여 분석을 수행하여야 한다. 본 연구에서는 다변량통계기법의 하나인 다중회귀분석을 이용하여 강우 결측치를 보정하였다. 본 연구에서는 다중공선성과 자기상관에 대하여 고려한 다중회귀모형을 구성하였다. 모형의 구성시 모든 결측지점에 적용이 가능하지 않아 일반성이 떨어짐을 확인 할 수 있었지만, 모형이 구성될 경우 통계적 적합도와 유의수준을 확인 할 수 있는 장점이 있었으며, 다중회귀모형이 구성되는 경우 좋은 보정 결과를 주는 것을 확인 할 수 있었다.

  • PDF

Analysis of Horse Races: Prediction of Winning Horses in Horse Races Using Statistical Models (서울 경마 경기 우승마 예측 모형 연구)

  • Choe, Hyemin;Hwang, Nayoung;Hwang, Chankyoung;Song, Jongwoo
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.6
    • /
    • pp.1133-1146
    • /
    • 2015
  • The Horse race industry has the largest proportion of the domestic legal gambling industry. However, there is limited statistical analysis on horse races versus other sports. We propose prediction models for winning horses in horse races using data mining techniques such as logistic regression, linear regression, and random forest. Horse races data are from the Korea Racing Authority and we use horse racing reports, information of racehorses, jockeys, and horse trainers. We consider two models based on ranks and time records. The analysis results show that prediction of ranks is affected by information on racehorses, number of wins of racehorses and jockeys. We place wagers for the last month of races based on our prediction models that produce serious profits.