• Title/Summary/Keyword: 지역회귀기법

Search Result 279, Processing Time 0.036 seconds

Locally adaptive intelligent interpolation for population distribution modeling using pre-classified land cover data and geographically weighted regression (지표피복 데이터와 지리가중회귀모형을 이용한 인구분포 추정에 관한 연구)

  • Kim, Hwahwan
    • Journal of the Korean association of regional geographers
    • /
    • v.22 no.1
    • /
    • pp.251-266
    • /
    • 2016
  • Intelligent interpolation methods such as dasymetric mapping are considered to be the best way to disaggregate zone-based population data by observing and utilizing the internal variation within each source zone. This research reviews the advantages and problems of the dasymetric mapping method, and presents a geographically weighted regression (GWR) based method to take into consideration the spatial heterogeneity of population density - land cover relationship. The locally adaptive intelligent interpolation method is able to make use of readily available ancillary information in the public domain without the need for additional data processing. In the case study, we use the preclassified National Land Cover Dataset 2011 to test the performance of the proposed method (i.e. the GWR-based multi-class dasymetric method) compared to four other popular population estimation methods (i.e. areal weighting interpolation, pycnophylactic interpolation, binary dasymetric method, and globally fitted ordinary least squares (OLS) based multi-class dasymetric method). The GWR-based multi-class dasymetric method outperforms all other methods. It is attributed to the fact that spatial heterogeneity is accounted for in the process of determining density parameters for land cover classes.

  • PDF

Reconsideration on the low flow estimation in Korea (국내 갈수량 산정에 대한 재고)

  • Cho, Tak-Guen;Kim, Young-Oh;Lee, Kil-Seong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.829-833
    • /
    • 2006
  • 갈수량(low flow)은 과거 자연상태 하천에서 갈수기에 흘렀던 유량으로서 자연과 사람이 공유할 수 있는 최소한의 유량이며, 이수측면에서 하천수의 공급능력을 평가하여 취수량을 설정하는 기준 유량이다. 일본과 국내에서는 지금까지 일유량의 유황곡선(flow duration curve)을 분석하여 평균갈수량, 기준갈수량 등을 결정하고 이를 갈수량의 지표로 이용하여 왔다. 그러나 미국과 영국 등에서는 7일 동안의 유량을 통계분석하여 만든 10년빈도 7일 최저유량$(7Q_{10})$을 갈수량 지표로 사용하고 있다. 본 연구에서는 위의 두 지표를 실험을 통해 비교하여 서로의 장단점을 우선 고찰하여 보았다. 갈수량 산정을 위해서는 과거의 관측 유량자료가 필요하나 국내에는 수위 관측시설이 한정되어 있을 뿐 아니라 홍수기에 비해 갈수기 자료가 턱없이 부족하여 갈수량 산정에 많은 어려움을 겪고 있다. 국내에서는 대부분 유역면적을 이용한 비유량법으로 계측유역으로부 터 미계측유역의 갈수량을 산정하고 있다. 본 연구에서는 미계측유역(ungauged basin)의 갈수량을 산정하기 위한 방법으로 지역회귀기법(regional regression method)을 국내에 적용하여 보았다. 이를 위해 9개 수위관측소 유역과 7개 댐 유역의 과거 유량자료를 이용하였으며, 교차검증(cross validation)을 통해 갈수량 산정결과의 정확도 검증을 실시하였다.

  • PDF

Assessing likelihood of drought impact occurrence in South korea through machine learning (머신러닝 기법을 통한 우리나라 가뭄 영향 발생 가능성 평가)

  • Seo, Jungho;Kim, Yeonjoo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.77-77
    • /
    • 2021
  • 가뭄은 사회·경제적으로 매우 큰 피해를 주는 자연재해이며, 그 시작과 발생 지역을 정확하게 예측하는 데 어려운 문제가 있다. 이에 수문 분야에서는 가뭄에 영향을 미치는 수문·기상인자들을 이용하여 다양한 가뭄지수를 개발하였고 이를 활용하여 가뭄 현상을 모니터링하고 예측 및 전망하는데 다양한 노력을 기울이고 있다. 하지만 가뭄지수들은 실제 가뭄이 어떠한 형태로 발생하는지 파악하기에 많은 한계점을 가지고 있다. 이에 최근 들어 미국과 유럽에서는 실제 농업, 환경, 에너지 등과 같은 다양한 분야에 걸쳐 가뭄 피해로 인해 생기는 가뭄 영향을 보다 체계적이고 상세한 데이터 인벤토리로 구축하고 가뭄지수와의 상관관계, 회귀분석과 같은 연구를 통해 가뭄 영향 예측을 시도하고 있다. 따라서 본 연구에서는 보고서, 데이터베이스, 웹 크롤링(Web-Crawling)을 통한 뉴스 기사 등과 같은 자료를 수집하여 국내 가뭄 영향 인벤토리를 구축하였다. 또한 수문 분야에 널리 사용되고 있는 가뭄지수인 표준 강수 증발산량지수 SPEI(Standardized Precipitation-Evapotranspiration Index)를 기반으로 지역에 따른 가뭄 영향을 예측하기 위해 최근 로지스틱 회귀모형, Random forest, Support vector machine, XGBoost 등의 다양한 머신러닝 기법을 적용하였다. 각 모형의 성능을 Receiver Operating Characteristic(ROC) 곡선을 통해 평가하여 가뭄 영향 예측에 적절한 머신러닝 기법을 제시하였다. 본 연구 결과를 통해 텍스트 기반의 가뭄 영향 자료와 머신러닝 기법을 통한 가뭄 영향 예측 방법론은 가뭄 재난 관리에 유용한 정보를 제공할 수 있다.

  • PDF

Machine Learning Prediction of Economic Effects of Busan's Strategic Industry through Ridge Regression and Lasso Regression (릿지 회귀와 라쏘 회귀 모형에 의한 부산 전략산업의 지역경제 효과에 대한 머신러닝 예측)

  • Yi, Chae-Deug
    • Journal of Korea Port Economic Association
    • /
    • v.37 no.1
    • /
    • pp.197-215
    • /
    • 2021
  • This paper analyzes the machine learning predictions of the economic effects of Busan's strategic industries on the employment and income using the Ridge Regression and Lasso Regression models with regulation terms. According to the Ridge estimation and Lasso estimation models of employment, the intelligence information service industry such as the service platform, contents, and smart finance industries and the global tourism industry such as MICE and specialized tourism are predicted to influence on the employment in order. However, the Ridge and Lasso regression model show that the future transportation machine industry does not significantly increase the employment and income since it is the primitive investment industry. The Ridge estimation models of the income show that the intelligence information service industry and global tourism industry are also predicted to influence on the income in order. According to the Lasso estimation models of income, four strategic industries such as the life care, smart maritime, the intelligence machine, and clean tech industry do not influence the income. Furthermore, the future transportation machine industry may influence the income negatively since it is the primitive investment industry. Thus, we have to select the appropriate economic objectives and priorities of industrial policies.

A stacking ensemble model to improve streamflow forecasts at medium range forecasts through hydrological regionalization over South Korea (한국 유역의 지역화를 통해 유출량 예측을 개선하기 위한 수문학적 후 처리된 스태킹 앙상블 모형)

  • Lee, Dong Gi;Ahn, Kuk-Hyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.182-182
    • /
    • 2021
  • 본 연구에서는 1일부터 최대 7일까지의 시간을 두고 남한 전체의 유출량에 대한 예측 모형을 제시하고자 한다. 이를 위하여 LSM (Land Surface Model) 모형을 사용하여 유출량을 모의하였고 이 과정에서 미 계측치에 대한 유출량을 예측하기 위하여 Xgboost (Extreme Gradient Boost)를 활용하여 매개변수를 지역화하였다. 이러한 지역화 기법을 통하여 남한 전체의 유출량에 대한 그리드화 된 유출값을 얻을 수 있었다. 또한 본 연구에서는 기상 예측자료를 유출량에 대한 예측으로 변환하기 위하여 Stacking 앙상블 기반의 수문학적 후처리 기법을 사용하였다. Stacking 앙상블 기법은 Base-learner와 Meta-learner의 조합으로 이루어 지는데 본 연구에서 새롭게 사용되는 패널티 기반의 분위회귀분석 방법론은 기존의 방법론과의 비교에 있어서 유용한 것으로 파악되었다. 결과적으로 본 연구에서는 총 7일의 앞선 시간의 예측에 있어서 한반도 전체의 유출량에서 비교적 짧은 시간에 대한 예측인 1일과 2일에서의 예측은 실질적으로 사용이 가능한 것으로 파악되었다.

  • PDF

A Study on Regionalization of Parameters for Sacramento Continuous Rainfall-Runoff Model Using Watershed Characteristics (유역특성인자를 활용한 Sacramento 장기유출모형의 매개변수 지역화 기법 연구)

  • Kim, Tae-Jeong;Jeong, Ga-In;Kim, Ki-Young;Kwon, Hyun-Han
    • Journal of Korea Water Resources Association
    • /
    • v.48 no.10
    • /
    • pp.793-806
    • /
    • 2015
  • The simulation of natural streamflow at ungauged basins is one of the fundamental challenges in hydrology community. The key to runoff simulation in ungauged basins is generally involved with a reliable parameter estimation in a rainfall-runoff model. However, the parameter estimation of the rainfall-runoff model is a complex issue due to an insufficient hydrologic data. This study aims to regionalize the parameters of a continuous rainfall-runoff model in conjunction with a Bayesian statistical technique to consider uncertainty more precisely associated with the parameters. First, this study employed Bayesian Markov Chain Monte Carlo scheme for the estimation of the Sacramento rainfall-runoff model. The Sacramento model is calibrated against observed daily runoff data, and finally, the posterior density function of the parameters is derived. Second, we applied a multiple linear regression model to the set of the parameters with watershed characteristics, to obtain a functional relationship between pairs of variables. The proposed model was also validated with gauged watersheds in accordance with the efficiency criteria such as the Nash-Sutcliffe efficiency, index of agreement and the coefficient of correlation.

Monthly Electric Load Forecasting Method Using Multiple Regression Model (다중회귀모형을 이용한 월간 전력수요 예측기법)

  • Moon, Jihoon;Kim, Yongsung;Park, Jinwoong;Hwang, Eenjun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.04a
    • /
    • pp.567-570
    • /
    • 2016
  • 전력수요 예측은 설비투자, 수급 안정, 구매전력비 등에 직결되는 중요한 요소이며 국가 경제에 미치는 영향이 크다. 특히 인구가 밀집한 대도시의 경우 정치, 교육, 문화, 경제적 활동들이 전력사용과 밀접한 연관이 있어 안정적인 전력공급을 위한 정확한 전력수요 예측이 필요하다. 최근 평균기온 및 국내총생산을 독립변수로 활용하여 다중회귀모형을 구성한 연구가 전국 단위 전력수요 예측에 유용한 결과를 보여주었다. 하지만 좀 더 작은 단위 지역의 전력수요를 예측할 때에는 지역마다 제반 여건에 따른 전력사용 용도가 다르므로, 그 지역의 전력수요와 상관관계가 높은 다른 변수들을 함께 고려해야 할 필요가 있다. 본 논문은 서울시 자치구별 월 단위 전력수요 예측을 위하여 과거 전력수요량을 독립변수, 평균기온, 지역내총생산, 자치구별 인구, 세대수, 지하철 승 하차 인원을 종속변수로 설정한 다중회귀모형을 구성하였다. 이를 기반으로 다양한 실험을 통해 자치구별 월간 전력수요 예측을 진행하였으며, 그 결과 이전보다 향상된 정확도를 얻을 수 있었다.

A Study on a Flood Frequency Analysis Guideline for Korea (국내 홍수빈도해석 지침서 수립을 위한 연구)

  • Kim, Young-Oh;Sung, Jang-Hyun;Seo, Seung-Beom;Lee, Kyoung-Teak
    • 한국방재학회:학술대회논문집
    • /
    • 2010.02a
    • /
    • pp.53.2-53.2
    • /
    • 2010
  • 국내 홍수빈도해석 지침서 제공을 위한 기초 연구로서 미국 홍수빈도해석 지침서인 Bulletin 17B과 같이 국내 적합한 홍수빈도해석 기법을 제시하고자 하였다. 홍수빈도해석 지침서의 핵심은 확률분포형과 매개변수 추정법을 제시하는 것이며 이에 GEV(Generalized Extreme Value), GLO(Generalized Logistic) 분포, B-GLS(Bayesian Generalized Least Square) 기법을 대상으로 다양한 연구를 수행하였다. B-GLS 기법을 이용하여, 국내 대유역에 골고루 위치하며 댐의 영향을 받지 않는 31개 지점의 연최대 일유량 시계열의 L-변동계수(L-moment coefficient variation)와 L-왜도계수(L-moment coefficient skewness)를 추정할 수 있는 회귀모형을 제안하였다. 위 회귀모형을 구성하기 위한 유역특성으로는 유역면적, 유역경사, 유역평균강우 등을 사용하였다. Bayesian-GLS(B-GLS) 적용 결과를 OLS(Ordinary Least Square) 및 B-GLS 기법에서 지점간의 상관관계를 고려하지 않는 Bayesian-WLS(Weighted Least Square)와 비교 평가하여 그 우수성을 입증하였다. 따라서 본 연구에서 제안된 B-GLS에 의한 지역회귀모형은 국내의 미계측유역이나 또는 관측 길이가 짧은 계측유역의 홍수빈도분석을 위해 매우 유용할 것으로 기대된다. 또한 수행된 연구의 내용을 공론화하는 노력이 계속된다면 공감대가 형성된 가이드라인을 제정되는데 일조를 하리라 확신한다.

  • PDF

Design Flood Estimation for Pyeongchang River Basin Using Fuzzy Regression Method (Fuzzy 회귀분석기법을 이용한 평창강 유역의 설계홍수량 산정)

  • Yi, Jaeeung;Kim, Seungjoo;Lee, Taegeun;Ji, Jungwon
    • Journal of Korea Water Resources Association
    • /
    • v.45 no.10
    • /
    • pp.1023-1034
    • /
    • 2012
  • Linear regression technique has been used widely in water resources field as well as various fields such as economics and statistics, and so on. Using fuzzy regression technique, it is possible to quantify uncertainty and reflect them to the regression model. In this study, fuzzy regression model is developed to compute design floods in any place in Pyeongchang River basin. In ungaged basins, it is usually difficult to obtain data required for flood discharge analysis. In this study, basin characteristics elements are analyzed spatially using GIS and the technique of estimating design flood in ungaged mountainous basin is studied based on the result. Fuzzy regression technique is applied to Pyeongchang River basin which has mountainous basin characteristics and well collected rainfall and runoff data through IHP test basin project. Fuzzy design flood estimation equations are developed using the basin characteristics elements for Pyeongchang River basin. The suitability of developed fuzzy equations are examined by comparing the results with design floods computed in 9 locations along the river. Using regional regression method and fuzzy regression analysis, the uncertainties of the design floods occurred from the data monitoring can be quantified.

Testing Non-Stationary Relationship between the Proportion of Green Areas in Watersheds and Water Quality using Geographically Weighted Regression Model (공간지리 가중회귀모형(GWR)을 이용한 유역 녹지비율과 하천수질의 비균질적 관계 검증)

  • Lee, Sang-Woo
    • Journal of the Korean Institute of Landscape Architecture
    • /
    • v.41 no.6
    • /
    • pp.43-51
    • /
    • 2013
  • This study aims to examine the presence of non-stationary relationship between water quality and land use in watersheds. In investigating the relationships between land use and water quality, most previous studies adopted OLS method which is assumed stationarity. However, this approach is difficult to capture the local variation of the relationships. We used 146 sampling data and land cover data of Korean Ministry of Environment to build conventional regressions and GWR models for BOD, TN and TP. Regression model and GWR models of BOD, TN, TP were compared with $R^2$, AICc and Moran's I. The results of comparisons and descriptive statistics of GWR models strongly indicated the presence of Non-Stationarity between water quality and land use.