• Title/Summary/Keyword: 결측

Search Result 428, Processing Time 0.031 seconds

Estimation of Andong Reservoir Long-Term Daily Inflow Using SWAT Model (SWAT 모형을 이용한 안동댐 장기 일 유입량 산정)

  • Kang, Min-Suk;Yu, Myung-Su;Yi, Jae-Eung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.868-872
    • /
    • 2012
  • 유역의 유입 및 유출은 강수에 의해 발생하며 여러 가지 기후 조건과 토지 상태의 영향을 받는다. SWAT(Soil and Water Assessment Tool) 모형은 이러한 여러 가지 복잡한 기후 조건과 토지 상태를 반영하며, 장기간 입력 자료에 따른 유출량을 산출할 수 있다. 본 연구에서는 시험유역을 안동댐 유역으로 선정하였으며, SWAT 모형을 이용하여 10년(2000년 ~ 2010년) 동안의 유출량을 산정하였고 이를 안동댐의 실측 유입량과 비교 분석하였다. ArcSWAT을 이용하여 분석하였고 입력 자료는 SWAT의 분석단위인 HRU(Hydrologic Response Unit)를 산정하기 위한 정밀 토양도 및 토지피복도와 기상입력 자료인 강우 및 최고기온, 최저기온, 습도, 풍속, 일사량 등을 사용하였다. 강우관측소는 안동댐 유역의 고선, 남회룡, 도천, 미질, 석동, 석포, 석현, 의촌, 재산, 황지를 선정하였고, 일사량관측소는 안동, 대관령, 포항을 선정하였으며, 기온, 습도, 풍속관측소는 안동, 봉화, 태백, 영주를 선정하였다. 또한 기상입력자료 중 결측값은 역거리 자승법을 이용하여 보완하였다. SWAT 모형은 유출량 계산 시 여러 가지 다양한 매개변수가 사용되며, 이러한 매개변수들의 검 보정을 통하여 실제 유역의 특성과 하천 흐름특성을 반영할 수 있다. 본 연구의 시험유역인 안동댐유역은 산림과 초지가 많은 지역이기 때문에 식물에 의해 차단되는 강우에 관한 매개변수와 지하로 침투되는 강우량에 관한 매개변수 등을 보정하여 실제 유역특성을 반영하였다. 본 연구에서는 이러한 과정을 통해 안동댐 유역의 10년 동안의 일 유출량을 산정한 결과, 홍수기의 첨두유량 및 첨두시간에는 실측자료와 약간의 차이가 있었지만 전체적으로 실측자료와 매우 유사한 유출량을 산정하였다.

  • PDF

Utilization Evaluation of Water Level Data for Agricultural Reservoir Flood Analysis (저수지 홍수분석을 위한 저수위 자료의 활용성 평가)

  • Lee, Jaenam;Shin, Hyungjin;Lee, Jaeju;Kang, Munsung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.383-383
    • /
    • 2019
  • 우리나라는 전국에 약 17,500여개의 크고 작은 농업용저수지가 있으며, 이 중 약 89%는 설치된 지 40년이 지나 노후화가 이뤄지고 있다. 최근에는 기후변화 영향으로 홍수피해가 대형화되고 있어 농촌지역의 홍수재해 발생시 저수지 하류부의 인명피해 및 농경지 침수피해는 증가될 것으로 예상된다. 한국농어촌공사는 농업용저수지의 효율적인 물관리 및 재해방지를 위해 자동수위계측기를 활용한 실시간 저수위 자료를 구축하고 있다. 기후변화에 따른 홍수피해를 신속하게 대응하기 위해서는 과거 홍수사상에 대한 저수지 모델링을 수행하고 그 결과를 농촌지역 풍수해 방지를 위한 의사결정 자료로 활용하게 된다. 기상예측정보의 활용에 앞서 농업용저수지의 홍수모의가 과거 수문사상을 현실적으로 재현하는지를 검토할 필요가 있어 본 연구에서는 저수지 홍수분석의 검정자료인 저수위 자료에 대한 활용성 평가를 수행하였다. 대상저수지는 ${{\circ}{\circ}}$농촌용수구역 내 위치한 ${{\circ}{\circ}}$저수지로 하고, 10분 단위의 저수위 자료를 활용하였다. 연도별 원시자료에 대한 결측, 불량자료, 이상치 등을 검토하고, 그 결과에 대한 유형분석을 수행하였다. 본 연구결과는 과거 홍수사상에 대한 농업용저수지 홍수모의 분석 및 검정을 통해 강우레이더 등 기상예측정보 기반의 농촌지역 홍수피해 산정결과의 신뢰도를 향상시킬 수 있을 것으로 기대한다.

  • PDF

Undecided inference using the difference of AUCs (AUC 차이를 이용한 미결정자 추론방법)

  • Hong, Chong Sun;Na, Hae Rin
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.2
    • /
    • pp.141-152
    • /
    • 2021
  • A new statistical model needs additional variables in order to re-evaluate the undecided inference. Then the MNAR assumption is required, since the probabilities for the positivity of the indeterminant and the determinant is calculated differently. In this study, since two statistical models have a hierarchical relationship, we determine the undecided inference under the MNAR assumption using the confidence interval of the difference between two AUCs. Among many methods of estimating the confidence interval of the AUC difference, it is found that four kinds of methods show excellent performance through simulations. And based on these methods, we propose a variable selection method that are useful for the undecided inference using logistic regression models.

Review for time-dependent ROC analysis under diverse survival models (생존 분석 자료에서 적용되는 시간 가변 ROC 분석에 대한 리뷰)

  • Kim, Yang-Jin
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.1
    • /
    • pp.35-47
    • /
    • 2022
  • The receiver operating characteristic (ROC) curve was developed to quantify the classification ability of marker values (covariates) on the response variable and has been extended to survival data with diverse missing data structure. When survival data is understood as binary data (status of being alive or dead) at each time point, the ROC curve expressed at every time point results in time-dependent ROC curve and time-dependent area under curve (AUC). In particular, a follow-up study brings the change of cohort and incomplete data structures such as censoring and competing risk. In this paper, we review time-dependent ROC estimators under several contexts and perform simulation to check the performance of each estimators. We analyzed a dementia dataset to compare the prognostic power of markers.

A Novel on Auto Imputation and Analysis Prediction Model of Data Missing Scope based on Machine Learning (머신러닝기반의 데이터 결측 구간의 자동 보정 및 분석 예측 모델에 대한 연구)

  • Jung, Se-Hoon;Lee, Han-Sung;Kim, Jun-Yeong;Sim, Chun-Bo
    • Journal of Korea Multimedia Society
    • /
    • v.25 no.2
    • /
    • pp.257-268
    • /
    • 2022
  • When there is a missing value in the raw data, if ignore the missing values and proceed with the analysis, the accuracy decrease due to the decrease in the number of sample. The method of imputation and analyzing patterns and significant values can compensate for the problem of lower analysis quality and analysis accuracy as a result of bias rather than simply removing missing values. In this study, we proposed to study irregular data patterns and missing processing methods of data using machine learning techniques for the study of correction of missing values. we would like to propose a plan to replace the missing with data from a similar past point in time by finding the situation at the time when the missing data occurred. Unlike previous studies, data correction techniques present new algorithms using DNN and KNN-MLE techniques. As a result of the performance evaluation, the ANAE measurement value compared to the existing missing section correction algorithm confirmed a performance improvement of about 0.041 to 0.321.

Optimal Sensor Location in Water Distribution Network using XGBoost Model (XGBoost 기반 상수도관망 센서 위치 최적화)

  • Hyewoon Jang;Donghwi Jung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.217-217
    • /
    • 2023
  • 상수도관망은 사용자에게 고품질의 물을 안정적으로 공급하는 것을 목적으로 하며, 이를 평가하기 위한 지표 중 하나로 압력을 활용한다. 최근 스마트 센서의 설치가 확장됨에 따라 기계학습기법을 이용한 실시간 데이터 기반의 분석이 활발하다. 따라서 어디에서 데이터를 수집하느냐에 대한 센서 위치 결정이 중요하다. 본 연구는 eXtreme Gradient Boosting(XGBoost) 모델을 활용하여 대규모 상수도관망 내 센서 위치를 최적화하는 방법론을 제안한다. XGBoost 모델은 여러 의사결정 나무(decision tree)를 활용하는 앙상블(ensemble) 모델이며, 오차에 따른 가중치를 부여하여 성능을 향상시키는 부스팅(boosting) 방식을 이용한다. 이는 분산 및 병렬 처리가 가능해 메모리리소스를 최적으로 사용하고, 학습 속도가 빠르며 결측치에 대한 전처리 과정을 모델 내에 포함하고 있다는 장점이 있다. 모델 구현을 위한 독립 변수 결정을 위해 압력 데이터의 변동성 및 평균압력 값을 고려하여 상수도관망을 대표하는 중요 절점(critical node)를 선정한다. 중요 절점의 압력 값을 예측하는 XGBoost 모델을 구축하고 모델의 성능과 요인 중요도(feature importance) 값을 고려하여 센서의 최적 위치를 선정한다. 이러한 방법론을 기반으로 상수도관망의 특성에 따른 경향성을 파악하기 위해 다양한 형태(예를 들어, 망형, 가지형)와 구성 절점의 수를 변화시키며 결과를 분석한다. 본 연구에서 구축한 XGBoost 모델은 추가적인 전처리 과정을 최소화하며 대규모 관망에 간편하게 사용할 수 있어 추후 다양한 입출력 데이터의 조합을 통해 센서 위치 외에도 상수도관망에서의 성능 최적화에 활용할 수 있을 것으로 기대한다.

  • PDF

Estimation of regional Low-flow Indices Applicable to Unmetered Areas Using Machine Learning Technique (머신러닝 기법을 이용한 미계측지역에 적용가능한 지역화 Low-flow indices 산정)

  • Jeung, Se Jin;Kang, Dong Ho;Kim, Byung Sik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.39-39
    • /
    • 2020
  • Low-flow 하천에서의 최저수위를 나타내는 지표이다. 일반적으로 유황곡선의 갈수량(Q355)를 대표적으로 사용한다. Low-flow는 물 공급 관리 및 계획, 관개용수, 생태계등 다양한 분야에 영향을 미친다. 이러한 Low-flow를 산정하기 위해서는 충분한 기간의 유량자료가 필요하다. 하지만 국토의 70%가 산지지형으로 구성되어 있는 우리나라의 경우 국가하천과 1급하천을 제외한 산지유역은 수위관측소가 부재하거나 결측으로 인해 자료가 충분하지 않아 Low-flow분석에 한계가 있다. 이에 과거에는 미계측지역의 갈수량을 예측하기 위해서 다중회귀분석, ARIMA 모형 등 다양한 기법을 사용하였지만, 최근들어 머신러닝 모형의 수요가 증가하고 있다. 이에 본 연구에서는 새로운 패러다임에 맞는 머신러닝 기법인 DNN기법을 사용하고자 한다. DNN기법은 ANN기법의 단점인 학습과정에서 최적 매개변수값을 찾기 어렵고, 학습시간이 느린 단점을 보완한 방법이다. 따라서 본연구에서는 머신러닝 기법인 DNN기법을 통해 미계측지역에 적용 가능한 지역화 Low-flow indices를 산정하고자 한다. 먼저, Low-flow에 영향을 미치는 인자들을 수집하고 인자들간의 상관분석, 다중공선성 분석을 통해 통계적으로 유의한 변수를 선정하여, 머신러닝 모형에 입력자료를 구축하였다. 또한 기존의 갈수량 예측기법인 다중회귀분석 결과와 비교하여 머신러닝 기법의 효용성을 검토하였다.

  • PDF

Analysis of Water Quality Fluctuations in Upstream Namhan (or South Han) River Watershed using Long-term Statistical Analysis (통계적 경향 분석을 통한 남한강 상류 수계 수질 변동 해석)

  • Byeon, Sangdon;Noh, Yeonjung;Lim, Kyeongjae;Kim, Jonggun;Hong, Eunmi
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.141-141
    • /
    • 2020
  • 강원도는 산림 비중이 크고 급경사지가 많은 지형적 특성과 여름철 비교적 선선하고 강우량이 많은 기후적 특성 때문에 고랭지 농업이 활발히 이루어지고 있다. 하지만, 많은 부분을 차지하는 고랭지밭 면적 탓에 강우시에 토양침식과 비점오염물이 하천으로 유입되고 있다. 강원도 송천 상류에 위치한 도암호는 장기간 탁수를 저류하고 방류로 인한 해체 논란까지 일으키기도 했다. 이에 정부는 흙탕물 저감과 비점오염원 관리를 위한 국고보조사업과 다양한 환경 정책들을 시행중이다. 효율적이고 효과적인 수질 정책을 시행하고 분석하기 위해서는 장기간의 모니터링 자료를 이용한 통계적 분석을 활용하는 것이 중요하다. 수질 자료는 변동이 심하고, 비정규분포를 이루며 결측치와 검출한계 이하의 값들이 많아 비모수 통계 방법을 널리 사용되어 왔다. 그중에서도 계절적 특성을 갖는 수질자료의 장기경향분석에 적합한 Seasonal Mann-Kendall Test을 사용하여 남한강상류 유역의 수질 경향성을 분석하였으며, Sen's Slope를 구하여 수질 자료의 경향 크기를 구하였다. 하지만, Seasonal Mann-Kendall Test는 연구 기간동안의 경향성을 반영할 수 없다는 단점이 있기 때문에 LOWESS Test를 통해 장기간 수질 자료 사이의 경향성을 분석하였다. 이러한 수질자료의 경향 분석 결과는 유역 내 취약 지점을 확인할 수 있으며, 환경 정책의 효과를 평가하고 보완할 수 있는 자료로 이용될 수 있을 것이다.

  • PDF

A Study on Estimation of Lowflow Ungauged Basin Using Multiple Regression Analysis (다중회귀분석을 이용한 미계측 유역의 갈수유량 산정에 관한 연구)

  • Lim, Ga Kyun;Jeung, Se Jin;Kim, Byung Sik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.133-133
    • /
    • 2020
  • 갈수량이란 1년 중 355일은 유지되는 유량을 말하며 물 공급 계획 및 관리, 저수지 설계, 관개용수의 수량과 수질 관리, 생태계 보존 등에 있어서 갈수량의 크기와 빈도를 파악하는 것은 매우 중요한 과정이다. 갈수량 산정을 위해서는 오랜 기간의 관측 일유량 자료가 필요하지만 우리나라의 경우 관측 유량 자료의 결측자료가 많아 갈수량 산정에 필요한 장기간의 자료가 부족하다. 따라서 본 연구에서는 전국 40개 중권역 유역을 대상으로 갈수 빈도별 갈수량 산정 회귀식 개발을 수행하였다. 갈수량 산정에 적용할 수 있는 18개의 유역인자와 4개의 수문 인자를 상관분석을 통해 다중공선성을 고려하였으며 상관분석 결과를 토대로 미계측 유역에 적용 가능한 인자를 선정하였다. 갈수 빈도 분석과 단계적 회귀분석을 통하여 미계측 유역에 적용할 수 있는 갈수 빈도별 갈수량 산정 회귀식을 개발하였다. 또한 계측 유역을 미계측 유역으로 가정하여 개발된 갈수량 산정 회귀식을 이용하여 갈수량을 산정하고 분석 결과와 실제 갈수량을 비교하여 개발된 회귀식의 적정성을 검토하였다.

  • PDF

Prediction of the daily-flow duration curve and streamflow using the regional flow duration curve creation technique (지역화 유황곡선을 작성기법을 이용한 유역의 일유황곡선 및 유량 예측)

  • Choo, Kyung Su;Jeung, Se Jin;Kim, Byung Sik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.132-132
    • /
    • 2020
  • 유황곡선은 하천유량의 변동성을 함축적으로 나타내고 연간유량 분석방법(calendar-year method)과 전 자료기간유량분석방법(total-period method)을 이용하여 작성하고 분석할 수 있다. 본 연구는 유황곡선 상에서 유역특성인자들을 포함시켜 작성하는 방법을 제시하였고 지형 및 기상학적 인자를 통해 지역화 시킨 유황곡선을 통해 미계측 유역의 유황곡선을 추정할 수 있는 곡선을 개발하고자 한다. 이를 위해 유역의 특성인자자료를 수집하여 독립변수로 설정하였고 다중회귀분석을 실시하여 변수들을 지역화 시켰다. 지역화 시킨 변수들을 유황곡선에 반영하여 대상지역에서 하나의 유황곡선으로 나타내었다. 도출한 유황곡선을 자료가 있는 지역을 미계측유역이라 가정하고 검증하였다. 검증결과 실제자료와 유사하게 나타나는 것을 확인할 수 있었고 이를 통해 미계측 유역의 유출량 자료가 부족한 유역에 대한 예측과 과거 많은 부분이 결측된 유역에 대한 유출량 예측도 가능할 것이라 판단된다. 또한 강우시나리오를 통해 지형인자가 고려된 유황곡선을 이용한 다양한 자료분석을 실시할 수 있을 것이라 판단된다.

  • PDF