• Title/Summary/Keyword: 결측

Search Result 430, Processing Time 0.03 seconds

Bias-correction of near-real-time multi-satellite precipitation products using machine learning (머신러닝 기반 준실시간 다중 위성 강수 자료 보정)

  • Sungho Jung;Xuan-Hien Le;Van-Giang Nguyen;Giha Lee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.280-280
    • /
    • 2023
  • 강수의 정확한 시·공간적 추정은 홍수 대응, 가뭄 관리, 수자원 계획 등 수문학적 모델링의 핵심 기술이다. 우주 기술의 발전으로 전지구 강수량 측정 프로젝트(Global Precipitation Measurement, GPM)가 시작됨에 따라 위성의 여러 센서를 이용하여 다양한 고해상도 강수량 자료가 생산되고 있으며, 기후변화로 인한 수재해의 빈도가 증가함에 따라 준실시간(Near-Real-Time) 위성 강수 자료의 활용성 및 중요성이 높아지고 있다. 하지만 준실시간 위성 강수 자료의 경우 빠른 지연시간(latency) 확보를 위해 관측 이후 최소한의 보정을 거쳐 제공되므로 상대적으로 강수 추정치의 불확실성이 높다. 이에 따라 본 연구에서는 앙상블 머신러닝 기반 수집된 위성 강수 자료들을 관측 자료와 병합하여 보정된 준실시간 강수량 자료를 생성하고자 한다. 모형의 입력에는 시단위 3가지 준실시간 위성 강수 자료(GSMaP_NRT, IMERG_Early, PERSIANN_CCS)와 방재기상관측 (AWS)의 온도, 습도, 강수량 지점 자료를 활용하였다. 지점 강수 자료의 경우 결측치를 고려하여 475개 관측소를 선정하였으며, 공간성을 고려한 랜덤 샘플링으로 375개소(약 80%)는 훈련 자료, 나머지 100개소(약 20%)는 검증 자료로 분리하였다. 모형의 정량적 평가 지표로는 KGE, MAE, RMSE이 사용되었으며, 정성적 평가 지표로 강수 분할표에 따라 POD, SR, BS 그리고 CSI를 사용하였다. 머신러닝 모형은 개별 원시 위성 강수 자료 및 IDW 기법보다 높은 정확도로 강수량을 추정하였으며 공간적으로 안정적인 결과를 나타내었다. 다만, 최대 강수량에서는 다소 과소추정되므로 이는 강수와 관련된 입력 변수의 개수 업데이트로 해결할 수 있을 것으로 판단된다. 따라서 불확실성이 높은 개별 준실시간 위성 자료들을 관측 자료와 병합하여 보정된 최적 강수 자료를 생성하는 머신러닝 기법은 돌발성 수재해에 실시간으로 대응 가능하며 홍수 예보에 신뢰도 높은 정량적인 강수량 추정치를 제공할 수 있다.

  • PDF

Imputation of missing precipitation data using machine learning algorithms (머신러닝 알고리즘을 이용한 결측 강우 데이터 추정에 관한 연구)

  • Heechan Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.320-320
    • /
    • 2023
  • 강우 데이터는 수문기상, 환경, 농업, 자연재해, 그리고 수자원 시스템 분야에서 가장 필수적인 기본 요소 중 하나이다. 또한 강우 데이터는 수문학적 분석에서 활용되는 필수 입력 자료 중 하나로 관측 데이터의 품질에 따라 수문 모형을 이용한 모의 결과물의 정확도가 결정된다고 할 수 있다. 따라서, 강우 관측소별로 강우 데이터의 품질을 어떻게 관리하느냐에 따라 수문 모형의 활용 범위 및 수자원 관리의 효율성이 결정될 수 있다. 강우의 시공간적 변동성은 수 많은 인자들과 직간접적으로 연계되어 있기 때문에 미계측 강우 자료에 대해 직접 관측이 아닌 수치 모형을 이용하여 강우의 발생과 강우량을 산정하는 것은 매우 복잡한 과제 중 하나이다. 현재 국내에서 운용되고 있는 강우 관측소의 경우에도 미계측 된 강우 데이터가 존재함으로써 강우 데이터의 활용에 제한이 생기는 경우가 있다. 따라서, 이러한 미계측 데이터의 추정 및 보완은 보다 효과적인 수재해 방지, 수자원 관리를 위한 필수 과제 중 하나이다. 일반적으로, 미계측 강우를 산정하기 위해서 Kriging, Thiessen, 등우선법, 그리고 역거리 관측법 등 다양한 수문학적 방법들이 적용되고 있다. 이러한 방법들은 산악효과나 강우 관측소의 분포 상태 등을 고려하지 못하기 때문에 측정하는 지역에 따라 강우 추정 오차가 커질 수 있다는 한계가 있다. 최근에는 데이터 관측 시스템과 빅데이터 기술의 발전과 활용 가능한 데이터의 양이 증가함에 따라 머신러닝을 활용한 사례가 증가하고 있다. 머신러닝은 데이터 사이의 관계를 기반으로 분류, 회귀, 그리고 예측 문제에 주로 사용되는 기법 중 하나이다. 따라서, 본 연구에서는 광주광역시 지역에 위치한 주요 강우 관측 지점들을 대상으로 미계측 된 시강우 데이터를 추정 및 복원하고자 한다. 여기서 데이터 추정 기술이란 미계측 강우의 발생 유무 및 강우량을 추정할 수 있는 기술을 의미한다. 이를 위해 대표적인 머신러닝 알고리즘인 인공신경망(Artificial Neural Network) 및 랜덤포레스트(Random Forest)를 적용하였다.

  • PDF

Analysis of the Hydrological Components of the Seolmacheon Catchment for the Year 2021 (2021년 설마천 유역의 수문성분 분석)

  • Kim, Dong Phil
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.409-409
    • /
    • 2022
  • 환경부 홍수통제소의 경우는 전국단위의 강수량(지상, 레이더), 하천수위, 유사량 관측과 국부적으로 증발산량과 토양수분 관측이 이루어지고 있는 상황이며, 기상청 및 다른 공공기관도 각 목적에 맞게 수문기상관측이 이루어지나 유역(또는 지역) 단위의 물순환 과정(강우량, 유출량, 증발산량, 지하수함양량, 토양수분량 등 포함)을 규명하는 조사·연구는 매우 미비한 실정이다. 개별적인 물순환 성분별 수문조사에서 벗어난 전체적인 관점을 고려한 유역단위의 물순환 과정을 규명하는 것은 매우 중요하다. 즉 물순환 성분별 명확한 수문량 산정 결과는 수자원 개발과 물환경 보전에 중요한 정보를 제공할 수 있다. 따라서 물순환 성분별 명확한 분석을 위해서는 중·소규모 유역 단위를 대상으로 지속적이고 신뢰성 있는 자료의 획득과 축적이 중요하므로 중·소규모 유역 단위의 대표성 있는 시험유역의 운영은 매우 의미가 있다고 볼 수 있다. 본 논문에서는 한국건설기술연구원에서 운영하는 설마천 유역(전적비교 수위관측소 기준, 유역 면적 8.48km2, 유로연장 5.59km, 유로경사 2.15%, 경기도 파주시 적성면 소재)의 2021년 수문관측자료를 이용하여 지표수 물순환 성분인 강우량, 하천유출량, 증발산량을 산정하였다. 기본 관측자료인 강우량은 각 지점강우량의 관측자료의 비교·검토 등 품질관리를 통해 자료를 확정하고 유역평균강우량을 산정하였다. 하천수위는 기준수위표와의 검토를 통해 자료를 확정하였으며, 하천유출량은 기존의 유량측정성과와 단면검토를 통해 수위-유량관계곡선식을 개발하고, 확정된 수위자료를 적용하여 산정하였다. 그리고 증발산량은 유역인근 2개 관측소(동두천 파주)의 기상관측자료를 이용하여 잠재증발산량을 산정하여 추정한 값이며, 그 외 지하수 함양량은 관측 지하수위자료의 결측으로 산정에서 제외하였다. 각 물순환 성분별로 생성된 2021년의 설마천 유역(전적비교 수위관측소 기준)의 총강우량은 1,103.6mm이며, 하천유출량은 620.1mm(총강우량 대비 56.2%), 실제증발산량(잠재증발산량 추정값)은 443.0mm(40.1%)이며, 그 외는 유역 손실량이다. 이와 같이 산정된 물순환 성분별 자료는 유역의 물순환 과정 규명을 위한 기초자료로 매우 유용하게 활용될 수 있으며, 유역 물관리를 위한 의사결정 과정에 중요한 역할을 할 수 있을 것으로 기대된다.

  • PDF

Comparison of Feature Selection Methods Applied on Risk Prediction for Hypertension (고혈압 위험 예측에 적용된 특징 선택 방법의 비교)

  • Khongorzul, Dashdondov;Kim, Mi-Hye
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.11 no.3
    • /
    • pp.107-114
    • /
    • 2022
  • In this paper, we have enhanced the risk prediction of hypertension using the feature selection method in the Korean National Health and Nutrition Examination Survey (KNHANES) database of the Korea Centers for Disease Control and Prevention. The study identified various risk factors correlated with chronic hypertension. The paper is divided into three parts. Initially, the data preprocessing step of removes missing values, and performed z-transformation. The following is the feature selection (FS) step that used a factor analysis (FA) based on the feature selection method in the dataset, and feature importance (FI) and multicollinearity analysis (MC) were compared based on FS. Finally, in the predictive analysis stage, it was applied to detect and predict the risk of hypertension. In this study, we compare the accuracy, f-score, area under the ROC curve (AUC), and mean standard error (MSE) for each model of classification. As a result of the test, the proposed MC-FA-RF model achieved the highest accuracy of 80.12%, MSE of 0.106, f-score of 83.49%, and AUC of 85.96%, respectively. These results demonstrate that the proposed MC-FA-RF method for hypertension risk predictions is outperformed other methods.

Physical and Psychological Factors Affecting Fall in Elderly Patients with Parkinson's disease (파킨슨병 노인의 낙상에 영향을 미치는 신체적, 심리적 요인)

  • Kim, Ji-Yoen;Byun, Mi-Kyong
    • Journal of Convergence for Information Technology
    • /
    • v.12 no.3
    • /
    • pp.55-65
    • /
    • 2022
  • Elderly people with Parkinson's disease have higher rates of physical and mental risk factors for falls than non-Parkinson's disease elderly. The purpose of this study is to investigate this by using national data that includes the entire population of the elderly in Korea. As a secondary analysis study using data survey on the elderly by the Ministry of Health and Welfare in 2017, there were a total of 103 elderly people with Parkinson's disease, and a total of 96 subjects were analyzed excluding missing values. In the elderly with Parkinson's disease, the factor most influencing the fall was IADL, and IADL is related to motor control function. Decreased motor control limits physical movements essential for daily life, and even affects self-protective behavior in emergency situations, affecting falls. Based on the research results that IADL can affect falls, various exercise therapies for fall prevention interventions in the elderly with Parkinson's disease can be suggested.

Trend Analysis and Probable Change Point Analysis of Streamflow in Seomjin River Basin, South Korea (비모수 검정 방법을 통한 섬진강 유역 유량의 추세 분석 및 변동점 탐색)

  • Son, Yeon Jin;Kam, Jong Hun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.398-398
    • /
    • 2021
  • 섬진강은 한국 주요 5대강 중 하나로 유량 변동계수가 가장 크다. 이로 인해, 극심한 가뭄이나 홍수의 발생 확률이 높을 뿐만 아니라, 가뭄에서 홍수 또는 홍수에서 가뭄으로 갑작스러운 극한 수문 기상 변화가 일어날 수 있다. 수자원의 안정적인 확보와 수재해로 인한 피해를 최소화하기 위한 수자원 관리와 장기적 수문분석이 필요하다. 이에 본 연구에서는 섬진강 유역의 수문 관측소(56개)에서 10년 이상 장기 관측된 일유량 자료(1997년~2020년)를 이용하여 비모수 검정 방법을 통한 추세 분석과 변동점을 탐색하였다. 우선, 일유량 관측 자료를 이용하여 누락된 일유량 관측값으로 생겨날 수 있는 불확실성을 배제하기 위해 관측 기간 중 누락된 일유량 관측값들의 월별 비율을 조사하였다. 그리고 월별 일유량 관측값 누락이 없는 관측소들의 월평균 하천 유량 값으로 연평균 하천 유량 값을 계산하였다. 관측 기간 동안 결측된 값이 없는 28개의 관측소를 대상으로 비모수 검정 방법을 통한 연별 추세 분석(Mann-Kendall Test)과 변동점 탐색(Pettitt Test)을 하였다. 연별 추세 분석 경우 28개의 관측소 중 8개의 관측소에서 통계적으로 의미 있는 추세(신뢰도> 99%)가 탐지되었다. 이들 중 3개의 관측소에서는 증가하는 추세를 보였고 5개의 관측소에서 감소하는 추세가 보였다. 7개의 관측소에서는 통계적으로 의미가 있는 변동점도 탐색되었고 그 변동점이 탐색된 연도는 2011년(4개), 2012년(3개)로 나타났다. 계절적 추세 분석에서는 28개의 관측소 중 각각 봄(MAM) 11개, 여름(JJA) 11개, 가을(SON) 9개, 겨울(DJF) 11개 관측소에서 통계적 추세(신뢰도> 99%)가 탐지되었다. 또한 봄 17개, 여름 7개, 가을 18개, 겨울 18개 관측소에서 변동점이 탐색되었고, 그 연도는 관측소마다 달랐다. 이러한 유량의 추세와 변동점의 원인(기후적/인위적 요소)을 더욱 잘 이해하기 위해, 계절별 유량과 강수량의 상관관계 분석이 연구될 필요가 있다. 이러한 장기 수문기후학적 추세와 변동성에 대한 이해는 농업이 중요한 섬진강 유역의 수자원 관리와 기후변화에 선제대응 할 수 있는 기초를 마련할 것이다.

  • PDF

Analysis on uncertainty in Probable Maximum Precipitation estimation with the pseudo-adiabatic assumption (위단열 가정을 기반한 가능최대강수량 산정의 불확실성 분석)

  • Kim, Youngkyu;Son, Minwoo;Kim, Sunmin;Tachikawa, Yasuto
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.58-58
    • /
    • 2022
  • 본 연구는 수분최대화방법(Moisture-maximizing method)를 기반으로 PMP(Probable Maximum Precipitation)을 산정하는 방법론을 평가하는 것을 목적으로 수행되었다. 수분최대화 방법은 특정 호우사상의 대기 수분 조건을 극대화하여 PMP 를 산정한다. 여기서, 대기 수분 조건은 대기 표면부터 상층부의 총 수분량으로부터 얻어지는 가강수량(Precipitable water, PW)으로 표현된다. PW 는 라디오존데로부터 직접 관측 및 수집되지만, 장기간 수집이 어렵고, 수집된 자료는 다수의 이상치 및 결측치를 포함한다. 이에 따라, WMO(World Meteorological Organization)에서는 표면 이슬점을 이용하여 위단열 가정(Pseudo-adiabatic assumption)하에PW 를 간접적으로 산정하는 방법론을 기반한 PMP 산정을 권고한다. 본 연구는 일본의 다수의 지역을 대상으로 실제 PW 를 이용하는 방법과 표면 이슬점을 이용하는 방법을 기반으로 산정된 수분최대화방법의 변수들의 편차를 분석하였다. 그 결과, 따듯한 기후 특성을 나타내는 일본의 남부지역은 두 방법의 편차가 매우 작았지만, 추운 기후 특성을 나타내는 일본의 북부지역은 표면 이슬점으로 산정된 PW 가 실제 PW 에 비해 과소 산정되어 PMP 를 과대 산정시켰다. 특히, 이불확실성은 호우 발생 시 표면 이슬점이 18℃ 이하일 때, 두드러지게 나타났다. 본 연구는 이불확실성을 밝히기 위해 실제 라디오존데로부터 관측된 대기 상층부의 대기 프로파일 검토하였다. 그 결과, 표면에서 가까운 대기 상층부의 위치에서 불규칙적으로 이슬점이 증가하는 패턴을 나타냈지만, 위단열 가정은 이를 묘사하기 어려웠다. 이는 결국 실제 PW 에 비해 이슬점을 이용하여 산정된 PW 가 과소 산정되는 결과로 이어졌다. 결과적으로, 호우 발생 시 표면 이슬점이 18℃ 이하로 낮은 지역에서 산정된 PW 를 적용하는 수분최대화방법으로 산정된 PMP 는 낮은 신뢰도를 나타낸다.

  • PDF

The Effects of Venture Business Finance Supporting Programs on Efficiency and Productivity of Venture Firms Using Data Envelope Analysis (자료포락선분석을 활용한 벤처기업 자금지원정책의 기업 효율성 및 생산성 효과 분석)

  • Kim, Hong Kee;Yoo, Jin Man;Oh, Keun Yeob
    • Korean small business review
    • /
    • v.38 no.3
    • /
    • pp.165-184
    • /
    • 2016
  • This paper aims at analysing the effects of venture business finance supporting programs on efficiency and productivity of the venture firms, on the basis of the data envelope analysis (DEA) using data of 406 firms in the 2013 Venture Business Detailed Survey of Small and Medium Business Administration. The conclusions are summarized as follows. First of all, the efficiency of government finance supported venture firms is higher than that other venture firms. The increase of productivity in venture firms enjoying government supporting programs is higher than that in venture business without government supporting programs, especially in the technical progress rather than in efficiency improvement. Also the R&D supporting programs for venture firms lead to an increase in productivity. Taking the above results into consideration, government's venture supporting programs are evaluated to be effective in terms of an increase of productivity and the proper scope for fragile venture firms.

A study to improve the accuracy of the naive propensity score adjusted estimator using double post-stratification method (나이브 성향점수보정 추정량의 정확성 향상을 위한 이중 사후층화 방법 연구)

  • Leesu Yeo;Key-Il Shin
    • The Korean Journal of Applied Statistics
    • /
    • v.36 no.6
    • /
    • pp.547-559
    • /
    • 2023
  • Proper handling of nonresponse in sample survey improves the accuracy of the parameter estimation. Various studies have been conducted to properly handle MAR (missing at random) nonresponse or MCAR (missing completely at random) nonresponse. When nonresponse occurs, the PSA (propensity score adjusted) estimator is commonly used as a mean estimator. The PSA estimator is known to be unbiased when known sample weights and properly estimated response probabilities are used. However, for MNAR (missing not at random) nonresponse, which is affected by the value of the study variable, since it is very difficult to obtain accurate response probabilities, bias may occur in the PSA estimator. Chung and Shin (2017, 2022) proposed a post-stratification method to improve the accuracy of mean estimation when MNAR nonresponse occurs under a non-informative sample design. In this study, we propose a double post-stratification method to improve the accuracy of the naive PSA estimator for MNAR nonresponse under an informative sample design. In addition, we perform simulation studies to confirm the superiority of the proposed method.

The Influences of Driving Confidence Levels on Traffic Accidents: Research Using Path Analysis (운전확신수준이 교통사고에 미치는 영향: 경로분석을 이용한 연구)

  • Soon Chul Lee;Soon Yeol Lee ;Sun Jin Park
    • Korean Journal of Culture and Social Issue
    • /
    • v.13 no.4
    • /
    • pp.101-112
    • /
    • 2007
  • We investigated the influences of 'Circumstance Insensibility', 'Unsafe Driving', 'Incautious Driving', and 'Self-efficacy of Driving', consisting of driving confidence level, on traffic accidents. 1055 drivers conducted Driving Confidence Level Questionnaire, items about their dangerous driving experience and traffic accidents. Among them, after checking the missing items, we analyzed data of 998 drivers. As a result, we found the relation between driving confidence levels and traffic accidents. Specially, 'Circumstance Insensibility' and 'Unsafe Driving' influenced traffic accidents. However 'Circumstance Insensibility' had negative effects, the other side 'Unsafe Driving' had positive effects on traffic accidents. This result means each factor of driving confidence levels have different relation with traffic accidents. 'Incautious Driving' and 'Self-efficacy of Driving' didn't have any effects on traffic accidents in this research. In future, it should be investigated 'Incautious Driving' and 'Self-efficacy of Driving'.

  • PDF