• Title/Summary/Keyword: 결측자료 보완

Search Result 55, Processing Time 0.027 seconds

An Empirical Comparison of Bagging, Boosting and Support Vector Machine Classifiers in Data Mining (데이터 마이닝에서 배깅, 부스팅, SVM 분류 알고리즘 비교 분석)

  • Lee Yung-Seop;Oh Hyun-Joung;Kim Mee-Kyung
    • The Korean Journal of Applied Statistics
    • /
    • v.18 no.2
    • /
    • pp.343-354
    • /
    • 2005
  • The goal of this paper is to compare classification performances and to find a better classifier based on the characteristics of data. The compared methods are CART with two ensemble algorithms, bagging or boosting and SVM. In the empirical study of twenty-eight data sets, we found that SVM has smaller error rate than the other methods in most of data sets. When comparing bagging, boosting and SVM based on the characteristics of data, SVM algorithm is suitable to the data with small numbers of observation and no missing values. On the other hand, boosting algorithm is suitable to the data with number of observation and bagging algorithm is suitable to the data with missing values.

Conversion of Flood Level and Flood Frequency Analysis for Goan Station in Han River (한강 고안지점의 홍수위 환산과 홍수 빈도해석)

  • 이승재;서규우
    • Water for future
    • /
    • v.28 no.5
    • /
    • pp.191-203
    • /
    • 1995
  • In this study, the past flood levels of Goan station, which is one of major gaging stations and located at downstream of Paldang dam, were converted based on the 1994's cross section and the flood quantiles were estimated from flood frequency analysis. The recently established rating curve was used to convert flood levels. And the parameters of the several probability distributions commonly used in hydrologic analysis were estimated based on the method of probability weighted moments and the goodness of fit tests were applied to those distributions. As a result, the gamma-2 and gamma-3 distributions were selected as the appropriate models. The flood lovels and quantiles for selected return periods were calculated based on those distributions. Furthermore, frequency analysis using historical flood information was performed to overcome the misleading caused by missing data.

  • PDF

Estimation of regional Low-flow Indices Applicable to Unmetered Areas Using Machine Learning Technique (머신러닝 기법을 이용한 미계측지역에 적용가능한 지역화 Low-flow indices 산정)

  • Jeung, Se Jin;Kang, Dong Ho;Kim, Byung Sik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.39-39
    • /
    • 2020
  • Low-flow 하천에서의 최저수위를 나타내는 지표이다. 일반적으로 유황곡선의 갈수량(Q355)를 대표적으로 사용한다. Low-flow는 물 공급 관리 및 계획, 관개용수, 생태계등 다양한 분야에 영향을 미친다. 이러한 Low-flow를 산정하기 위해서는 충분한 기간의 유량자료가 필요하다. 하지만 국토의 70%가 산지지형으로 구성되어 있는 우리나라의 경우 국가하천과 1급하천을 제외한 산지유역은 수위관측소가 부재하거나 결측으로 인해 자료가 충분하지 않아 Low-flow분석에 한계가 있다. 이에 과거에는 미계측지역의 갈수량을 예측하기 위해서 다중회귀분석, ARIMA 모형 등 다양한 기법을 사용하였지만, 최근들어 머신러닝 모형의 수요가 증가하고 있다. 이에 본 연구에서는 새로운 패러다임에 맞는 머신러닝 기법인 DNN기법을 사용하고자 한다. DNN기법은 ANN기법의 단점인 학습과정에서 최적 매개변수값을 찾기 어렵고, 학습시간이 느린 단점을 보완한 방법이다. 따라서 본연구에서는 머신러닝 기법인 DNN기법을 통해 미계측지역에 적용 가능한 지역화 Low-flow indices를 산정하고자 한다. 먼저, Low-flow에 영향을 미치는 인자들을 수집하고 인자들간의 상관분석, 다중공선성 분석을 통해 통계적으로 유의한 변수를 선정하여, 머신러닝 모형에 입력자료를 구축하였다. 또한 기존의 갈수량 예측기법인 다중회귀분석 결과와 비교하여 머신러닝 기법의 효용성을 검토하였다.

  • PDF

Estimation of radial spectrum for rainfall (호우의 환상스펙트럼 추정)

  • Lee, Jae-Hyeong;Lee, Dong-Ju;Park, Yeong-Gi
    • Water for future
    • /
    • v.22 no.2
    • /
    • pp.201-211
    • /
    • 1989
  • Using the storm data which was augmented by the stochastic correlation with it's neighbors, the multiquadric equation of random surface of total storm depth is constructed. And to separate the local components from it's regionals and find the regional characteristics, a double Fourier analysis was applied to the total depths of storm data. The local components, storm residuals of each storm was assumed to be homogeneous random field and investigated with it's autocorrelation function. For the practical application, isotropic was assumed and that was identified with emprical data. Coefficients of normalized autocorrelation for all storms showed similar apperance. Using this emprical result, an example of the radial spectral distribution function which represints the spatial characteristics of rainfall over Han River Basin during 1975-1983 is presented.

  • PDF

A Comparison of the Methods for Estimating the Missing Precipitation Values Ungauged (미계측 결측 강수자료 보완 방법의 비교)

  • Yoo, Ju-Hwan;Choi, Yong-Joon;Jung, Kwan-Sue
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.1427-1430
    • /
    • 2009
  • The amount and the continuity of the precipitation data used in a hydrological analysis may exert a big influence on the reliability of the analysis. It is a fundamental process to estimate the missing data caused by such as a breakdown of the rainfall recording machine or to expand a short period of rainfall data. In this study the eight methods widely used as methods for estimating are compared. The data used in this research is the annual precipitation amount during 17 years at the Cheolwon station including an ungauged period of 15 years and its five surrounding stations. By use of this certified method the ungauged precipitation values at the Cheolweon station is estimated and the areal average of annual precipitation for 32 years at the Han River basin is calculated.

  • PDF

A Case Study of Land-cover Classification Based on Multi-resolution Data Fusion of MODIS and Landsat Satellite Images (MODIS 및 Landsat 위성영상의 다중 해상도 자료 융합 기반 토지 피복 분류의 사례 연구)

  • Kim, Yeseul
    • Korean Journal of Remote Sensing
    • /
    • v.38 no.6_1
    • /
    • pp.1035-1046
    • /
    • 2022
  • This study evaluated the applicability of multi-resolution data fusion for land-cover classification. In the applicability evaluation, a spatial time-series geostatistical deconvolution/fusion model (STGDFM) was applied as a multi-resolution data fusion model. The study area was selected as some agricultural lands in Iowa State, United States. As input data for multi-resolution data fusion, Moderate Resolution Imaging Spectroradiometer (MODIS) and Landsat satellite images were used considering the landscape of study area. Based on this, synthetic Landsat images were generated at the missing date of Landsat images by applying STGDFM. Then, land-cover classification was performed using both the acquired Landsat images and the STGDFM fusion results as input data. In particular, to evaluate the applicability of multi-resolution data fusion, two classification results using only Landsat images and using both Landsat images and fusion results were compared and evaluated. As a result, in the classification result using only Landsat images, the mixed patterns were prominent in the corn and soybean cultivation areas, which are the main land-cover type in study area. In addition, the mixed patterns between land-cover types of vegetation such as hay and grain areas and grass areas were presented to be large. On the other hand, in the classification result using both Landsat images and fusion results, these mixed patterns between land-cover types of vegetation as well as corn and soybean were greatly alleviated. Due to this, the classification accuracy was improved by about 20%p in the classification result using both Landsat images and fusion results. It was considered that the missing of the Landsat images could be compensated for by reflecting the time-series spectral information of the MODIS images in the fusion results through STGDFM. This study confirmed that multi-resolution data fusion can be effectively applied to land-cover classification.

A Study on the Operation of the Seolma-Cheon Experimental Catchment (2005년 설마천 시험유역의 운영)

  • Kim, Dong-Phil;Jung, Sung-Won;Kim, Sung-Hoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.683-687
    • /
    • 2006
  • 본 연구의 목적은 경기도 파주시 적성면 설마리에 위치한 설마천 시험유역을 대상으로 신뢰성 있는 수문자료를 지속적으로 수집하여 정확한 물순환 과정을 파악하는데 있다. 따라서 강우량, 수위, 유속, 유량, 수질, 부유사량, 기상 등의 기본적인 수문관측 자료를 축적하는 것이 일차적인 목적이고 최종적으로 수집된 자료를 이용하여 산지 소하천 유역의 수문특성을 규명하는데 있다. 2005년 설마천 시험유역 수문관측은 더욱 향상된 결과를 보였다. 노후화된 관측기기의 교체 및 추가 설치, 실시간 전송장비의 보완 및 운영, 각 관측소당 2기 이상의 동시 관측자료 확보 등을 통해 자료의 결측을 최소화하였고, 정확도를 개선하여 양질의 자료를 생성할 수 있었다. 관측된 우량과 수위 자료에 대해 일상적인 자료 검토 및 처리 과정을 보다 구체적으로 체계화하여 자료의 질이 향상될 수 있도록 하였다. 특히 유량측정 및 산정 방법을 국제 기준에 준하여 수행하고, 현장에서 실시간으로 측정 자료의 분석 및 검증이 가능한 유량측정용 PDA 시스템을 사용함으로써 보다 정도 높은 유량측정성과를 확보할 수 있었다. 이렇게 다각적인 방법으로 안정적인 관측 자료를 확보한 결과, 동절기를 제외한다면 전적비교와 사방교 지점에서 무결측의 유역평균우량과 유량자료를 구축할 수 있었다. 그리고, 본 연구에서는 실시간 전송장비와 설마천 시험유역 홈페이지(http://kict.datapcs.co.kr)를 통해 실시간으로 우량과 수위 자료를 인터넷과 PCS로 확인할 수 있도록 시스템을 운영하였으며, 이로 인해 언제 어디서나 설마천 시험유역의 현장상황을 신속하게 파악할 수 있도록 하여 자료의 질을 향상시킬 수 있는 기반을 구축하여 운영 중에 있다.본 시험유역의 주요연구 내용으로는 관측시설물의 유지관리, 수문기상관측, 수문기상자료 정리 검토, 기본수문특성 분석, 수문관측방법의 비교 검토, 유량측정 정확도 제고를 위한 현장적용평가, 동절기 수위-유량자료 고찰 등을 수행하였으며, 기본 수문특성 분석 내용으로는 호우사상 현황 분석, 지속기간별 최대 강우량분석, 두 우량계간의 강우량 비교, 6개 지점간 강우량 비교, 주요 호우사상의 시 공간적 분포 특성, 연간, 월별, 주요 호우사상별 유출률 분석과 부유사량 및 수질분석 등을 수행하였으며, 이로써 산지 소하천 유역의 물순환 과정을 보다 명확히 규명하고자 노력하였다.

  • PDF

Development of a Novel Integrated Evaluation Index for Freeway Traffic Data (고속도로 교통자료 품질 통합평가지표 개발)

  • PARK, Hyunjin;YOON, Mijung;KIM, Hae;OH, Cheol
    • Journal of Korean Society of Transportation
    • /
    • v.33 no.4
    • /
    • pp.417-429
    • /
    • 2015
  • Evaluation of traffic data quality is a backbone of better traffic information and management systems because it directly affects the reliability of traffic information. This study developed an integrated index for evaluating the quality of archived intelligent transportation systems (ITS) data. Two novel indices including spatio-temporal consistency and severity of missing data were devised and integrated with existing indices such as availability and completeness. An evaluation framework was proposed based on the developed integrated index. Both analytical hierarchical analysis (AHP) technique and entropy method were adopted to derive mixed weighting values to be used for the integrated index. It is expected that the proposed methodology would be effectively used in enhancing the quality of traffic data as a part of traffic information system.

A Study on the Operation of the Seolma-Cheon Experimental Catchment (2006년 설마천 시험유역 운영)

  • Kim, Dong-Phil;Kim, Sung-Hoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2007.05a
    • /
    • pp.860-864
    • /
    • 2007
  • 본 연구의 목적은 한국건설기술연구원에서 운영하는 설마천 시험유역을 대상으로 신뢰성 있는 수문자료를 지속적으로 수집하여 정확한 물 순환 과정을 규명하는데 있다. 강우량, 수위, 유속, 유량, 수질, 부유사량, 기상 등의 기본적인 수문관측 자료를 축적하는 것과 수집된 자료를 이용하여 유역의 유출특성 분석, 수문관측 기술개발과 각종 관측기기의 적합성 검증과 측정방법을 개선하는데 있다. 설마천 시험유역 수문관측은 해마다 노후화된 관측기기의 교체 및 추가 설치, 실시간 전송장비의 보완 및 운영, 각 관측소당 2종 이상의 동시 관측자료 확보 등을 통해 자료의 결측을 최소화하였으며, 정확도를 개선하여 양질의 자료를 생성할 수 있었다. 관측된 우량과 수위 자료에 대하여 일상적인 자료 검토 및 처리 과정을 보다 구체적으로 체계화하여 자료의 질이 향상될 수 있도록 하였으며, 특히 유량 측정 및 산정 방법을 국제 기준에 준하여 수행하여 보다 정도 높은 유량측정성과를 확보할 수 있었다. 이렇게 다각적인 방법으로 안정적인 관측 자료를 확보한 결과, 동절기를 제외한 전적비교와 사방교에서 무결측의 유역평균우량과 유량자료를 구축할 수 있었다. 그리고, 본 연구에서는 실시간 전송장비와 설마천 시험유역 홈페이지(http://kict.datapcs.co.kr)를 통해 실시간으로 우량과 수위 자료를 인터넷과 PCS로 확인할 수 있도록 시스템을 운영하였으며, 이로 인해 언제 어디서나 설마천 시험유역의 현장상황을 신속하게 파악할 수 있도록 하여 자료의 질을 향상시킬 수 있는 기반을 구축하여 운영 중에 있다. 본 시험유역의 주요 연구 내용으로는 수문 기상관측, 수문 기상자료 정리 검토, 기본 수문특성 분석, 수문관측방법의 비교 검토 등을 수행하였으며, 기본 수문특성 분석 내용으로는 호우사상 현황 분석, 지속기간별 최대 강우량 분석, 2종 우량계간의 강우량 비교, 6개 지점간 강우량 비교, 주요 호우사상의 시 공간적 분포 특성, 연간, 월별, 주요 호우사상별 유출률 분석과 부유사량 및 수질분석 등을 수행하였으며, 이로써 산지 소하천 유역의 물 순환 과정을 보다 명확히 규명하고자 노력하였다.

  • PDF

Extension Techniques of 8 Day Interval Recorded Stream-flow Data to Daily One (8일 간격으로 부분 계측된 유량을 연속 일유량으로 확장하는 방법)

  • Baek, Kyong-Oh;Yim, Dong-Hee
    • Journal of Korea Water Resources Association
    • /
    • v.45 no.1
    • /
    • pp.91-99
    • /
    • 2012
  • In this study, it was proposed that extension techniques of 8 day interval recorded stream-flow data which has been produced at the mouth of unit watersheds for TMDLs to daily one. The concept of this method was that the missing data at partial recording station was filled by using the daily data at a nearby, hydrologically similar streamgaging station. First, same day stream-flow was extracted from the daily stream-flow. Then, the extension equation was developed based on the sample data when the same day stream-flow from daily data and the partially recorded stream-flow was deeply related each other. The missing data was interpolated or extrapolated by the equation. Especially the maintenance of variance extension (MOVE) technique was used to derive the equation and was validated. Finally the 8-day interval recorded stream-flow at the mouth of unit watersheds in Han River Basin for TMDLs was extended to continuously daily data by using the method proposed in this study. And the low flow at each unit watershed was evaluated according to the flow-duration curve.