• Title/Summary/Keyword: 결측

Search Result 430, Processing Time 0.034 seconds

A Comparative Analysis between Duplication Stage Gage Data (이중화 수위계 자료 비교분석연구)

  • Kim, Hwi-Rin;Yoo, Chul-Sang;Cho, Hyo-Seob;Kim, Yang-Su
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.1177-1180
    • /
    • 2009
  • 현재 국토해양부 4대강 홍수통제소에서는 369개의(2007년 한국수문조사연보 기준) 수위관측소를 설치 운영하고 있으며 현장에서 수집되는 수위자료의 측정방법은 부자식, 레이더식, 초음파식, 영상수위계 등 다양하다. 한강홍수통제소에서 자체 시험연구과제로 수행한 "TM 및 일반수위관측자료 비교분석연구" (국토 해양부, 2007)에 의하면 홍수예보를 위한 주요지점을 위주로 부자식과 레이더식, 부자식과 초음파식 등으로 수위계가 이중화 설치된 것으로 조사된 바 있다. 최근 홍수예보시 수위계 장비 자체의 결함이나 통신이상 등으로 발생되는 결측치나 이상치 자료를 최소화하기 위하여 주 관측방식이 부자식인 수위관측소에서 부자식 수위계의 기기 고장이나 부자 걸림 등이 발생되어 정상적인 자료 취득이 어려운 경우, 보조로 설치된 레이더식 또는 초음파식 수위계의 자료를 수신 받아 자료 손실을 최소화하고 주요지점의 자료 생산 제공 활용의 안정화를 도모하기 위함이다. 따라서 이러한 활용성을 극대화하기 위해 평상시 주 수위계와 보조 수위계에서 생산되는 자료를 동시에 저장하여 두 자료를 비교 분석하여 향후 홍수통제소에서 적용 가능한 자료관리 및 운영에 대한 개선방안을 제안하고자 한다.

  • PDF

A Study on the Point Rainfall Interpolation Method : 2. Accuracy Analysis of the Methods (결측 강우량 보정방법에 관한 연구: 2. 방법론별 정확도 분석)

  • Kim Eung-Seok;Baek Chun-Woo;Lee Jung-Ho;Park Moo-Jong;Jo Deok-Jun
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.7 no.4
    • /
    • pp.690-696
    • /
    • 2006
  • This study applies the methods proposed in this issue[1] to the 11 rainfall gauging stations of the Pyongchang area. Also, this study analyzes the error range of each interpolation method, and considers spatial distribution according to the number of gauging station. As the results, the linear programming methods shows the best minimum error. However, this method might be difficult to apply in the field because of need for programming. Comparatively, the inverse distance method shows more simple and accurate results than the linear programming one. The result of this study could contribute to the increase of accuracy for the filling of missing rainfall data.

  • PDF

Modeling on Daily Traffic Volume of Local State Road Using Circular Mixture Distributions (혼합원형분포를 이용한 지방국도의 시간교통량 추정모형)

  • Na, Jong-Hwa;Jang, Young-Mi
    • The Korean Journal of Applied Statistics
    • /
    • v.24 no.3
    • /
    • pp.547-557
    • /
    • 2011
  • In this paper we developed a statistical model for traffic volume data which collected from a spot of specific local state road. One peculiar property of daily traffic data is that it has bimodal shape which have two peaks on times of both going to office and coming back to home. So, various mixture models of circular distribution are suggested for bimodal traffic data and EM algorithms are applied to estimate the parameters of the suggested models. To compare the accuracy of the suggested models, classical regressions with dummy variables are also considered. The suggested models for traffic volumn data can be effectively used to estimate missing values due to measuring instrument disorder.

Trend Test of the Mean and Extreme Sea Level Data in the Korean Coast (우리나라 연안의 평균해면 및 최극조위 자료의 추세 검정)

  • Kang, Ju-Whan;Cho, Hong-Yeon;Park, Min-Won;Park, Seon-Jung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.2156-2160
    • /
    • 2008
  • 우리나라 연안의 평균해면이 증가하고 있다는 주장과 고극조위, 저극조위가 증가(또는 변동)하고 있다는 주장이 제기되고 있으나, 연구자가 사용한 자료의 기간 및 분석 방법 등에 차이가 있고, 결측자료(missing data) 및 이상자료(outlier) 등을 처리한 방법이 서로 차이가 있기 때문에 전체적으로 또는 부분적으로 분석결과가 차이를 보일 수 있다. 또한 추세분석에서는 통계적인 신뢰수준에 대한 검정과정 없이 단순하게 선형회귀곡선식을 이용하여 기울기의 부호만으로 증가 감소를 판단하는 경우도 있다. 그러나 추세분석은 최적의 추세곡선을 찾아내는 것 이전에 추세의 유무를 통계적인 신뢰수준을 기준으로 검정하는 것이 필요하다. 본 연구에서는 추세분석의 필수과정인 추세검정(추세가 있는가? 없는가?)을 Mann-Kendall 방법을 이용하여 우리나라 전 연안 조위관측소의 평균해수면 및 고극조위, 저극조위 자료에 대하여 수행하였다. 추세검정 결과를 다음과 같이 도출할 수 있었다. 평균해수면은 95% 유의수준으로 분석에 포함된 전체 30개 검조소 중 대산, 보령, 군산, 목포, 통영, 거문도, 부산, 가덕도, 제주, 서귀포, 속초, 포항, 울산, 울릉도 지점 등 19개 지점이 추세가 있는 것으로 파악되었으며, 고극조위, 저극조위는 각각 15개, 17개 지점이 추세가 있는 것으로 파악되었다.

  • PDF

Multiple Imputation Reducing Outlier Effect using Weight Adjustment Methods (가중치 보정을 이용한 다중대체법)

  • Kim, Jin-Young;Shin, Key-Il
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.4
    • /
    • pp.635-647
    • /
    • 2013
  • Imputation is a commonly used method to handle missing survey data. The performance of the imputation method is influenced by various factors, especially an outlier. The removal of the outlier in a data set is a simple and effective approach to reduce the effect of an outlier. In this paper in order to improve the precision of multiple imputation, we study a imputation method which reduces the effect of outlier using various weight adjustment methods that include the removal of an outlier method. The regression method in PROC/MI in SAS is used for multiple imputation and the obtained final adjusted weight is used as a weight variable to obtain the imputed values. Simulation studies compared the performance of various weight adjustment methods and Monthly Labor Statistic data is used for real data analysis.

Defining microRNA functional families through correlation analysis of microRNA microarray data (microRNA 발현 데이터의 상관관계 분석을 통한 microRNA Functional Family 탐색)

  • Nam Jin-Wu;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.13-15
    • /
    • 2006
  • microRNA는 유전자의 전사 후 과정에서 negative regulation을 담당하는 small noncoding RNA의 한 증류이다. 최근까지 330여개의 인간 microRNA가 발견되었지만 그들의 기능이 밝혀진 것은 소수에 불과하다. microRNA의 기능은 3'UTR에 불완전 상보결합을 통해 negative regulation을 받게 되는 유전자의 기능으로부터 유추되는 것이 일반적이다. 특별히 유전체상에 군집화 된 microRNA들은 하나의 전사체로부터 발현되는 것으로 판단되며, 같은 또는 관련된 기능을 하거나 같은 목표 유전자를 조절하기 위한 functional family일 가능성이 높다. 또한 이러한 functional family는 하나의 전사체로부터 발현되기 때문에, 조직별로 조건별로 같은 발현 패턴을 보여야 한다. 본 연구에서는 발현데이터로부터 microRNA functional family를 탐색하기 위해, 5개의 연구 그룹에서 공개한 조직별 microRNA 발현데이터를 표준화 작업을 거친 후 통합하고 k-nearest neighbor 알고리즘을 이용해 결측치를 보정한 후 microRNA 발현사이의 correlation을 계산한다. 이때 데이터 통합에서 생기는 문제에 robust한 결과를 얻기 위해 실제 발현데이터가 아닌 rank 데이터부터 correlation을 측정한다. 계산된 spearman ranked correlation 결과와 microRNA의 genomic coordination 정보로부터 34개의 functional family를 정의할 수 있었다.

  • PDF

Metropolis-Hastings Expectation Maximization Algorithm for Incomplete Data (불완전 자료에 대한 Metropolis-Hastings Expectation Maximization 알고리즘 연구)

  • Cheon, Soo-Young;Lee, Hee-Chan
    • The Korean Journal of Applied Statistics
    • /
    • v.25 no.1
    • /
    • pp.183-196
    • /
    • 2012
  • The inference for incomplete data such as missing data, truncated distribution and censored data is a phenomenon that occurs frequently in statistics. To solve this problem, Expectation Maximization(EM), Monte Carlo Expectation Maximization(MCEM) and Stochastic Expectation Maximization(SEM) algorithm have been used for a long time; however, they generally assume known distributions. In this paper, we propose the Metropolis-Hastings Expectation Maximization(MHEM) algorithm for unknown distributions. The performance of our proposed algorithm has been investigated on simulated and real dataset, KOSPI 200.

Suitability Evaluation for Runoff Rate According to Measurement Term of Water Level Data (수위자료의 측정 간격에 따른 유출률 평가의 적정성 검토)

  • Oh, Chang-Ryeol;Lee, Yeon-Kil;Lee, Jin-Won;Jung, Sung-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2007.05a
    • /
    • pp.1870-1874
    • /
    • 2007
  • 신뢰성 있는 수위-유량관계곡선식 개발은 해당 수위관측소 지점에 대한 정도있는 저 평수기 및 홍수기의 유량조사가 담보되어야 한다. 이는 합리적이고 경제적인 이수 및 치수 계획 수립과 각종 수공구조물 설계의근간이 된다. 이와 더불어 상 하류 유출량 검토 및 유출률 평가에 있어서의 수위 자료 역시 중요한 수문자료 중에 하나이다. 이러한 수위 자료에는 다양한 형태의 오차를 내포하고 있으며, 또한 유출률 평가시 수위 자료의 측정 간격에 따라 다양한 형태의 결과 값을 갖는다. 따라서 본 연구에서는 섬진강 수계의 경천을 대표하고 전형적인 농촌지역 특성을 갖고 있으며 소유역에 해당하는 순창2수위관측소와 본류부를 대표하는 구례2수위관측소를 대상으로 수위자료의 측정 간격에 따른 유출률 평가의 적정성을 검토하고자 한다. 이에 따른 방법으로는 일차적으로 영산강홍수통제소에서 조사 관리중인 30분의 수위 자료를 획득하여 T/M 전송 오류 등에 의한 측정 오차 및 결측 자료는 보간을 하였다. 그리고 30분의 수위 자료를 이용하여 1분, 5분, 10분의 수위 자료를 선형보간법에 의해 재산정 하였으며 1시간, 3시간, 6시간, 12시간, 1일의 수위 자료에 해당하는 시간의 수위 자료를 획득하였다. 이러한 절차에 의하여 결정된 수위자료는 2006년에 개발된 수위-유량관 계곡선식을 이용하여 유출량 값으로 환산하였다.

  • PDF

Using Missing Values in the Model Tree to Change Performance for Predict Cholesterol Levels (모델트리의 결측치 처리 방법에 따른 콜레스테롤수치 예측의 성능 변화)

  • Jung, Yong Gyu;Won, Jae Kang;Sihn, Sung Chul
    • Journal of Service Research and Studies
    • /
    • v.2 no.2
    • /
    • pp.35-43
    • /
    • 2012
  • Data mining is an interest area in all field around us not in any specific areas, which could be used applications in a number of areas heavily. In other words, it is used in the decision-making process, data and correlation analysis in hidden relations, for finding the actionable information and prediction. But some of the data sets contains many missing values in the variables and do not exist a large number of records in the data set. In this paper, missing values are handled in accordance with the model tree algorithm. Cholesterol value is applied for predicting. For the performance analysis, experiments are approached for each treatment. Through this, efficient alternative is presented to apply the missing data.

  • PDF

Estimation of Evapotranspiration using Satellite data and Meteorological Model (인공 위성과 기상 모형을 이용한 증발산 추정)

  • Jang, Keun-Chang;Kang, Sin-Kyu;Kim, Jea-Chul;Kim, Joon
    • Proceedings of the KSRS Conference
    • /
    • 2009.03a
    • /
    • pp.213-218
    • /
    • 2009
  • 에너지 전달 과정과 밀접한 관계가 있는 증발산(Evapotranspiration)은 기후 변화나 육상 생태계 생산성에서 매우 중요한 요소이며, 수문학적 순환과 지역적 물 관리 측면에서 매우 중요하다. 최근 인공위성을 이용하여 증발산을 추정하기 위한 노력이 많이 진행되고 있으며, 특히 MODIS (Moderate Resolution Imaging Spectroradiometer)는 증발산을 추정하기 위한 좋은 정보를 제공하고 있다 하지만, 구름 등에 의한 증발산 입력 자료 결측은 전체 자료의 획득률을 낮추고, 연속적인 증발산 모니터 링을 제한한다. 따라서 본 연구에서는 MODIS 기반의 증발산 입력 자료의 개선하여 서로 다른 식생과 지형 구조를 갖는 플럭스 연구지에 대한 증발산의 추정 및 평가하고, 남한에 대한 MODIS 기반의 증발산 지도 작성하였다. 또한 구름에 의해 결측된 날에 대해서는 MODIS-MM5 4차원 자료동화 기법을 이용한 증발산의 연속적인 모니터링 기법을 개발하였다. MODIS 기반의 증발산을 추정하기 위해 Revised RS-PM 알고리즘을 사용하였다. 증발산을 평가하기 위해 4 곳의 플럭스 연구지(광릉, 해남 이상 대한민국, 타카야마, 토마코아미 이상 일본) 자료와 비교하였고, 매우 신뢰성 있는 결과를 얻을 수 있었다. MODIS 입력 자료의 개선으로 획득률은 2배 가량 증가하였다. 남한에 대한 연간 증발산은 평균적으로 약 35%의 획득률 (365일 중 약 120일)과 함께 산출되었고, 시 공간적인 분포를 잘 나타내었다. 구름 낀 날에 대한 MODIS-MM5 자료 동화 기법의 적용은 증발산의 연속적인 모니터링을 가능하게 하였다.

  • PDF