• Title/Summary/Keyword: 경험적 확률분포

Search Result 51, Processing Time 0.037 seconds

Drought Outlook using APCC MME Seasonal Prediction Information (APCC MME 계절예측정보를 이용한 가뭄전망)

  • Kang, Boo-Sik;Moon, Su-Jin;Sohn, Soo-Jin;Lee, Woo-Jin
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1784-1788
    • /
    • 2010
  • APEC 기후센터(APEC Climate Center, APCC)에서 제공하는 다중모형앙상블(Multi-model Ensemble, MME) 형태의 계절예측정보를 이용하여 3개월 가뭄전망을 수행하였다. APCC MME는 기후예측모형이 가지는 불확실성을 최소화하기 위한 방법으로, 아시아 태평양 지역 내 9개 회원국 16개 기관 21개 기후모형의 계절예측정보를 활용하여, 개별 모형이 가지는 계통오차(Systematic error)를 앙상블 기법을 통하여 상쇄함으로써 최적의 예측자료를 도출한다. 또한, 기후예측 모형이 예측한 대기순환장은 관측 지점변수와 경험적 통계적 관련성을 가지므로, 이를 바탕으로 상세지역의 이상기후에 대한 정보를 도출할 수 있다. 본 연구에서는 가뭄 관리 및 전망을 위한 입력 자료로서, 기상전문 기관인 APEC 기후센터 (APEC Climate Center, APCC)에서 제공하는 전구 규모의 기온 및 강수 전망자료를 기상청 산하 59개 지점의 전망자료로 통계적 규모 축소화 기법을 통해 3개월 예보를 실시하였다. APCC 계절예측자료를 가뭄모니터링시스템의 자료입력 포맷에 따라 적절히 가공한 뒤, 가뭄 관리 및 전망을 위하여 SPI(Standard Precipitation Index) 및 PDSI(Palmer Drought Severity Index)지수의 입력자료로 사용하여 SPI 및 PDSI 지수를 산정하였다. 또한 분위사상법(Quantile Mapping)을 이용하여 총 59개 지점의 과거 월평균 관측값과 최근 2009년에 대한 모의값의 누적확률분포값을 계산하고 모의값의 확률분포를 관측값의 확률분포에 사상시켜 가뭄 전망을 위한 기상변수의 오차를 보정하고자 하였다. 이러한 계절예측정보를 이용하여 가뭄 전망에 대한 신뢰도가 높아진다면, 사전예방 및 피해완화로 가뭄상황에 대한 신속한 대처 및 피해의 경감이 이루어질 수 있을 것이다.

  • PDF

ROC Curve Fitting with Normal Mixtures (정규혼합분포를 이용한 ROC 분석)

  • Hong, Chong-Sun;Lee, Won-Yong
    • The Korean Journal of Applied Statistics
    • /
    • v.24 no.2
    • /
    • pp.269-278
    • /
    • 2011
  • There are many researches that have considered the distribution functions and appropriate covariates corresponding to the scores in order to improve the accuracy of a diagnostic test, including the ROC curve that is represented with the relations of the sensitivity and the specificity. The ROC analysis was used by the regression model including some covariates under the assumptions that its distribution function is known or estimable. In this work, we consider a general situation that both the distribution function and the elects of covariates are unknown. For the ROC analysis, the mixtures of normal distributions are used to estimate the distribution function fitted to the credit evaluation data that is consisted of the score random variable and two sub-populations of parameters. The AUC measure is explored to compare with the nonparametric and empirical ROC curve. We conclude that the method using normal mixtures is fitted to the classical one better than other methods.

Evaluation of seismic fragility models for cut-and-cover railway tunnels (개착식 철도 터널 구조물의 기존 지진취약도 모델 적합성 평가)

  • Yang, Seunghoon;Kwak, Dongyoup
    • Journal of Korean Tunnelling and Underground Space Association
    • /
    • v.24 no.1
    • /
    • pp.1-13
    • /
    • 2022
  • A weighted linear combination of seismic fragility models previously developed for cut-and-cover railway tunnels was presented and the appropriateness of the combined model was evaluated. The seismic fragility function is expressed in the form of a cumulative probability function of the lognormal distribution based on the peak ground acceleration. The model uncertainty can be reduced by combining models independently developed. Equal weight is applied to four models. The new seismic fragility function was developed for each damage level by determining the median and standard deviation, which are model metrics. Comparing fragility curves developed for other bored tunnels, cut-and-cover tunnels for high-speed railway system have a similar level of fragility. We postulated that this is due to the high seismic design standard for high-speed railway tunnel.

Improving Generalization Performance of Neural Networks using Natural Pruning and Bayesian Selection (자연 프루닝과 베이시안 선택에 의한 신경회로망 일반화 성능 향상)

  • 이현진;박혜영;이일병
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.3_4
    • /
    • pp.326-338
    • /
    • 2003
  • The objective of a neural network design and model selection is to construct an optimal network with a good generalization performance. However, training data include noises, and the number of training data is not sufficient, which results in the difference between the true probability distribution and the empirical one. The difference makes the teaming parameters to over-fit only to training data and to deviate from the true distribution of data, which is called the overfitting phenomenon. The overfilled neural network shows good approximations for the training data, but gives bad predictions to untrained new data. As the complexity of the neural network increases, this overfitting phenomenon also becomes more severe. In this paper, by taking statistical viewpoint, we proposed an integrative process for neural network design and model selection method in order to improve generalization performance. At first, by using the natural gradient learning with adaptive regularization, we try to obtain optimal parameters that are not overfilled to training data with fast convergence. By adopting the natural pruning to the obtained optimal parameters, we generate several candidates of network model with different sizes. Finally, we select an optimal model among candidate models based on the Bayesian Information Criteria. Through the computer simulation on benchmark problems, we confirm the generalization and structure optimization performance of the proposed integrative process of teaming and model selection.

Statistical Modeling of Learning Curves with Binary Response Data (이항 반응 자료에 대한 학습곡선의 모형화)

  • Lee, Seul-Ji;Park, Man-Sik
    • Communications for Statistical Applications and Methods
    • /
    • v.19 no.3
    • /
    • pp.433-450
    • /
    • 2012
  • As a worker performs a certain operation repeatedly, he tends to become familiar with the job and complete it in a very short time. That means that the efficiency is improved due to his accumulated knowledge, experience and skill in regards to the operation. Investing time in an output is reduced by repeating any operation. This phenomenon is referred to as the learning curve effect. A learning curve is a graphical representation of the changing rate of learning. According to previous literature, learning curve effects are determined by subjective pre-assigned factors. In this study, we propose a new statistical model to clarify the learning curve effect by means of a basic cumulative distribution function. This work mainly focuses on the statistical modeling of binary data. We employ the Newton-Raphson method for the estimation and Delta method for the construction of confidence intervals. We also perform a real data analysis.

Risk and The Economics of Acid Chemical Use in Korean taver Farming (김 양식에 있어서 산 이용의 생산위험과 경제성에 관한 연구)

  • Park Seong Kwae
    • The Journal of Fisheries Business Administration
    • /
    • v.32 no.1
    • /
    • pp.41-55
    • /
    • 2001
  • 본 논문의 목적은 김 양식 있어서 무기산 또는 유기산 사용 문제와 김 양식 어업인들의 생산위험 회피행위를 고찰하기 위한 이론적 틀을 개발하고, 정책함의를 도출하는데 있다. 김 양식의 생산위험 또는 가격위험은 김 양식 어업인들이 직면하고 있는 가장 중요한 의 사길정변수라고 할 수 있으며, 특히 문제가 되고 있는 무기산(또는 폐염산) 또는 유기산은 농업에 있어서 농약처럼 김 양식 어업인들이 생산위험을 최소화하기 위한 일종의 보험 생산요소(insurance production inputs)으로 볼 수 있다. 김 양식 어업인들의 생산위험은 평균(1차 적률 mean), 분산(2차 적률 variance), 왜곡도(3차 적률 skewnesss)에 의해 측정될 수 있으며, 특히 김 양식 어업인들은 확률이 낮을지라도 일단 첫병과 잡태(예: 파래 등)가 광범위하고 심각하게 발생하게 되면 생산물의 심각한 질적 저하가 야기된다는 사실을 경험적으로 인식하고 있다. 따라서 김 양식 어업인들은 평균생산 뿐만 아니라 생산의 분산과 하향성 확률 분포를 최소화할 수 있는 생산기술을 이용하게 된다. 이러한 김 양식 어업인들의 위험회피행위를 분석하기 위해 기대효용이론을 채택하고, 미지의 진효용함수를 테일러 시리즈 확장에 의해 3차 적률까지를 근사치로 이용하였다. 이윤에 대한 기대효용 극대화를 위한 1차 최적조건을 구하면, 어떤 산(무기산 또는 유기산)을 얼마만큼 이용하느냐 하는 문제는 생산량의 분산과 하향성 분포에 대한 김 양식 어업인들의 위험회피계수의 크기와 생산요소의 탄성치에 의해 결정된다. 특히 하향성 위험회피계수가 높고 3차 적률에 대한 생산요소 산의 탄성치가 클 경우 김 양식 어업인들른 하향성 위험을 줄이기 위해 상대적으로 강력하고 가격이 저렴한 산을 더 많이 이용하게 된다. 또한 두 가지 산의 효과가 같다면 무기산/유기산의 시장가격과 정부 산 가격 정책이 김 양식 어업인들의 산 종류 선택과 사용량 결정에 유의한 영향을 미치게 될 것이다. 무기산의 사용이 광범위하고 집약적으로 이루어질 경우 김 양식부문에서 폐공업용 염산 이용에 의한 생산위험 감소는 해양생태환경 파괴위험 증가로 이어질 수 있으며 여기에 바로 정부 산정책의 딜레마가 있다. 따라서 김 양식의 생산성 증대와 환경보전의 균형 유지에 대한 확고한 정책목표가 필요하며, 이러한 정책목표가 흔들릴 경우 산 문제에 대한 정부정책은 생산성 증대와 환경보전 어느 한쪽 부문에 심각한 왜곡현상을 초래할 수 있다.

  • PDF

Estimation of Storm-centered Areal Reduction Factors by Durations and Return Periods Using Radar Rainfall (지속시간 및 재현기간에 따른 레이더 강우 호우중심형 ARF의 산정)

  • Kim, Eunji;Kang, Boosik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.163-163
    • /
    • 2017
  • 설계홍수량은 수공구조물의 규모를 결정하는데 이용되며, 국내에서는 설계홍수량을 산정하기 위하여 지속시간과 재현기간에 따라 면적강우량을 추정한다. 지점강우량은 제한된 지역을 대표하는 값이므로 지점강우량을 기준면적에 대한 면적강우량으로 환산하기 위하여 면적우량환산계수(ARF, Areal Reduction Factor)를 적용한다. ARF를 산정하는 방법은 과거 관측자료를 활용하여 산정하는 경험적 방법(empirical method)이 주를 이루고 있으며, 경험적 방법은 크게 면적고정형(Fixedarea) 방법과 호우중심형(Storm-centered) 방법으로 분류된다. 면적고정형 방법은 국내 하천설계 기준에서 적용하고 있는 방법으로 면적강우 및 지점강우의 연 최대치를 독립적으로 빈도 해석하여 ARF를 산정하므로 실제 강우사상으로부터 산정된 값과 편차를 보인다. 반면 호우중심형 방법은 각각의 강우사상을 분석 대상 유역 중심에 공간 전이시켜 최대 강우량이 발생하도록 하는 방법으로, 레이더 강우를 활용하면 실제 강우사상의 공간분포 특성을 반영한 현실적인 ARF 산정이 가능하다. 본 연구에서는 국내 기상청에서 제공하는 홍수기(6-9월)의 10분 단위 단일편파 전국합성 레이더 자료를 활용하여 지속시간 1, 3, 6, 12, 24시간에 대한 호우중심형 ARF를 산정하였고, 면적강우 산정 시, 강우사상의 면적을 원형 또는 타원형으로 선정하여 강우의 형상 및 방향성을 고려하였다. 또한 레이더 강우의 중심강우를 지상강우 자료로 산정된 확률강우량 기준으로 분류하여 재현기간별 호우중심형 ARF를 산정하였으며, 이를 통해 기준면적, 지속시간, 재현기간에 따른 ARF의 특성을 분석하고자 하였다.

  • PDF

Reliability Analysis of Sloped Coastal Structures against Random Wave Overtopping (월파에 대한 경사식 해안 구조물의 신뢰성 해석)

  • 이철응
    • Journal of Korean Society of Coastal and Ocean Engineers
    • /
    • v.15 no.4
    • /
    • pp.214-223
    • /
    • 2003
  • A reliability analysis is straightforwardly applied to the sloped coastal structures against the random wave overtopping. A reliability function can be directly derived from a empirical formula in which may take into account many variables associated with the random wave overtopping. The probability of failure exceeded the allowable overtopping discharge can be evaluated as a function of dimensionless crest height with some reasonable statistical properties and distribution functions of each random variable. Some differences of probabilities of failure occurred from variations of the slopes of structures as well as types of armour are investigated into quantitatively. Additionally, the effects of the crest width of units placed in front of the concrete cap on the probability of failure may be analyzed. Finally, the sensitivity analyses are carried out with respect to the uncertainties of random variables. It is found that the overall characteristics similar to the known experimental results are correctly represented in this reliability analyses. Also, it should be noted that the probabilities of failure may be quantitatively obtained for several structural and hydraulic conditions, which never assess in the deterministic design method. Thus, it may be possible for determination on the crest height of sloped coastal structures to consider the probability of failure of wave overtopping, by which may be increased the efficiency of practical design.

Influence Function on the Coefficient of Variation (변이계수에 대한 영향함수)

  • Lee, Yun-Hee;Kim, Hong-Gie
    • Communications for Statistical Applications and Methods
    • /
    • v.15 no.4
    • /
    • pp.509-516
    • /
    • 2008
  • We derive the influence function on the coefficient of variation. Empirical influence function and Sample influence function are used to verify the validity of the derived influence function. To show the validity of the influence function, we carry out simulations with random samples from normal distribution $N(20,1^2)$ and $N(20,5^2)$, respectively. The simulation result proves that the derived influence function is very accurate in estimating changes in the coefficient of variation when an observation is deleted.

Selection of Climate Indices for Nonstationary Frequency Analysis and Estimation of Rainfall Quantile (비정상성 빈도해석을 위한 기상인자 선정 및 확률강우량 산정)

  • Jung, Tae-Ho;Kim, Hanbeen;Kim, Hyeonsik;Heo, Jun-Haeng
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.39 no.1
    • /
    • pp.165-174
    • /
    • 2019
  • As a nonstationarity is observed in hydrological data, various studies on nonstationary frequency analysis for hydraulic structure design have been actively conducted. Although the inherent diversity in the atmosphere-ocean system is known to be related to the nonstationary phenomena, a nonstationary frequency analysis is generally performed based on the linear trend. In this study, a nonstationary frequency analysis was performed using climate indices as covariates to consider the climate variability and the long-term trend of the extreme rainfall. For 11 weather stations where the trend was detected, the long-term trend within the annual maximum rainfall data was extracted using the ensemble empirical mode decomposition. Then the correlation between the extracted data and various climate indices was analyzed. As a result, autumn-averaged AMM, autumn-averaged AMO, and summer-averaged NINO4 in the previous year significantly influenced the long-term trend of the annual maximum rainfall data at almost all stations. The selected seasonal climate indices were applied to the generalized extreme value (GEV) model and the best model was selected using the AIC. Using the model diagnosis for the selected model and the nonstationary GEV model with the linear trend, we identified that the selected model could compensate the underestimation of the rainfall quantiles.