• 제목/요약/키워드: extreme quantile estimation

검색결과 21건 처리시간 0.022초

Robust extreme quantile estimation for Pareto-type tails through an exponential regression model

  • Richard Minkah;Tertius de Wet;Abhik Ghosh;Haitham M. Yousof
    • Communications for Statistical Applications and Methods
    • /
    • 제30권6호
    • /
    • pp.531-550
    • /
    • 2023
  • The estimation of extreme quantiles is one of the main objectives of statistics of extremes (which deals with the estimation of rare events). In this paper, a robust estimator of extreme quantile of a heavy-tailed distribution is considered. The estimator is obtained through the minimum density power divergence criterion on an exponential regression model. The proposed estimator was compared with two estimators of extreme quantiles in the literature in a simulation study. The results show that the proposed estimator is stable to the choice of the number of top order statistics and show lesser bias and mean square error compared to the existing extreme quantile estimators. Practical application of the proposed estimator is illustrated with data from the pedochemical and insurance industries.

POT방법론을 이용한 자동차보험 손해율 추정 (Estimation of Car Insurance Loss Ratio Using the Peaks over Threshold Method)

  • 김수영;송종우
    • 응용통계연구
    • /
    • 제25권1호
    • /
    • pp.101-114
    • /
    • 2012
  • 자동차보험의 손해율이란 지급보험금의 수입보험료에 대한 비율을 의미한다. 손해율이 매우 큰 값을 갖는 대형손실이 일어나는 경우에는 보험회사의 재무적인 부분에 큰 악영향을 미치게 된다. 따라서 보험회사가 이에 대비할 수 있도록 하기 위하여 손해율의 극단 분위수(extreme quantile)를 추정하는 것은 매우 중요한 일이다. 다른 종류의 보험 관련 데이터와 같이 손해율의 분포는 오른쪽으로 긴 꼬리를 갖는 두꺼운 꼬리분포(heavy-tailed distribution)를 갖는다. 이런 자료에서 극단 분위수룰 추정하기 위하여 가장 많이 사용되는 방법론은 POT(Peaks over threshold)와 Hill 추정(Hill estimation)이다. 본 논문에서는 일반화파레토분포(generalized Pareto distribution; GPD)의 다양한 모수추정방법론의 성능을 모의실험과 실제 손해율 데이터를 사용하여 비교, 분석하였다. 또한 Hill 추정치를 사용하여 극단 분위수를 추정하였다. 그 결과 대부분의 경우에 POT 방법론이 Hill 추정치를 이용한 방법보다 정확한 분위수를 추정하였고, 모수추정방법론 중에서는 MLE, Zhang, NLS-2 방법론이 가장 좋은 결과를 보여주었다.

원/달러 환율 투자 손실률에 대한 극단분위수 추정 (Extreme Quantile Estimation of Losses in KRW/USD Exchange Rate)

  • 윤석훈
    • Communications for Statistical Applications and Methods
    • /
    • 제16권5호
    • /
    • pp.803-812
    • /
    • 2009
  • 금융자료에 극단값이론을 적용하는 것은 위험관리에서 중요한 최신 통계기법 중의 하나라고 할 수 있다. 극단값분석에서 전통적으로 사용해 오던 연간 최대값방법은 시계열자료의 연간 최대값들에 대하여 일반화 극단값분포를 적합시키는 것이고, 최근 대안으로 널리 사용되고 있는 분계점 방법은 시계열자료 중 충분히 큰 하나의 분계점을 넘어서는 초과값들에 대하여 일반화파레토분포를 적합시키는 것이다. 그러나, 보다 실질적인 방법은 분계점을 넘어서는 초과값들을 하나의 점과정으로 해석하는 것인데, 즉 초과값들의 초과시점과 초과여분을 점근적으로 비동질 포아송과정을 갖는 하나의 2차원 점과정으로 간주하는 것이다. 본 논문에서는 이러한 2차원 비동질 포아송과정 모형을 1982.1.4부터 2008.12.31까지 수집된 원/달러 환율 시계열자료로부터 계산된 일별 환율투자손실률, 즉 일별 로그 손실률에 적용한다. 여기서 주된 관심은 10년 혹은 50년에 한번 정도 발생하는 대형 손실률 수준과 같은 극단분위수를 어떻게 추정하느냐 하는 것이다.

Prediction of sharp change of particulate matter in Seoul via quantile mapping

  • Jeongeun Lee;Seoncheol Park
    • Communications for Statistical Applications and Methods
    • /
    • 제30권3호
    • /
    • pp.259-272
    • /
    • 2023
  • In this paper, we suggest a new method for the prediction of sharp changes in particulate matter (PM10) using quantile mapping. To predict the current PM10 density in Seoul, we consider PM10 and precipitation in Baengnyeong and Ganghwa monitoring stations observed a few hours before. For the PM10 distribution estimation, we use the extreme value mixture model, which is a combination of conventional probability distributions and the generalized Pareto distribution. Furthermore, we also consider a quantile generalized additive model (QGAM) for the relationship modeling between precipitation and PM10. To prove the validity of our proposed model, we conducted a simulation study and showed that the proposed method gives lower mean absolute differences. Real data analysis shows that the proposed method could give a more accurate prediction when there are sharp changes in PM10 in Seoul.

Temperature effect analysis of a long-span cable-stayed bridge based on extreme strain estimation

  • Yang, Xia;Zhang, Jing;Ren, Wei-Xin
    • Smart Structures and Systems
    • /
    • 제20권1호
    • /
    • pp.11-22
    • /
    • 2017
  • The long-term effect of ambient temperature on bridge strain is an important and challenging problem. To investigate this issue, one year data of strain and ambient temperature of a long-span cable-stayed bridge is studied in this paper. The measured strain-time history is decomposed into two parts to obtain the strains due to vehicle load and temperature alone. A linear regression model between the temperature and the strain due to temperature is established. It is shown that for every $1^{\circ}C$ increase in temperature, the stress is increased by 0.148 MPa. Furthmore, the extreme value distributions of the strains due to vehicle load, temperature and the combination effect of them during the remaining service period are estimated by the average conditional exceedance rate approach. This approach avoids the problem of declustering of data to ensure independence. The estimated results demonstrate that the 95% quantile of the extreme strain distribution due to temperature is up to $1.488{\times}10^{-4}$ which is 2.38 times larger than that due to vehicle load. The study also indicates that the estimated extreme strain can reflect the long-term effect of temperature on bridge strain state, which has reference significance for the reliability estimation and safety assessment.

A data-adaptive maximum penalized likelihood estimation for the generalized extreme value distribution

  • Lee, Youngsaeng;Shin, Yonggwan;Park, Jeong-Soo
    • Communications for Statistical Applications and Methods
    • /
    • 제24권5호
    • /
    • pp.493-505
    • /
    • 2017
  • Maximum likelihood estimation (MLE) of the generalized extreme value distribution (GEVD) is known to sometimes over-estimate the positive value of the shape parameter for the small sample size. The maximum penalized likelihood estimation (MPLE) with Beta penalty function was proposed by some researchers to overcome this problem. But the determination of the hyperparameters (HP) in Beta penalty function is still an issue. This paper presents some data adaptive methods to select the HP of Beta penalty function in the MPLE framework. The idea is to let the data tell us what HP to use. For given data, the optimal HP is obtained from the minimum distance between the MLE and MPLE. A bootstrap-based method is also proposed. These methods are compared with existing approaches. The performance evaluation experiments for GEVD by Monte Carlo simulation show that the proposed methods work well for bias and mean squared error. The methods are applied to Blackstone river data and Korean heavy rainfall data to show better performance over MLE, the method of L-moments estimator, and existing MPLEs.

확률 분포형의 극치 수문량 예측 능력 평가에 관한 연구 (A Study on the Estimation of Extreme Quantile of Probability Distribution)

  • 정진석;신홍준;안현준;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.399-400
    • /
    • 2017
  • 홍수나 가뭄 등 극치 현상의 통계분석 및 빈도해석에 있어 극치분포형이 널리 사용되고 있으며, 이러한 극치분포형의 특성을 이해하기 위해서는 분포형의 오른쪽 꼬리(right tail) 부분 특성을 자세히 분석할 필요가 있다. 이에 따라 본 연구에서는 Monte Carlo 모의를 통하여 다양한 극치분포형의 오른쪽 꼬리 부분의 통계적 특성 및 그 예측 능력을 연구하였다. 극치분포형으로는 우리나라 확률수문량 산정에 널리 활용되고 있는 generalized extreme value (GEV), Gumbel, generalized logistic 분포를 사용하였으며, 매개변수 산정 방법으로는 확률가중모멘트법을 사용하였다. 모의실험의 모분포로는 수문빈도해석에서 많이 사용되는 GEV 분포를 사용하였고, 30년 이상 자료를 보유한 기상청 지점 자료의 왜곡도를 조사하여 모의실험에 사용되는 모집단의 왜곡도로 가정하여 표본 자료를 발생시켰다. 예측 능력의 평가는 재현기간 10~1000년의 확률수문량을 왜곡도계수를 고려한 GEV 도시위치공식을 이용하여 GEV 확률지에 도시하고, 평균제곱근오차(root mean square error), 편의(bias), 평균상대오차(mean relative difference), 평균절대상대오차(mean absolute relative difference)를 이용하여 최적 분포형을 선정함으로써 이루어진다. 또한 예측 능력 평가결과의 타당성 확인을 위해 극치분포형의 적합정도를 잘 나타낸다고 알려진 modified Anderson-Darling 방법의 검정결과와 비교하여 적절성을 확인하였다.

  • PDF

Copula 모형을 이용한 이변량 강우빈도해석 (Bivariate Frequency Analysis of Rainfall using Copula Model)

  • 주경원;신주영;허준행
    • 한국수자원학회논문집
    • /
    • 제45권8호
    • /
    • pp.827-837
    • /
    • 2012
  • 확률강우량은 수공구조물의 설계에 있어 중요한 역할을 하며 이러한 확률강우량의 산정은 일반적으로 일변량 빈도해석을 수행하고 최적의 확률분포형을 찾아냄으로써 계산된다. 하지만 일변량 빈도해석은 수행 시 지속기간이 제한적이라는 단점이 있으며 이를 보완하기 위해 본 연구에서는 이변량 빈도해석을 수행하였다. 다변량 모형인 copula 모형 중3가지의 분포형을 이용하여 5개 지점의 연최대강우사상에 대해 이 변량 빈도해석을 수행하였으며 확률변수로 강우량과 지속기간을 사용하였다. 주변분포형은 강우량에는 Gumbel (GUM), generalized logistic (GLO) 분포형, 지속기간에는 generalized extreme value (GEV), GUM, GLO 분포형이사용됐으며 copula 모형은Frank, Joe, Gumbel-Hougaard 모형을 이용하였다. 주변분포형의 매개변수는 확률가중모멘트법을 이용하여 추정하였으며, copula 모형의 매개변수는 준모수방법인 의사최우도법을 사용하여 구하였다. 이를 통해 얻어진 확률강우량을 주변분포형과 copula 모형을바꾸어가며 비교하였다. 그 결과, 주변분포형의 종류에 따른 변화에서는 지속기간의 분포형에는 크게 영향을 받지 않는 것으로 나타났다. 강우량의 분포형에 따라서는 조금씩 차이가 났으며 강우량의 분포형이 GUM일 경우, GLO일 때에 비해 재현기간이 증가할수록 확률강우량이 증가하는 경향이 두드러졌다. Copula 모형별로 비교해보았을 때, Joe, Gumbel-Hougaard 모형은 비슷한 경향을 나타내었으며 Frank 모형은 재현기간의 증가에 따른 확률강우량의 증가가 강하게 나타냈다.

평률 회귀분석을 위한 추정 방법의 비교 (Comparison of estimation methods for expectile regression)

  • 김종민;강기훈
    • 응용통계연구
    • /
    • 제31권3호
    • /
    • pp.343-352
    • /
    • 2018
  • 설명변수가 주어졌을 때 반응변수의 평균적인 추세뿐만 아니라 극단적인 지역에서의 추세에 대해서 추정하고 싶거나 반응변수 분포의 일반적인 탐색을 위해서는 분위수 회귀분석과 평률 회귀분석을 사용할 수 있다. 본 논문에서는 평률 회귀모형의 추정을 위한 모수적 방법과 비모수적 방법의 성능을 비교하고자 한다. 이를 위해 각 추정 방법을 소개하고 여러 상황의 모의실험 및 실제자료에의 적용을 통해 비교 분석을 실시하였다. 모형에 따라 성능 차이가 있는데 자료의 형태가 복잡하여 변수 간의 관계를 유추하기 힘들 경우 비모수적으로 추정한 평률 회귀분석모형이 더욱 좋은 결과를 보였다. 일반적인 회귀분석의 경우와 달리 평률의 경우 후보가 되는 모수 모형을 상정하기 어렵다는 측면에서 볼 때, 비모수적 방법의 사용이 추천될 수 있다.

Regional flood frequency analysis of extreme rainfall in Thailand, based on L-moments

  • Thanawan Prahadchai;Piyapatr Busababodhin;Jeong-Soo Park
    • Communications for Statistical Applications and Methods
    • /
    • 제31권1호
    • /
    • pp.37-53
    • /
    • 2024
  • In this study, flood records from 79 sites across Thailand were analyzed to estimate flood indices using the regional frequency analysis based on the L-moments method. Observation sites were grouped into homogeneous regions using k-means and Ward's clustering techniques. Among various distributions evaluated, the generalized extreme value distribution emerged as the most appropriate for certain regions. Regional growth curves were subsequently established for each delineated region. Furthermore, 20- and 100-year return values were derived to illustrate the recurrence intervals of maximum rainfall across Thailand. The predicted return values tend to increase at each site, which is associated with growth curves that could describe an increasing long-term predictive pattern. The findings of this study hold significant implications for water management strategies and the design of flood mitigation structures in the country.