• 제목/요약/키워드: Generalized extreme value

검색결과 146건 처리시간 0.028초

Estimating Suitable Probability Distribution Function for Multimodal Traffic Distribution Function

  • Yoo, Sang-Lok;Jeong, Jae-Yong;Yim, Jeong-Bin
    • 해양환경안전학회지
    • /
    • 제21권3호
    • /
    • pp.253-258
    • /
    • 2015
  • The purpose of this study is to find suitable probability distribution function of complex distribution data like multimodal. Normal distribution is broadly used to assume probability distribution function. However, complex distribution data like multimodal are very hard to be estimated by using normal distribution function only, and there might be errors when other distribution functions including normal distribution function are used. In this study, we experimented to find fit probability distribution function in multimodal area, by using AIS(Automatic Identification System) observation data gathered in Mokpo port for a year of 2013. By using chi-squared statistic, gaussian mixture model(GMM) is the fittest model rather than other distribution functions, such as extreme value, generalized extreme value, logistic, and normal distribution. GMM was found to the fit model regard to multimodal data of maritime traffic flow distribution. Probability density function for collision probability and traffic flow distribution will be calculated much precisely in the future.

The transmuted GEV distribution: properties and application

  • Otiniano, Cira E.G.;de Paiva, Bianca S.;Neto, Daniele S.B. Martins
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.239-259
    • /
    • 2019
  • The transmuted generalized extreme value (TGEV) distribution was first introduced by Aryal and Tsokos (Nonlinear Analysis: Theory, Methods & Applications, 71, 401-407, 2009) and applied by Nascimento et al. (Hacettepe Journal of Mathematics and Statistics, 45, 1847-1864, 2016). However, they did not give explicit expressions for all the moments, tail behaviour, quantiles, survival and risk functions and order statistics. The TGEV distribution is a more flexible model than the simple GEV distribution to model extreme or rare events because the right tail of the TGEV is heavier than the GEV. In addition the TGEV distribution can adjusted various forms of asymmetry. In this article, explicit expressions for these measures of the TGEV are obtained. The tail behavior and the survival and risk functions were determined for positive gamma, the moments for nonzero gamma and the moment generating function for zero gamma. The performance of the maximum likelihood estimators (MLEs) of the TGEV parameters were tested through a series of Monte Carlo simulation experiments. In addition, the model was used to fit three real data sets related to financial returns.

Performance Analysis of Economic VaR Estimation using Risk Neutral Probability Distributions

  • Heo, Se-Jeong;Yeo, Sung-Chil;Kang, Tae-Hun
    • 응용통계연구
    • /
    • 제25권5호
    • /
    • pp.757-773
    • /
    • 2012
  • Traditional value at risk(S-VaR) has a difficulity in predicting the future risk of financial asset prices since S-VaR is a backward looking measure based on the historical data of the underlying asset prices. In order to resolve the deficiency of S-VaR, an economic value at risk(E-VaR) using the risk neutral probability distributions is suggested since E-VaR is a forward looking measure based on the option price data. In this study E-VaR is estimated by assuming the generalized gamma distribution(GGD) as risk neutral density function which is implied in the option. The estimated E-VaR with GGD was compared with E-VaR estimates under the Black-Scholes model, two-lognormal mixture distribution, generalized extreme value distribution and S-VaR estimates under the normal distribution and GARCH(1, 1) model, respectively. The option market data of the KOSPI 200 index are used in order to compare the performances of the above VaR estimates. The results of the empirical analysis show that GGD seems to have a tendency to estimate VaR conservatively; however, GGD is superior to other models in the overall sense.

LH-모멘트의 적정 차수 결정에 의한 설계홍수량 추정 ( I ) (Estimation of Design Flood by the Determination of Best Fitting Order of LH-Moments ( I ))

  • 맹승진;이순혁
    • 한국농공학회지
    • /
    • 제44권6호
    • /
    • pp.49-60
    • /
    • 2002
  • This study was conducted to estimate the design flood by the determination of best fitting order of LH-moments of the annual maximum series at six and nine watersheds in Korea and Australia, respectively. Adequacy for flood flow data was confirmed by the tests of independence, homogeneity, and outliers. Gumbel (GUM), Generalized Extreme Value (GEV), Generalized Pareto (GPA), and Generalized Logistic (GLO) distributions were applied to get the best fitting frequency distribution for flood flow data. Theoretical bases of L, L1, L2, L3 and L4-moments were derived to estimate the parameters of 4 distributions. L, L1, L2, L3 and L4-moment ratio diagrams (LH-moments ratio diagram) were developed in this study. GEV distribution for the flood flow data of the applied watersheds was confirmed as the best one among others by the LH-moments ratio diagram and Kolmogorov-Smirnov test. Best fitting order of LH-moments will be derived by the confidence analysis of estimated design flood in the second report of this study.

Prediction of sharp change of particulate matter in Seoul via quantile mapping

  • Jeongeun Lee;Seoncheol Park
    • Communications for Statistical Applications and Methods
    • /
    • 제30권3호
    • /
    • pp.259-272
    • /
    • 2023
  • In this paper, we suggest a new method for the prediction of sharp changes in particulate matter (PM10) using quantile mapping. To predict the current PM10 density in Seoul, we consider PM10 and precipitation in Baengnyeong and Ganghwa monitoring stations observed a few hours before. For the PM10 distribution estimation, we use the extreme value mixture model, which is a combination of conventional probability distributions and the generalized Pareto distribution. Furthermore, we also consider a quantile generalized additive model (QGAM) for the relationship modeling between precipitation and PM10. To prove the validity of our proposed model, we conducted a simulation study and showed that the proposed method gives lower mean absolute differences. Real data analysis shows that the proposed method could give a more accurate prediction when there are sharp changes in PM10 in Seoul.

확률 분포형의 극치 수문량 예측 능력 평가에 관한 연구 (A Study on the Estimation of Extreme Quantile of Probability Distribution)

  • 정진석;신홍준;안현준;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.399-400
    • /
    • 2017
  • 홍수나 가뭄 등 극치 현상의 통계분석 및 빈도해석에 있어 극치분포형이 널리 사용되고 있으며, 이러한 극치분포형의 특성을 이해하기 위해서는 분포형의 오른쪽 꼬리(right tail) 부분 특성을 자세히 분석할 필요가 있다. 이에 따라 본 연구에서는 Monte Carlo 모의를 통하여 다양한 극치분포형의 오른쪽 꼬리 부분의 통계적 특성 및 그 예측 능력을 연구하였다. 극치분포형으로는 우리나라 확률수문량 산정에 널리 활용되고 있는 generalized extreme value (GEV), Gumbel, generalized logistic 분포를 사용하였으며, 매개변수 산정 방법으로는 확률가중모멘트법을 사용하였다. 모의실험의 모분포로는 수문빈도해석에서 많이 사용되는 GEV 분포를 사용하였고, 30년 이상 자료를 보유한 기상청 지점 자료의 왜곡도를 조사하여 모의실험에 사용되는 모집단의 왜곡도로 가정하여 표본 자료를 발생시켰다. 예측 능력의 평가는 재현기간 10~1000년의 확률수문량을 왜곡도계수를 고려한 GEV 도시위치공식을 이용하여 GEV 확률지에 도시하고, 평균제곱근오차(root mean square error), 편의(bias), 평균상대오차(mean relative difference), 평균절대상대오차(mean absolute relative difference)를 이용하여 최적 분포형을 선정함으로써 이루어진다. 또한 예측 능력 평가결과의 타당성 확인을 위해 극치분포형의 적합정도를 잘 나타낸다고 알려진 modified Anderson-Darling 방법의 검정결과와 비교하여 적절성을 확인하였다.

  • PDF

모의 실험을 이용한 Right-tail quantiles의 극치 분포형 비교 평가에 관한 연구 (A Study on the Assessment of Right-tail Prediction Ability of Extreme Distributions using Simulation Experiment)

  • 정진석;김태림;송현근;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.158-158
    • /
    • 2016
  • 본 연구에서는 극치 분포의 오른쪽 꼬리 부분 예측 시 안정적인 확률수문량 산정하는 확률분포형과 매개변수 추정 방법을 평가하기 위해 Monte Carlo 모의를 수행하였다. 수문자료의 빈도해석에 적합한 것으로 알려진 generalized extreme value (GEV), Gumbel (GUM), generalized logistic (GLO), gamma3 (GAM3), normal (NOR), log-normal3 (LN3) 총 6개의 확률분포형을 바탕으로 오른쪽 꼬리 부분의 확률수문량 추정 성능을 모의 실험을 통해 평가하고자 한다. 30년 이상 자료를 보유한 기상청 지점의 지속기간별 연최대값 자료를 분석한 결과를 바탕으로 모분포를 GEV분포로 선정하였으며 평균이 1.0, 표준편차 0.5, 왜곡도 계수는 0.5, 1.0, 2.0, 3.0, 4.0이 되도록 가정하였다. 또한 자료 길이에 따른 성능 평가를 위해 표본 크기 20, 50, 100, 150, 200개에 대해 분석을 수행하였다. 위와 같은 가정으로 총 25종류(왜곡도계수 5개 ${\times}$ 표본 크기 5개)의 발생된 모분포에 6가지의 확률분포형과 3가지의 매개변수 추정방법(모멘트법, 최우도법, 확률가중모멘트법)을 조합한 18가지의 모델을 비교 분석해보았다. 평가방법으로는 평균 제곱근 오차(Root Mean Square Error, RMSE), 편의(bias), 평균 상대오차(Mean Relative Difference, MRD), 평균 절대 상대오차(Mean Absolute Relative Difference, MARD)를 사용하여 적용 모델의 성능을 비교 분석하였다.

  • PDF

Burr XII 모형을 이용한 우리나라 극한 강우자료 빈도해석 (Frequency Analyses for Extreme Rainfall Data using the Burr XII Distribution)

  • 서정호;신주영;정영훈;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.335-335
    • /
    • 2018
  • 최근 이상기후현상으로 지구상의 여러 지역에서 극치 수문 사상의 발생 빈도와 강도가 날로 증가하고 있는 추세이다. 이에 대해 수공구조물의 설계를 위한 극치강우사상의 빈도해석에 있어서 적절한 확률분포모형의 적용은 매우 중요하다. 이에 수문통계분야에서는 generalized extreme value(GEV), generalized logistic(GLO), Gumbel(GUM) 모형과 같은 극치 분포를 이용한 수문통계적 특성에 대한 접근이 주로 이루어지고 있다. 하지만 우리나라 강우 사상의 경우 GEV 분포와 GUM 분포가 비교적 적합한 것으로 알려져 있지만 하나의 형상매개변수를 가지고 있어 분포 모형이 표현할 수 있는 통계적 특성에 한계를 가지고 있다. 기존의 GEV나 GUM분포로는 적절히 재현되지 않는 자료들을 분석하기 위해서 두 개의 형상매개변수를 가지는 분포형에 대한 연구가 진행되고 있다. 이에 본 연구에서는 두 개의 형상매개변수를 가지는 Burr XII 분포형의 우리나라 극한 강우자료에 대한 적용성을 평가하였다. Burr XII 분포형은 gamma나 exponential 분포 모형처럼 양의 확률변수만을 가지고, Cauchy나 Pareto 분포 모형처럼 두꺼운 꼬리(heavy-tailed distribution) 형상을 나타내기 때문에 비교적 큰 확률변수가 빈번히 나타나는 극치사상에도 적합한 것으로 알려져 있다. 이를 위해 Burr XII 분포 모형을 이용하여 우리나라 강우자료에 대해 지점빈도해석 및 지역빈도해석을 수행하고 우리나라 강우자료에 비교적 적합하다고 알려진 분포인 GEV, GLO, GUM 분포형을 통해 산정된 결과와 비교하였다.

  • PDF

일반화 극단치분포를 이용한 일 최대 교통사고 분석 (An Analysis of Daily Maximum Traffic Accident Using Generalized Extreme Value Distribution)

  • 김준석;김대성;윤상후
    • 디지털융복합연구
    • /
    • 제18권10호
    • /
    • pp.33-39
    • /
    • 2020
  • 대형 교통사고는 많은 인명피해를 동반한다. 교통사고를 효율적으로 대처하기 위해선 하루 동안 발생할 수 있는 최대 교통사고 수와 사망자 수, 중상자 수가 정량적으로 제시되어야 한다. 본 연구는 교통사고분석시스템에서 제공하는 2005년부터 2018년까지 전국에서 발생한 일 최대 교통사고 수, 사망자 수, 중상자 수 자료를 사용하여 15년, 30년, 50년에 한 번 발생할 수 있는 최대값을 제시하고자 한다. 지역별 교통사고의 특성을 살펴보기 위해 수도권, 충청권, 경북권, 호남권, 경남권으로 구분하여 일반화극단치분포(GEV분포)에 적합시켰다. GEV분포의 모수는 L-적률추정법으로 추정하였고, Anderson Darling 검정과 Cramer-von Mises 검정으로 분포의 적합성을 확인하였다. 분석결과 50년에 한 번 발생할 수 있는 일 최대 교통사고 수는 수도권 401건, 경남권 168건, 경북권 455건, 충청권 136건, 호남권 205건이다. 인구수와 자동차 등록수가 많은 수도권에 비해 경북권은 면적이 넓고 산지지형이 많으며 산업공단으로 인한 물류이동이 많아 교통사고 수가 상대적으로 높게 나타났다.

GPD 기반의 유전자 알고리즘을 이용한 포트폴리오 최적화 (Finding optimal portfolio based on genetic algorithm with generalized Pareto distribution)

  • 김현돈;김현태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권6호
    • /
    • pp.1479-1494
    • /
    • 2015
  • 최적의 포트폴리오를 선택하기 위한 연구는 평균-분산모형을 시작으로 다양하게 진행되어 왔다. 과거에는 위험자산의 확률분포가 정규분포를 따른다고 가정하여, 투자자가 보유한 위험자산의 분산이 최소화되고 기대수익률이 최대가 되도록 포트폴리오를 구성하도록 하였다. 그러나 실제 위험자산의 분포에는 극단적인 사건들이 많이 발생하기 때문에 정규분포보다 훨씬 꼬리부분이 두꺼우며, 또한 왼쪽꼬리와 오른쪽꼬리가 대칭적이지도 않은 것으로 밝혀졌다. 이에 본 논문에서는 위험자산의 확률분포를 극단치 이론에서 널리 사용되는 일반화 파레토분포 (GPD)로 모형화하였고 체계적인 위험의 추정을 위하여 VaR를 이용하는 한편, 최적의 포트폴리오의 탐색을 위해서는 유전자 알고리즘을 사용하였다. 제안 방법의 적정성을 확인하기 위해 국내 증시에서 최적 포트폴리오를 탐색해 보았으며, 그 결과 GPD로 투자자산의 위험을 추정하였을 때 가장 좋은 결과를 얻을 수 있었다.