• Title/Summary/Keyword: 극단값

검색결과 53건 처리시간 0.023초

이항 신뢰구간에서 극단값의 영향 (The Influence of Extreme Value in Binomial Confidence Interval)

  • 류제복
    • Communications for Statistical Applications and Methods
    • /
    • 제18권5호
    • /
    • pp.615-623
    • /
    • 2011
  • 이항비율에 대한 구간추정에 다양한 신뢰구간들이 사용된다. 그러나 대부분의 신뢰구간들은 모비율 p가 0이나 1에 근사할 때 포함확률이 신뢰수준(또는 명목수준, 1 - ${\alpha}$)을 크게 벗어난다. 이는 극단적인 관찰값의 영향 때문이다. Vollset (1993), Agresti와 Coull (1998), Newcombe (1998), Brown 등 (2001) 등은 극단값의 조정을 통해서 이러한 문제를 해결하는 방법들을 제시하였다. 본 연구에서는 극단값들이 이항비율에 대한 신뢰구간에 어느 정도 영향을 미치는지를 6개의 신뢰구간들에 대해서 수치적으로 비교해 보았다.

공간 극단값의 분계점 모형 사례 연구 - 한국 여름철 강수량 (Threshold Modelling of Spatial Extremes - Summer Rainfall of Korea)

  • 황승용;최혜미
    • 응용통계연구
    • /
    • 제27권4호
    • /
    • pp.655-665
    • /
    • 2014
  • 폭염, 폭우와 가뭄 등과 같은 이상 기후 현상에 대한 적절한 대응이 최근 많이 요구되고 있다. 이상 기후 현상을 분석하기 위해 극단값 분석 기법을 적용할 수 있는데, 본 논문은에서는 한국의 여름철 강수량 자료(1973년부터 2012년까지의 5월부터 9월)를 분계점 초과값 모형으로 분석해보았다. 분계점은 한국의 기상관측소들을 5개의 군집으로 나누어, 각 군집별로 지리 정보와 시간을 공변량으로 하는 분위수 회귀 방법을 통하여 추정하였다. Northrop과 Jonathan (2011)과 같이 극단값들이 시공간적으로 독립이라고 가정하고 분석한 후, 추정오차와 검정 과정에 공간 종속성을 반영하였다.

조선시대 역사지진자료를 이용한 경주와 포항의 최근 지진규모 예측 (Prediction of recent earthquake magnitudes of Gyeongju and Pohang using historical earthquake data of the Chosun Dynasty)

  • 김준철;권숙희;장대흥;이근우;김영석;하일도
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.119-129
    • /
    • 2022
  • 본 논문에서는 최근 경주와 포항에서 심각한 피해를 주며 발생한 지진의 규모를 과거자료에 근거한 통계적 분석방법을 통해 예측하고자 한다. 이를 위해, 조선시대 역사지진 자료중에서 연단위 밀집도가 상대적으로 높은 1392~1771년의 5년 블록 최대 규모 자료를 이용하였다. 이 자료를 기반으로 일반화 극단값(generalized extreme value) 확률분포에 기초한 극단값 이론을 이용하여 조선시대 재현기간별 지진 규모 예측 및 분석을 제시하고자 한다. 일반화 극단값 분포의 모수추정을 위해 최대가능도추정법(maximum likelihood estimation, MLE)과 L-적률추정법(L-moments estimation, LME)을 사용한다. 특히 본 논문에서는 일반화 극단값 분포가 이러한 역사지진 자료에 대한 적절한 분석 모형이 될 수 있음을 적합도 검정(goodness-of-fit test)을 통해 보인다.

원/달러 환율 투자 손실률에 대한 극단분위수 추정 (Extreme Quantile Estimation of Losses in KRW/USD Exchange Rate)

  • 윤석훈
    • Communications for Statistical Applications and Methods
    • /
    • 제16권5호
    • /
    • pp.803-812
    • /
    • 2009
  • 금융자료에 극단값이론을 적용하는 것은 위험관리에서 중요한 최신 통계기법 중의 하나라고 할 수 있다. 극단값분석에서 전통적으로 사용해 오던 연간 최대값방법은 시계열자료의 연간 최대값들에 대하여 일반화 극단값분포를 적합시키는 것이고, 최근 대안으로 널리 사용되고 있는 분계점 방법은 시계열자료 중 충분히 큰 하나의 분계점을 넘어서는 초과값들에 대하여 일반화파레토분포를 적합시키는 것이다. 그러나, 보다 실질적인 방법은 분계점을 넘어서는 초과값들을 하나의 점과정으로 해석하는 것인데, 즉 초과값들의 초과시점과 초과여분을 점근적으로 비동질 포아송과정을 갖는 하나의 2차원 점과정으로 간주하는 것이다. 본 논문에서는 이러한 2차원 비동질 포아송과정 모형을 1982.1.4부터 2008.12.31까지 수집된 원/달러 환율 시계열자료로부터 계산된 일별 환율투자손실률, 즉 일별 로그 손실률에 적용한다. 여기서 주된 관심은 10년 혹은 50년에 한번 정도 발생하는 대형 손실률 수준과 같은 극단분위수를 어떻게 추정하느냐 하는 것이다.

극단 손실값들을 이용한 VaR의 추정과 사후검정: 사례분석 (Estimation of VaR Using Extreme Losses, and Back-Testing: Case Study)

  • 서성효;김성곤
    • 응용통계연구
    • /
    • 제23권2호
    • /
    • pp.219-234
    • /
    • 2010
  • 시가총액에 따른 인덱스(INDEX) 투자를 했을 경우에, VaR(Value at Risk)을 종합주가지수(KOSPI)로부터 얻은 수익율의 극단 손실값들로부터 추정한다. 이를 위해, 극단값 이론 중 BM(Block Maxima) 모형을 적용하며, 극단 손실값들의 비독립적 발생을 고려하기 위하여, extremal index 역시 추정한다. 모형의 타당성을 알아보기 위해, 실패율방법을 이용한 사후검정 (back-testing) 을 실시한다. 사후검정을 통해, BM 모형을 적용한 VaR의 추정이 적절함을 알 수 있었다. 또한, 일반적으로 많이 사용되는 GARCH 모형을 이용한 VaR의 추정과 비교한다. 이를 통해, 오차가 t-분포를 따른다고 가정하는 경우, GARCH 모형을 이용한 VaR의 추정이 BM 모형을 이용한 경우와 사후 검정결과에 차이가 없음을 확인하였다. 그러나, GARCH 모형을 통한 VaR 추정은 추정시점근방의 극단 손실값들에 민감하게 반응하지만, BM 모형은 그렇지 않았다. 따라서, 현 시점으로부터 단기간동안의 손실위험은 GARCH 모형을 이용한 VaR의 추정값을 사용하는 것이 적절하며, 장기간동안의 손실위험은 BM 모형으로부터 얻은 VaR의 추정값을 사용하는 것이 적절하다.

국제현물원유가의 일일 상승 및 하락율의 극단값 분석 (Analysis of Extreme Values of Daily Percentage Increases and Decreases in Crude Oil Spot Prices)

  • 윤석훈
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.835-844
    • /
    • 2010
  • 극단값 통계 분석의 도구로는 전통적인 연간 최대값 방법과 현대적인 분계점 방법, 그리고 분계점 방법을 개선한 변형체 등으로 분류할 수 있다. 연간 최대값 방법은 시계열자료의 연간 최대값들에 대하여 일반화극단값분포를 적합시키는 것이고, 분계점 방법은 충분히 큰 하나의 분계점을 넘어서는 초과값들의 초과여분들에 대하여 일반화파레토분포를 적합시키는 것이다. 분계점 방법의 한 변형체로서 본 논문에서는 분계점 방법에 추가적으로 초과값들의 전체 개수가 포아송분포를 따른다고 가정하는 포아송-GPD 방법을 다루고, 이를 1988.01.04부터 2009.12.31까지 수집된 서부텍사스산중질유의 현물가격 자료로부터 계산된 일일 상승율과 일일 하락율에 적용한다. 이에 따르면 일일 상승율과 일일 하락율의 분포는 정규분포와 달리 두터운 꼬리를 갖는 분포로 나타났는데, 이는 오늘날의 많은 금융 자료분석에서 나타나는 일반적인 현상과 잘 부합하는 것이다.

코스피 지수 자료의 베이지안 극단값 분석 (A Bayesian Extreme Value Analysis of KOSPI Data)

  • 윤석훈
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.833-845
    • /
    • 2011
  • 본 논문에서는 1998.01.03부터 2011.08.31까지 수집된 코스피 지수 자료로부터 계산된 일별 로그수익률과 일별 로그손실률에 대한 극단값 통계분석을 수행하였다. 사용된 극단값 통계분석 모형은 포아송-GPD 모형이고 모수의 추정과 극단분위수의 추정은 최대가능도 방법을 적용하였다. 본 논문에서는 또한 포아송-GPD 모형에 추가적으로 모수의 무정보사전분포를 가정한 베이지안 방법을 고려하였다. 여기서는 마르코프 연쇄 몬테칼로 방법을 적용하여 모수와 극단분위수를 추정하였다. 분석 결과 최대가능도 방법과 베이지안 방법에서 모두, 로그수익률 분포의 오른쪽 꼬리는 정규분포보다 짧은 반면, 로그손실률 분포의 오른쪽 꼬리는 정규분포보다 두텁다는 결론이 얻어졌다. 극단값 분석에서 베이지안 방법을 사용할 때의 장점은 정칙조건이 만족되지 않는 경우에도 최대가능도추정량의 전통적 점근 성질을 걱정할 필요가 없고 예측의 경우에는 모수의 불확실성과 미래 관측치의 불확실성이 모두 반영되는 효과가 있다는 것이다.

극단값 분포 추정을 위한 모수적 비모수적 방법 (Parametric nonparametric methods for estimating extreme value distribution)

  • 우승현;강기훈
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.531-536
    • /
    • 2022
  • 본 논문은 꼬리가 두꺼운 분포의 꼬리부분에 대한 분포를 추정할 경우 모수적 방법과 비모수적 방법의 성능에 대해 비교하였다. 모수적 방법으로는 일반화 극단값 분포와 일반화 파레토 분포를 이용하였고, 비모수적 방법은 커널형 확률밀도함수 추정방법을 적용하였다. 두 접근법의 비교를 위해 2014년부터 2018년까지 서울시 관측소별 일일 미세먼지 공공데이터를 이용하여 블록 최댓값 모형과 분계점 초과치 모형을 적용하여 함수 추정한 결과를 함께 보이고 2년, 5년, 10년의 재현수준을 통해 고농도의 미세먼지가 일어날 지역을 예측하였다.

경제조사에서의 이상치 탐지와 처리방법 (Outlier detection and treatment in industrial sampling survey)

  • 주영선;조교영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.131-142
    • /
    • 2016
  • 통계조사에서 이상치는 총계추정에 큰 영향을 줄 수 있다. 통계조사에서 보고된 값은 극단적이 아니지만 그것의 가중치 (weight)가 커서 추정값에 큰 영향을 주거나, 극단값이라 해도 그것이 작은 가중치를 가질 때 추정에 큰 영향을 주지 않는 경우도 있다. 이러한 극단값이나 추정에 영향을 주는 값 들은 표본조사에서 민감하다. 일반적으로 치우친 분포를 가진 모집단에서 추출된 표본으로 조사를 하는 사업체 조사에서는 특별히 더 큰 영향을 준다. 본 연구에서는, 우리는 이상치를 판별하고 처리하는 방법에 대해서 다루고자 한다. 이상치 판별은 분위수에 기초해서 판정하였으며, 판정된 이상치는 여러 가지 다양한 방법을 적용해 보았다. 연구에서는 2가지 winsorised 방법과 세가지 cut-off 방법에 대하여 적용하였다. 그리고 시뮬레이션에서는 4가지 방법의 가중치를 각각 적용하여 진행하였다. 여러 가지 이상치 처리방법들을 비교해 본 결과 type I 윈저화 방법보다는 type II 윈저화 방법이 효율적인 결과값을 보여주었으며, 가중치 변환방법들 중에서는 제곱근 변환을 통한 가중치 감소방법이 다른 처리방법에 비해 좋은 결과값을 보여주었다.

한국지역 집중호우에 대한 반환주기의 베이지안 모형 분석 (A Hierarchical Bayesian Modeling of Temporal Trends in Return Levels for Extreme Precipitations)

  • 김용구
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.137-149
    • /
    • 2015
  • 본 논문에서는 비정상 극치 강수 자료에 대해 계층적 베이지안 모형을 적용하여 시간에 따른 모수의 변화를 추정하며, 미래 확률 강수량에 대한 극단값 분포를 예측하고 더 나아가 반환기간에 대한 경향과 예측 값을 얻고자 한다. 이전의 고전적 통계 방법을 통한 강수 자료의 모수 추정연구의 경우, 자료의 정상성 가정 하에 고정된 모수를 추정하는 방법으로, 최근 나타난 비정상 강수 사상과 같이 강수량이 가지는 분포의 모수적 변화가 예상되는 경우 해석상 문제가 발생한다. 이러한 문제점을 해결하기 위해 모형의 관심모수에 시간에 따른 자기 상관 선형 회귀 함수를 적합한 계층적 베이지안 모형을 고려한다. 제안된 모형의 효율성을 확인하기 위해서 1973년부터 2011년까지 39년 동안의 우리나라 여러지역의 기상 관측소에서 관측된 일일 강우량 자료가 사용하여 대표적인 극단값 분포인 Generalized Extreme Value(GEV) 분포에 적합시키고, 계층적 베이지안 모형을 이용하여 이들 분포의 모수들에 자기상관 시간모형을 소개한 후 우리나라 여러지역에 대한 반환기간에 대한 시간에 따른 경향을 확인하였다.