• 제목/요약/키워드: 극단치 자료

검색결과 24건 처리시간 0.018초

코퓰러과 극단치이론을 이용한 위험척도의 추정 및 성과분석 (Estimation and Performance Analysis of Risk Measures using Copula and Extreme Value Theory)

  • 여성칠
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.481-504
    • /
    • 2006
  • 금융위험의 측정 및 관리를 위한 도구로서 분포의 꼬리 부분과 관련한 위험척도로 VaR가 현재 널리 활용되고 있다. 특히 VaR의 정확한 추정을 위해 정규분포를 가정한 기존의 방법보다는 극단치이론을 이용한 방법이 최근 관심을 끌고 있다. 지금까지 극단치이론을 이용한VaR의 추정에 관한 연구는 대부분 단변량의 경우에 대해 이루어졌다. 본 논문에서는 코퓰러를 극단치이론에 결부시켜 다변량 극단치분포를 모형화하여 포트폴리오 위험측정을 다루고 있다. 특히 본 연구에서는 포트폴리오 위험 척도로 VaR와 더불어 ES에 대한 추정 방법도 함께 논의하였다. 포트폴리오 위험측정을 위한 방법으로 본 논문에서 논의한 코퓰러-극단치이론에 의한 접근방법이 기존의 분산-공분산 방법보다 상대적으로 우수한지를 실증자료에 대한 사후검증을 통해 살펴보았다.

재무비율의 극단치에 대한 통계적 분석 (Statistical Analysis of Extreme Values of Financial Ratios)

  • 주지환
    • 지식경영연구
    • /
    • 제22권2호
    • /
    • pp.247-268
    • /
    • 2021
  • 투자자들은 기업가치를 평가하기 위하여 재무비율을 활용하는데 특히 PER과 PBR은 적정 기업가치를 판단하는데 중요한 역할을 하는 대표적인 수치로 알려져 있다. 금융자료는 꼬리가 매우 두터운 형태의 분포를 따르는 경우가 많은데, PER과 PBR은 첨도가 매우 높으며 해당 재무비율의 극단치들은 기업의 다양한 이해관계자들의 의사결정 시 중요한 역할을 한다. 본 논문에서는 통계학의 극단치이론에서 주로 활용되는 GPD와 최근 새롭게 제안된 분포인 exGPD를 도입하고, 두 분포 간의 성능을 비교하기 위해 시뮬레이션을 수행하여 적합도를 살펴본 후 우측 꼬리에 속하는 90, 95, 99% 퍼센타일 값을 추정하여 실제 값과 비교한다. 다음으로 국내 증권시장에 상장된 정보기술군(IT) 기업들의 PER, PBR 자료에 근거하여 실증분석을 수행한다. 분석 결과 특히 PBR에서 exGPD가 GPD에 비해 자료의 우측 꼬리 영역을 보다 효과적으로 설명함을 확인하였다. 따라서, 재무비율에 기반한 기업가치평가 또는 위험관리 시 극단치의 특성을 효과적으로 반영할 수 있는 exGPD와 같은 분포를 활용한다면 꼬리 영역에 담긴 정보를 보다 정확하게 파악할 수 있다. 이는 기업 내부 위험관리자의 효과적인 지식경영을 돕고, 투자자를 비롯하여 다양한 외부 이해관계자들에게 유용한 지식을 제공할 수 있다.

운영 위험 관련 손실 분포 - 퍼지 히스토그램의 효과 (Fuzzy histogram in estimating loss distributions for operational risk)

  • 박노진
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권4호
    • /
    • pp.705-712
    • /
    • 2009
  • 히스토그램이 활용의 간편성과 자료의 전체적 구조를 한 눈에 볼 수 있는 정보량을 제공하지만 히스토그램의 계급 구간의 설정에 따라 그 표현이 달라 질 수 있는 문제가 있다. 이러한 문제를 해결하기 위해 퍼지 개념을 활용한 히스토그램이 제안되었고 그 효과가 제시되었다 (Loquin과 Strauss, 2008). 히스토그램이 다양한 분야에서 사용되지만 요즘 운영 위험과 관련된 손실 분포를 추정함에 있어서 유용하게 사용되고 있다. 그런데, 임계치를 활용한 극단치 확률 함수 추정에 사용함에 있어 임계치의 선택에 따른 히스토그램의 모양 변화는 그 활용을 어렵게 하는 경향이 있다. 본 연구는 퍼지히스토그램을 손실에 대한 극단치 분포를 추정에 사용할 경우 임계치의 선택에 따른 전체적 모양의 차이가 일반적인 히스토그램 보다 크지 않아 상대적으로 안정된 분포를 추정할 수 있음을 보였다.

  • PDF

태풍이 일 최대강수량에 미치는 영향 평가 (Evaluation of the impact of typhoon on daily maximum precipitation)

  • 양미연;윤상후
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1415-1425
    • /
    • 2017
  • 태풍은 강한 바람과 폭우를 동반하며 매년 한반도에 인명과 재산피해의 원인이 된다. 국내에서 발생한 자연재해 피해에서 태풍이 차지하는 비중이 높다. 태풍의 많은 피해는 폭우에 의해 발생하므로 태풍이 일 최대강수량에 미치는 영향을 정량적으로 살펴볼 필요가 있다. 일 최대강수량은 극치자료로 일반적으로 일반화극단치분포를 따른다. 연구자료로 1976년부터 2016년까지 한반도에 설치된 60개 종관기상관측장비에서 수집된 일강수량, 최대풍속, 평균풍속 자료가 사용되었다. 태풍이 온 기간을 제외한 일강우량 자료와 태풍이 온 기간을 포함한 일강우량 자료로 구분하여 일반화극단치모형에 적합시켰다. 모수추정방법으로 최우추정법과 L-적률추정법이 이용되었다. K-S검정과 $Cram{\acute{e}}r$ von Mises검정을 통해 모형의 적합도를 검정하였다. 추정된 모수를 기반으로 25년, 50년, 100년, 200년 재현수준을 계산하였다. 태풍기간 포함유무에 따른 재현수준을 비교한 결과 태풍은 강릉 인근의 동해안과 울산과 완도 인근의 남해안의 일 최대강수량에 영향을 미친다.

코플라함수를 이용한 극단치 강풍과 강수 분석 (Analysis of extreme wind speed and precipitation using copula)

  • 권태용;윤상후
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권4호
    • /
    • pp.797-810
    • /
    • 2017
  • 한반도는 매년 태풍의 위험에 노출되어 있다. 태풍은 강풍과 강우가 동반되는 열대성 저기압으로 사회 경제적으로 막대한 피해를 유발한다. 현재의 자연재해 경고 시스템은 풍속과 강우를 구분하여 위험을 감지토록 설계되어 강풍과 폭우를 동반한 태풍의 위험을 경고하는데 한계점이 존재한다. 코플라모형은 확률변수들 사이의 복잡한 의존성 구조를 파악하기 위해 단변량분포의 집합을 다변량분포로 연결하는 모형으로 강우, 홍수, 가뭄 등의 분야에서 활발하게 연구되고 있다. 본 연구에서는 한반도에서 태풍에 가장 많이 노출된 도시인 부산과 제주도의 기상 관측소 (ASOS)에서 수집된 1904년 4월 9일부터 2015년 12월 31일까지 일강수량 (precipitation), 일최대풍속 (maximum wind speed) 자료를 이용하였다. 각 변수의 주변부확률을 추정하기 위해 두꺼운 꼬리 분포인 로그정규분포, 감마분포, 와이블분포를 고려하였다. 주변부 확률분포의 적합성검정은 Kolmogorov-Smirnov와 Cramervon-Mises, Anderson-Darling 검정통계량을 이용하였다. 코플라모형을 위해 순위를 기반으로 한 유사자료 (pseudo observation)를 생성하여 두 변수 간 의존성을 추정하였다. 강풍과 폭우의 의존성을 설명하기 위한 코플라모형으로 타원형, 나선형, 극단치 코플라모형이 고려되었다. 코플라모형의 적합성은 Cramer-von-Mises로 검정하였고, 교차검증을 통해 최적모형을 선택하였다. 연구결과 일강우량과 풍속의 주변부 확률분포로 대부분 로그정규분포가 적합하였다. 부산의 일평균풍속에 따른 일강우량은 t 코플라, 일최대풍속에 따른 일강우량은 Clayton 코플라가 최적모형으로 선정되었다. 제주도의 일최대풍속에 따른 일강우량은 정규코플라, 일강우량에 따른 일평균풍속은 Frank 코플라, 일강우량에 따른 일최대풍속은 Husler-Reiss 코플라가 최적모형으로 선택되었다.

데이터 마이닝을 이용한 고혈압환자의 당뇨질환 동반에 관한 데이터 질 관리 알고리즘 개발 (Developing data quality management algorithm for Hypertension Patients accompanied with Diabetes Mellitus By Data Mining)

  • 황규연;이은숙;김고원;홍성옥;박정선;곽미숙;이예진;임채혁;박태현;박종호;강성홍
    • 디지털융복합연구
    • /
    • 제14권7호
    • /
    • pp.309-319
    • /
    • 2016
  • 보건의료데이터의 질적 수준을 향상시키기 위해서는 데이터 질 관리 알고리즘을 개발할 필요성이 있다. 이에 본 연구에서는 질환의 유병률, 입원율이 높은 고혈압 환자의 당뇨질환 동반에 관련된 데이터 질 관리 알고리즘을 개발하고자 하였다. 이를 위해 2011년, 2012년 퇴원손상심층조사 자료 중 고혈압 환자 61,199건을 추출하여 분석대상으로 하였다. 데이터 마이닝의 대화식 의사결정나무 방법과 Outlier Detection 방법론을 통해 데이터 질 관리 알고리즘 개발한 결과 고혈압 환자가 당뇨병을 동반상병으로 가지는데 영향을 미치는 요인으로는 성별, 연령, 당뇨병성 사구체 장애, 당뇨병성 망막병증, 당병성 다발성 신경병증 등이 있었다. 의사결정나무 결과에 따라 당뇨병을 동반상병으로 가질 확률 값이 80% 이상이거나, 20% 이하인 집단을 Outlier(극단치)로 정의하고, 고혈압 환자의 당뇨 동반에 대한 극단치를 가지는 6개 집단을 발견하였다. 이와 같이 Outlier(극단치) 집단에 포함되는 실제 데이터를 확인하여 데이터의 질적 수준을 향상 시킬 필요가 있다.

POT방법론을 이용한 자동차보험 손해율 추정 (Estimation of Car Insurance Loss Ratio Using the Peaks over Threshold Method)

  • 김수영;송종우
    • 응용통계연구
    • /
    • 제25권1호
    • /
    • pp.101-114
    • /
    • 2012
  • 자동차보험의 손해율이란 지급보험금의 수입보험료에 대한 비율을 의미한다. 손해율이 매우 큰 값을 갖는 대형손실이 일어나는 경우에는 보험회사의 재무적인 부분에 큰 악영향을 미치게 된다. 따라서 보험회사가 이에 대비할 수 있도록 하기 위하여 손해율의 극단 분위수(extreme quantile)를 추정하는 것은 매우 중요한 일이다. 다른 종류의 보험 관련 데이터와 같이 손해율의 분포는 오른쪽으로 긴 꼬리를 갖는 두꺼운 꼬리분포(heavy-tailed distribution)를 갖는다. 이런 자료에서 극단 분위수룰 추정하기 위하여 가장 많이 사용되는 방법론은 POT(Peaks over threshold)와 Hill 추정(Hill estimation)이다. 본 논문에서는 일반화파레토분포(generalized Pareto distribution; GPD)의 다양한 모수추정방법론의 성능을 모의실험과 실제 손해율 데이터를 사용하여 비교, 분석하였다. 또한 Hill 추정치를 사용하여 극단 분위수를 추정하였다. 그 결과 대부분의 경우에 POT 방법론이 Hill 추정치를 이용한 방법보다 정확한 분위수를 추정하였고, 모수추정방법론 중에서는 MLE, Zhang, NLS-2 방법론이 가장 좋은 결과를 보여주었다.

GEV 분포를 이용한 대구·경북 지역 일산화탄소 농도 추정 (The estimation of CO concentration in Daegu-Gyeongbuk area using GEV distribution)

  • 류수락;엄은진;권태용;윤상후
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.1001-1012
    • /
    • 2016
  • 대기오염물질이 인간의 건강에 악영향을 미치는 사실은 잘 알려져 있다. 유엔 환경 계획 (united nations environment program; UNEP) 보고서에 따르면, 미세먼지와 일산화탄소 오염물질로 연간 전 세계에서 430만 명이 목숨을 잃었다. 일산화탄소는 탄소와 산소로 구성된 화합물로 가정에서 생성되는 독성 가스 중 가장 위험한 가스이다. 연구를 위하여 2004년부터 2013년까지 10년간 대구 경북 지역의 대기오염관측소에서 관측된 1시간, 6시간, 12시간, 24시간 평균 일산화탄소 농도 자료를 사용하였다. 일반화 극단치 분포의 모수는 최우추정법과 L-적률추정법을 통해 추정하였고 적합도 검정을 수행하였다. 본 연구의 표본 수가 크지 않으므로 L-적률추정법이 최대우도법에 비해 모수추정에 적합하였다. 또한, 5년, 10년, 20년, 40년 재현수준을 추정하여 대구 경북 지역 일산화탄소 위험지역을 살펴보았다.

코스피 지수 자료의 베이지안 극단값 분석 (A Bayesian Extreme Value Analysis of KOSPI Data)

  • 윤석훈
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.833-845
    • /
    • 2011
  • 본 논문에서는 1998.01.03부터 2011.08.31까지 수집된 코스피 지수 자료로부터 계산된 일별 로그수익률과 일별 로그손실률에 대한 극단값 통계분석을 수행하였다. 사용된 극단값 통계분석 모형은 포아송-GPD 모형이고 모수의 추정과 극단분위수의 추정은 최대가능도 방법을 적용하였다. 본 논문에서는 또한 포아송-GPD 모형에 추가적으로 모수의 무정보사전분포를 가정한 베이지안 방법을 고려하였다. 여기서는 마르코프 연쇄 몬테칼로 방법을 적용하여 모수와 극단분위수를 추정하였다. 분석 결과 최대가능도 방법과 베이지안 방법에서 모두, 로그수익률 분포의 오른쪽 꼬리는 정규분포보다 짧은 반면, 로그손실률 분포의 오른쪽 꼬리는 정규분포보다 두텁다는 결론이 얻어졌다. 극단값 분석에서 베이지안 방법을 사용할 때의 장점은 정칙조건이 만족되지 않는 경우에도 최대가능도추정량의 전통적 점근 성질을 걱정할 필요가 없고 예측의 경우에는 모수의 불확실성과 미래 관측치의 불확실성이 모두 반영되는 효과가 있다는 것이다.

일반화 극단치분포를 이용한 일 최대 교통사고 분석 (An Analysis of Daily Maximum Traffic Accident Using Generalized Extreme Value Distribution)

  • 김준석;김대성;윤상후
    • 디지털융복합연구
    • /
    • 제18권10호
    • /
    • pp.33-39
    • /
    • 2020
  • 대형 교통사고는 많은 인명피해를 동반한다. 교통사고를 효율적으로 대처하기 위해선 하루 동안 발생할 수 있는 최대 교통사고 수와 사망자 수, 중상자 수가 정량적으로 제시되어야 한다. 본 연구는 교통사고분석시스템에서 제공하는 2005년부터 2018년까지 전국에서 발생한 일 최대 교통사고 수, 사망자 수, 중상자 수 자료를 사용하여 15년, 30년, 50년에 한 번 발생할 수 있는 최대값을 제시하고자 한다. 지역별 교통사고의 특성을 살펴보기 위해 수도권, 충청권, 경북권, 호남권, 경남권으로 구분하여 일반화극단치분포(GEV분포)에 적합시켰다. GEV분포의 모수는 L-적률추정법으로 추정하였고, Anderson Darling 검정과 Cramer-von Mises 검정으로 분포의 적합성을 확인하였다. 분석결과 50년에 한 번 발생할 수 있는 일 최대 교통사고 수는 수도권 401건, 경남권 168건, 경북권 455건, 충청권 136건, 호남권 205건이다. 인구수와 자동차 등록수가 많은 수도권에 비해 경북권은 면적이 넓고 산지지형이 많으며 산업공단으로 인한 물류이동이 많아 교통사고 수가 상대적으로 높게 나타났다.