• 제목/요약/키워드: extreme value index

검색결과 52건 처리시간 0.029초

로그-정규분포와 파레토 합성 분포의 임계점 추정 (Threshold estimation for the composite lognormal-GPD models)

  • 김보배;노지숙;백창룡
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.807-822
    • /
    • 2016
  • LN-GPD 합성 분포는 몸통부분은 로그-정규분포를 두터운 꼬리에 대해서는 GPD분포를 따르도록 합성한 분포로 두터운 몸통과 꼬리를 동시에 가지는 자료를 절삭없이 효율적으로 다룰 수 있는 분포이다. 하지만 임계점을 포함하고 있기에 최대우도추정량은 매우 불안정함이 잘 알려져 있어 본 논문이서는 이를 극복하기 위해서 임계점을 먼저 추정하고 나머지 모수들에 대해서 따로 추정하는 2단계 추정 방법들에 대해서 살펴보고 그 성능을 비교해 보았다. 그 결과 동시 추정하는 최대우도추정량의 경우 불안정한 추정이 GPD 분포의 꼬리 지수에서 두드러 졌으며 임계점에 대해서는 비교적 잘 추정함을 알 수 있었다. 이와 반대로 여러 비모수적인 방법들은 꼬리 지수는 만족스럽게 잘 추정하였으나 임계점의 경우 편의가 있음을 관찰할 수 있었다. 실증자료 분석을 위해 2단계 추정법을 이스라엘 은행의 콜센터에서 수집한 서비스 시간에 대한 자료에 적합해 보았으며 그 결과 LN-GPD 합성 분포를 사용하는 것이 로그-정규분포 혹은 GPD 분포 단독으로 사용하는 것보다 자료의 손실도 없이 더 좋은 적합도를 보임을 알 수 있었다.

식생지수를 활용한 LULUCF 정주지 온실가스 인벤토리 산정을 위한 수목탐지 방법 개발 (Development of Tree Detection Methods for Estimating LULUCF Settlement Greenhouse Gas Inventories Using Vegetation Indices)

  • 이준우;한유한;이정택;박진혁;김근한
    • 대한원격탐사학회지
    • /
    • 제39권6_3호
    • /
    • pp.1721-1730
    • /
    • 2023
  • 전 세계적으로 지구온난화와 관련된 문제인식이 대두되면서, 도시지역에서의 탄소중립을 위해 탄소흡수원의 역할이 더욱 강조되고 있다. 정주지 탄소흡수원의 관리를 위해서는 탄소흡수원의 현황 파악이 필요하며, 이를 위해서는 많은 인력과 시간과 이에 따른 예산이 소요되게 된다. 본 연구에서는 서울시를 대상으로 기구축된 수목의 위치정보와 Sentinel-2 위성영상을 이용해 수목의 위치를 예측할 수 있는 지도를 제작했다. 이를 위해 수목 유무 데이터셋을 구축한 뒤 위성영상으로부터 구축한 식생지수 16종 정보를 이용하여 분석에 활용할 정형데이터를 생성했다. 그리고 생성된 정형데이터에 Extreme Gradient Boosting (XGBoost) 모델을 적용하여 학습 후, 수목 예측 지도를 제작했다. 이후 Shapley Additive exPlanations (SHAP) 분석을 통해 모델 학습에서 독립변수와 종속변수 간의 관계를 조사하였다. 서울의 국소 부분에 대해 제작된 지도와 세분류 토지피복지도와의 비교분석을 수행했고, 본 연구에서 제작된 수목 예측 모델의 경우 대로변 주변의 탐지하기 어려운 가로수의 경우에도 수목의 위치로 예측이 된다는 것을 확인했다.

A Study at Investigating the Climate Change in East Asia with Changing Sea Surface Temperature

  • Park, Geun-Yeong;Lim, Yong-Jae
    • 통합자연과학논문집
    • /
    • 제13권1호
    • /
    • pp.27-33
    • /
    • 2020
  • The unsustainable human activities like increased use of automobiles, heavy industrialization and the use of large volumes of fertilizers, chemicals and pesticides in the agricultural land cause climate change problems in one way or another. Under normal circumstances, the heat radiations from the sun will be reflected back. An excessive volume of GHGs in the atmosphere would prevent these radiations from reflecting back. East Asia is facing severe climate change issues in recent times. A lot of climate change problems such as hurricanes and floods have been reported from this region in the last couple of decades. The study aimed at investigating the climate change in East Asia with changing Sea Surface Temperature (SST). The study adopted a quantitative research method with a case study research design where a deliberate focus was made on the East Asia Region. Secondary data was gathered and analyzed to yield both descriptive and inferential statistics. The study concluded that the impact of East Asia Climate variability was significant mainly for some extreme events. Also, the study concluded that there was a significant link between the change of the East Asia climate variability and that of the sea surface temperature. Further, the study concluded that a linear relationship existed between the sea surface temperature and the climate of East Asia. Hence, a linear regression was a significant predictor of the East Asia Climate (EAC) based on changing sea surface temperature. The model revealed that 37.4% of the variations in the climate change index were explained by the changes in the sea surface temperature. The climate was expected to change with a value of 49.48 for a unit change in the sea surface temperature.

Prediction of spatio-temporal AQI data

  • KyeongEun Kim;MiRu Ma;KyeongWon Lee
    • Communications for Statistical Applications and Methods
    • /
    • 제30권2호
    • /
    • pp.119-133
    • /
    • 2023
  • With the rapid growth of the economy and fossil fuel consumption, the concentration of air pollutants has increased significantly and the air pollution problem is no longer limited to small areas. We conduct statistical analysis with the actual data related to air quality that covers the entire of South Korea using R and Python. Some factors such as SO2, CO, O3, NO2, PM10, precipitation, wind speed, wind direction, vapor pressure, local pressure, sea level pressure, temperature, humidity, and others are used as covariates. The main goal of this paper is to predict air quality index (AQI) spatio-temporal data. The observations of spatio-temporal big datasets like AQI data are correlated both spatially and temporally, and computation of the prediction or forecasting with dependence structure is often infeasible. As such, the likelihood function based on the spatio-temporal model may be complicated and some special modelings are useful for statistically reliable predictions. In this paper, we propose several methods for this big spatio-temporal AQI data. First, random effects with spatio-temporal basis functions model, a classical statistical analysis, is proposed. Next, neural networks model, a deep learning method based on artificial neural networks, is applied. Finally, random forest model, a machine learning method that is closer to computational science, will be introduced. Then we compare the forecasting performance of each other in terms of predictive diagnostics. As a result of the analysis, all three methods predicted the normal level of PM2.5 well, but the performance seems to be poor at the extreme value.

Hybrid machine learning with HHO method for estimating ultimate shear strength of both rectangular and circular RC columns

  • Quang-Viet Vu;Van-Thanh Pham;Dai-Nhan Le;Zhengyi Kong;George Papazafeiropoulos;Viet-Ngoc Pham
    • Steel and Composite Structures
    • /
    • 제52권2호
    • /
    • pp.145-163
    • /
    • 2024
  • This paper presents six novel hybrid machine learning (ML) models that combine support vector machines (SVM), Decision Tree (DT), Random Forest (RF), Gradient Boosting (GB), extreme gradient boosting (XGB), and categorical gradient boosting (CGB) with the Harris Hawks Optimization (HHO) algorithm. These models, namely HHO-SVM, HHO-DT, HHO-RF, HHO-GB, HHO-XGB, and HHO-CGB, are designed to predict the ultimate strength of both rectangular and circular reinforced concrete (RC) columns. The prediction models are established using a comprehensive database consisting of 325 experimental data for rectangular columns and 172 experimental data for circular columns. The ML model hyperparameters are optimized through a combination of cross-validation technique and the HHO. The performance of the hybrid ML models is evaluated and compared using various metrics, ultimately identifying the HHO-CGB model as the top-performing model for predicting the ultimate shear strength of both rectangular and circular RC columns. The mean R-value and mean a20-index are relatively high, reaching 0.991 and 0.959, respectively, while the mean absolute error and root mean square error are low (10.302 kN and 27.954 kN, respectively). Another comparison is conducted with four existing formulas to further validate the efficiency of the proposed HHO-CGB model. The Shapely Additive Explanations method is applied to analyze the contribution of each variable to the output within the HHO-CGB model, providing insights into the local and global influence of variables. The analysis reveals that the depth of the column, length of the column, and axial loading exert the most significant influence on the ultimate shear strength of RC columns. A user-friendly graphical interface tool is then developed based on the HHO-CGB to facilitate practical and cost-effective usage.

Modified Surface Water Supply Index의 입력인자와 적용 확률분포에 따른 영향과 불확실성 분석 (Effect and uncertainty analysis according to input components and their applicable probability distributions of the Modified Surface Water Supply Index)

  • 장석환;이재경;오지환;조준원
    • 한국수자원학회논문집
    • /
    • 제50권7호
    • /
    • pp.475-488
    • /
    • 2017
  • 정확히 가뭄을 모의하기 위해서는 수문기상학적 현상을 반영할 수 있는 가뭄지수가 필요하며, 국내에서 수문학적 가뭄을 모의하기 위해 MSWSI (Modified Surface Water Supply Index)를 활용한 여러 연구가 진행되었다. 본 연구에서는 MSWSI의 한계점을 분석하고 MSWSI의 불확실성을 정량화하였다. 우선 MSWSI 인자로서 활용가능한 수문기상인자의 선정에 따른 영향을 분석하였다. 기존 MSWSI에 적용한 하천유량, 지하수위, 강수, 댐유입량의 4개 입력인자별로 하나의 관측소자료만을 이용하였으나 본 연구에서는 중권역별 특성에 맞도록 댐저수위와 댐방류량도 포함하였으며, 여러 관측소의 자료를 취득하여 면적평균자료를 사용하였다. 2001년과 2006년 가뭄사례에 대해 MSWSI 모의검증 결과, 본 연구의 MSWSI가 실측수문기상자료의 경향을 더 잘 반영하여 가뭄을 모의하였으며, MSWSI 인자의 선정이 가뭄모의 정확성에 영향을 주는 것으로 나타났다. 다음으로 MSWSI 인자에 적용하는 확률분포의 선정에 따른 영향을 분석하였다. 강수자료는 Gumbel와 GEV 분포, 하천자료는 정규분포와 Gumbel 분포, 댐자료는 2-매개변수 대수정규분포와 Gumbel, 지하수는 3-매개변수 대수정규분포를 따르는 것으로 나타났다. 이에 따라 중권역별로 최대 36개의 MSWSI를 산정하였으며, 확률분포의 선정에 따라 MSWSI 범위가 매우 다르게 나타나 어떠한 확률분포을 적용하느냐에 따라 MSWSI 결과는 매우 달라질 수 있음을 확인하였다. 마지막으로 maximum entropy를 이용하여 MSWSI 입력인자의 선정과 입력인자별 확률분포 선정의 영향에 따른 불확실성을 정량화하였다. 분석결과, 입력인자의 수가 많이 적용될수록 불확실성은 증가하는 것으로 나타났으며, 홍수기에 MSWSI 입력인자별 확률분포 적용에 따라 MSWSI의 불확실성이 증가하는 것으로 나타났다.

Effects of Conditioners (Standard, Long-Term and Expander) on Pellet Quality and Growth Performance in Nursery and Finishing Pigs

  • Johnston, S.L.;Hines, R.H.;Hancock, J.D.;Behnke, K.C.;Traylor, S.L.;Chae, B.J.;Han, In K.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제12권4호
    • /
    • pp.558-564
    • /
    • 1999
  • A series of experiments were conducted to determine the effects of standard (ST), long-term (LT), and expander (EX) conditioners on nutritional value of phase-three nursery and finishing swine diets. In Exp. 1, 180 pigs (average initial BW of 11.7 kg) were fed com-soybean meal based diets (1.3% lysine) during a 28 d growth assay. Gain/feed was improved (p<0.004) with pelleting and pellet durability index (PDI) increased with degree of conditioning (LT>ST). However, there was no advantage for LT vs ST conditioning in rate or efficiency of gain (p>0.5). In Exp. 2, 180 pigs (average initial BW of 10.4 kg) were fed con-soybean meal based diets (0.9% lysine) during a 28 d growth assay, Pelleted diets tended to support greater ADG (p<0.08) and gain/feed (p<0.002) with no marked advantage from EX vs ST conditioning. In Exp 3, a total of 70 barrows (average initial BW of 54 kg) was used in a growth assay to determine the effects of feeding a com-soybean meal based diet processed with a standard (ST) steam conditioner, a long-term (LT) steam conditioner, and an expander (EX) conditioner. The conditioned diets were fed as mash (M) or pellets (P) to give a $2{\times}3$ factorial plus a meal control. PDI increased with degree of conditioning (EX>LT>ST). There was a trend (p<0.07) for greater ADG in pigs fed diets that had been thermally conditioned. Also, there was a general advantage in gain/feed with pelleting (p<0.04), but this advantage was pronounced only with standard conditioning. Indeed, the greatest gain/feed was observed for pigs fed the expander treatments (p<0.03) and the expander mash was used as efficiently as the expander pellets. There was no difference in backfat thickness among pigs fed the treatments (p>0.3). but the more extreme the processing technique. the greater the incidence and severity of stomach lesions (p<0.04). These results suggest maximum rate and efficiency of growth with pelleting after standard steam conditioning or simply feeding an expanded mash.

온열질환자 예측을 위한 최적의 지표 분석 (Analysis of Optimal Index for Heat Morbidity)

  • 김상혁;송민주;윤석환;이동근
    • 환경영향평가
    • /
    • 제33권1호
    • /
    • pp.9-17
    • /
    • 2024
  • 본 연구의 목적은 온열질환자를 설명, 예측하기 위한 최적의 폭염 관련 지표를 선정하고 예측하여 실효성을 확인하는 것이다. 2021년부터 2023년까지의 온열질환 응급실감시체계 데이터와 기상청 AWS 데이터를 기반으로 일 평균 기온, 일 최고 기온, 일 평균 WBGT, 일 최고 WBGT 값을 계산하여 회귀분석을 진행하였다. 분석 결과 네 가지 지표 중 일 최고 WBGT가 R2 값 0.81, RMSE 0.98로 가장 적합한 지표로 나타났으며 그 임계값은 29.94도로 나타났다. 전체 분석 기간 중 해당 임계값을 초과하는 날은 총 91일이었으며 이 때 발생한 환자수는 339명으로 나타났다. 일 최고 WBGT의 회귀식을 통해 2021년부터 2023년까지의 온열질환자 수를 예측한 결과 매년 10명 미만의 오차를 보여 정확성이 상당히 높은 것을 확인할 수 있었다. 지속적인 연구를 통해 데이터 및 분석 방법을 고도화한다면, 폭염 피해를 예측 및 저감하는데 도움이 될 수 있을 것이다.

머신 러닝을 활용한 회사 SNS 메시지에 내포된 심리적 거리 추출 연구 (A Study on the Extraction of Psychological Distance Embedded in Company's SNS Messages Using Machine Learning)

  • 이성원;김진혁
    • 경영정보학연구
    • /
    • 제21권1호
    • /
    • pp.23-38
    • /
    • 2019
  • 소셜 네트워크 서비스(이하 SNS)는 회사의 마케팅 채널로 적극 활용되고 있으며, 회사들의 고객층에 적합한 내용과 어조를 활용하여 주기적으로 SNS 메시지를 작성하는 등 활발한 마케팅을 펼치고 있다. 본 논문에서는 이제까지 간과되었던 SNS 메시지에 내포된 심리적 거리에 초점을 맞춰 전통적인 코더를 활용한 내용 분석(content analysis)과 자연어 처리 기법 및 머신 러닝 방법을 혼합하여 심리적 거리를 측정하는 분석 방법을 연구하였다. SNS 메시지의 심리적 거리 분석을 위해 코더들을 활용하여 내용분석을 수행하였으며, 이와 같은 방법으로 레이블링된 데이터를 자연어 처리 방법을 이용하여 워드 임베딩을 수행함으로써 머신 러닝 수행을 위한 입력 데이터를 마련하였다. 머신 러닝 분석법 중 Support Vector Machine(SVM)을 이용하여 SNS 메시지와 심리적 거리 간의 관계를 학습시켰으며, 마지막으로 테스트 데이터를 이용하여 심리적 거리를 예측함으로써 머신 러닝 분석의 성과를 검증하였다. 심리적 거리측정 방법론 수행 결과, 코더들의 내용분석 결과가 특정 값으로 편향되어 SVM 예측의 민감도와 정밀도가 낮은 결과가 도출되었다. 심리적 거리 응답 비율을 보정하고 코더들의 1차 내용분석 결과 중 답변이 일치한 데이터로 한정지어 머신 러닝을 실행한 결과 심리적 거리 예측의 정확도, 민감도, 특이도, 정밀도 모두 향상되어 심리적 거리가 70% 이상 예측되는 성과를 보였다. 본 연구는 SNS 메시지의 심리적 거리를 측정하는 방법을 제시함으로써 독자와의 심리적 거리를 제어 가능한 전략 요소로 활용 가능하게 할 것이라 기대된다.

가우시안 확률밀도 함수기반 강원도 남·북한 지역의 산림면적 변화탐지 및 평가 (Detection and Assessment of Forest Cover Change in Gangwon Province, Inter-Korean, Based on Gaussian Probability Density Function)

  • 이수종;박은빈;송철호;임철희;차성은;이슬기;이우균
    • 대한원격탐사학회지
    • /
    • 제35권5_1호
    • /
    • pp.649-663
    • /
    • 2019
  • 2018년 유엔 개발 계획(United Nations Development Programme; UNDP)의 보고서에 따르면 북한의 산림 황폐화는 매우 극단적이며, 지금까지도 진행되고 있다. 기후변화 측면에서 산림 황폐화는 단순히 한 국가만의 문제가 아닌 전 지구적인 스케일의 문제로 여겨지며, 이러한 북한 산림 황폐화의 원인은 만성적인 식량난과 개간 산지의 확대, 산림 병해충의 영향으로 알려져 있다. 산림 황폐화에 대응하기 위한 연구와 정책 사업들은 원격탐사와 산림 관련 국가 공간자료들을 이용하여 진행되지만, 북한의 경우 국가 공공 자료들의 접근이 제한적이며, 객관성이 보장되기 어렵다. 따라서, 본 연구에서는 Landsat 위성영상을 사용하여 통계적 확률밀도 추정 방법을 통해 한반도에서 유일하게 행정구역상으로 분단된 강원도에 대한 산림면적을 탐지 및 평가하고자 하였다. 남한의 산림 공간자료와 정규화식생지수(Normalized Difference Vegetation Index; NDVI)를 이용하여, 산림 비산림의 NDVI 값에 대한 범주별 가우시안 확률밀도함수를 추정하고 산림 탐지를 위한 NDVI 임계점(0.6658)을 설정하였다. 설정된 임계점을 이용하여 남 북 강원도에 대한 다중시기 산림면적 탐지를 진행한 결과 남 북 모두 2000년대까지 산림 면적이 감소하였으나, 2010년대에는 면적이 증가하는 경향이 나타났다. 또한, 지역적 규모에서 산림 면적의 감소는 국가별 도시화, 산업화의 정책 방향과 일치함을 확인하였다. 검증을 위한 Kappa value의 경우 대부분 강적합(0.8)과 중적합(0.6) 수준을 나타내었으며, 탐지된 면적과 국가 통계와의 비교 결과도 약소한 차이를 나타내었다. 본 연구는 북한 산림 황폐화에 대응하는 기반 자료로 사용될 수 있으며, 탐지된 결과를 바탕으로 산림자원의 보호와 복구의 필요성이 제기된다.