• 제목/요약/키워드: 다중분위회귀분석모형

검색결과 10건 처리시간 0.027초

조건부 합성기법과 MODIS LST를 활용한 토양수분 다중분위회귀모형 산정 연구 (A Study on Estimation of Soil Moisture Multiple Quantile Regression Model Using Conditional Merging and MODIS Land Surface Temperature Data)

  • 정충길;이지완;이용관;김세훈;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.23-23
    • /
    • 2018
  • 본 연구에서는 다중분위회귀분석모형(Multiple Quantile Regression Model, MQRM)과 MODIS(MODerate resolution Imaging Spectroradiometer) LST (Land Surface Temperature) 자료를 이용하여 전국 공간토양수분을 산정하였다. 공간토양수분을 산정하기 위한 과정은 크게 두가지로 구분된다. 첫 번째로 기존의 MODIS LST 자료를 조건부 합성 보정기법을 적용하여 실측 LST 자료와 비교하여 위성 LST 자료가 갖고 있는 오차를 보정하였다. 그 결과, 조건부 합성 보정기법을 적용하기전 전국 71개 지상관측지점에서 관측한 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.70으로 어는정도 유의성 있는 상관관계를 나타냈으나 조건부 합성 보정기법을 적용한 후 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.92로 상당히 크게 향상됨을 알 수 있었다. 두 번째로 보정된 MODIS LST를 이용하여 다중분위회귀분석 모형을 개발하고 토양수분을 예측하는 단계로 입력자료로 위성영상 자료와 관측자료를 융합하여 사용하였다. 위성영상 자료로는 보정된 MODIS LST와 MODIS NDV를 구축하였고 일단위 강수량 및 일조시간의 기상자료는 기상청으로부터 전국 71개 지점에 대해 구축하여 IDW 공간보간기법을 이용한 공간자료로 구축하였다. 토양수분 결과를 비교하기 위한 관측 토양수분은 자동농업기상관측(Automated Agriculture Observing System, AAOS)지점에서 2013년 1월부터 2015년 12월까지의 실측 일단위 토양수분 자료를 구축하여 사용하였다. 다중분위회귀분석 모형은 LST 인자를 중심으로 각각의 분위(0.05, 0.25, 0.5, 0.75, 0.95)에 해당되는 값의 회귀식을 NDVI, 강수 입력자료를 독립인자로서 조합하여 계절 및 토성에 따른 총 80개의 회귀식을 산정하였다. 관측 토양수분과 모의 토양수분을 비교한 결과 $R^2$가 0.70 (철원), 0.90 (춘천), 0.85 (수원), 0.65 (서산), 0.78 (청주), 0.82 (전주), 0.62 (순천), 0.63 (진주), 0.78 (보성)로 높은 상관성을 보였다. 본 연구에서는 다중분위회귀 모형의 성능을 검증하기 위해 기존의 다중선형회귀모형의 결과와 비교하여 크게 개선됨을 나타냈다.

  • PDF

베이지안 다중분위회귀분석모형 개발 및 온도상승에 따른 미래 확률강수량 전망 (Development of Bayesian Multiple Quantile Regression model and Estimation fo Future Design Rainfall with Increased Temperature)

  • 오랑치맥 솜야;김진국;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.22-22
    • /
    • 2019
  • 최근 전 세계적으로 급증하는 기후변화의 영향으로 인해 강우량 증가에 따른 이상홍수 발생 및 댐 여유고 부족 등 다양한 위험인자가 노출되고 있다. 이러한 예상치 못한 이상홍수는 실제 거주하고 있는 사람들을 위협할 수 있으며, 하천 범람으로 인해 2차 3차 피해가 일어날 가능성이 존재하고 있다. 이에 다양한 자연재해로부터 인명 및 재산 피해를 방지 및 저감하기 위한 목적으로 다양한 수공구조물이 존재하며, 수자원 관리계획 수립의 목적에 따라 다양한 강수량이 활용되고 있다. 특히, 지구온난화에 따른 기후변화 영향을 고려한 연최대 강수량 및 확률강수량 산정이 필요한 시점이며, 온도변화에 따른 증기압 계산식인 Clausius-Clapeyron 관계에 따르면 대기 온도가 $1^{\circ}C$ 상승할 때 대기수분량이 6~7% 증가하여 평균 온도상승에 따라 극치강수량 발생 잠재력이 향상 될 것으로 전망되고 있다. 본 연구에서는 온도상승에 따른 극치강수량의 변화를 베이지안 다중분위회귀분석모형을 통해 산정하여 CORDEX 온도자료 기반의 미래 극치강수량을 전망하였다. 본 연구결과 100년 이상 빈도의 강수량은 온도상승에 따라 급격히 증가하는 추세를 확인하였으며, 2100년까지 온도상승을 고려한 최대 극치강수량은 1500mm를 넘을 가능성을 확인하였다.

  • PDF

통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석 (Analysis of AI interview data using unified non-crossing multiple quantile regression tree model)

  • 김재오;방성완
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.753-762
    • /
    • 2020
  • 본 연구는 대한민국 육군이 선도적으로 도입하고자 노력하고 있는 AI 면접체계의 자료를 통합 비교차 다중 분위수 회귀나무 모형(unified non-crossing multiple quantile tree; UNQRT)을 활용하여 분석한 것이다. 분위수 회귀가 일반적인 선형회귀에 비하여 많은 장점을 가지지만, 선형성 가정은 여전히 많은 현실 문제해결에 있어 지나치게 강한 가정이다. 선형성을 완화한 모형의 하나인 기존 나무모형 기반의 분위수 회귀는 추정된 분위수 함수별로 교차하는 문제와 분위수별로 나무모형을 제시하여 해석력을 저하시키는 문제가 있다. 통합 비교차 다중 분위수회귀나무 모형은 비교차 제약식을 부여한 상태로 다중 분위수 함수를 동시에 추정함으로서 분위수 함수의 교차 문제를 해결하며, 극단 분위수에서 안정된 결과를 기대할 수 있고, 하나의 통합된 나무모형을 제시하여 우수한 해석력이 있다. 본 연구에서는 통합 비교차 다중 분위수회귀나무 모형을 활용하여 육군 AI 면접체계의 결과와 기존 인사자료간 관계를 충분히 탐색하여 의미있는 다양한 결과를 도출하였다.

기상청 ASOS 자료를 활용한 다중회귀분석 기반의 계절 강수량 예측 (Estimation of seasonal rainfall based on multiple regression analysis using ASOS data of Korea Meteorological Administration)

  • 김철겸;이정우;이정은;김남원;김현준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.310-310
    • /
    • 2019
  • 본 연구에서는 기상청 ASOS(종관기상관측장비) 자료와 통계적 기반의 다중회귀분석모형을 이용하여 경안천 유역에 대한 봄철 강수량(3~5월 누적강수량)의 예측성을 평가하였다. 예측대상기간은 2006~2018년이며 예측인자로서 전국 96개 지점의 ASOS 자료 중 35개 기상요소에 대한 월 자료를 활용하였다. 전망기간(1~12개월)에 따라 강수량 기준 최소 1개월에서 최대 24개월까지의 지체시간을 고려하여 1~24개월 선행 ASOS 기상자료와 강수량 사이의 상관성을 분석하였다. 예측대상년도를 기준으로 과거 40년간의 자료를 이용하여 상관성 분석을 수행하였으며, 상관성이 높은 상위 30개 기상인자를 조합하여 다중회귀분석모형의 예측인자(독립변수)로 활용하였다. 예측대상년도와 전망기간에 따라 최적의 예측인자를 조합하고, 교차검증을 통하여 각각 4,000개의 다중회귀모형을 도출하여 예측범위를 산출하였다. 다중회귀모형에 의한 예측범위를 분석한 결과, 2013년 자료까지는 예측범위가 관측값을 잘 포함하고 예측값의 평균이나 중간값이 관측값과 유사하게 나타난 반면, 2014년부터는 전망기간에 따라 관측값과 예측범위의 차이가 크게 나타나는 경우도 있었다. 예측치의 중간값을 기준으로 3분위(평년 이상, 평년 수준, 평년 이하) 적중률을 분석하면, 2006~2013년에 대해서는 58.3%인 반면, 2014~2018년에 대해서는 11.2% 수준으로 나타났다.

  • PDF

다중회귀모형과 인공신경망모형을 이용한 금강권역 강수량 장기예측 (Application of multiple linear regression and artificial neural network models to forecast long-term precipitation in the Geum River basin)

  • 김철겸;이정우;이정은;김현준
    • 한국수자원학회논문집
    • /
    • 제55권10호
    • /
    • pp.723-736
    • /
    • 2022
  • 본 연구에서는 금강권역을 대상으로 최대 12개월까지 선행예측이 가능한 월 강수량 예측모형을 구축하였으며, 예측모형 구축에는 다중회귀분석과 인공신경망의 두 가지 통계적 기법을 적용하였다. 예측인자 후보로 NOAA에서 제공하는 글로벌 기후패턴 39종과 금강권역에 대한 기상인자 8종 등 총 47종의 기후지수를 활용하였다. 예측대상월을 기준으로 과거 40년간의 월 강수량과 기후지수와의 지연상관성 분석을 통해 상관도가 높은 기후지수를 예측인자로 활용하여 다중회귀모형 및 인공신경망 모형을 구축하였다. 1991~2021년에 대해 매월 예측결과의 평균값과 관측값과의 적합도를 분석한 결과, 다중회귀모형은 PBIAS -3.3~-0.1%, NSE 0.45~0.50, r 0.69~0.70으로 분석되었으며, 인공신경망모형은 PBIAS -5.0~+0.5%, NSE 0.35~0.47, r 0.64~0.70로, 다중회귀모형에 의해 도출된 예측치의 평균값이 인공신경망모형보다 관측치에 좀 더 근접한 것으로 나타났다. 각 월의 예측범위 안에 관측치가 포함될 확률을 분석한 결과에서는 다중회귀모형이 57.5~83.6%(평균 72.9%), 인공신경망모형의 경우에는 71.5~88.7%(평균 81.1%)로 인공신경망모형 결과가 우수한 것으로 나타났다. 3분위 예측확률을 비교한 결과는 다중회귀모형의 경우에는 25.9~41.9%(평균 34.6%), 인공신경망모형은 30.3~39.1%(평균 34.7%)로 비슷하며, 두 모형 모두 평균 33.3% 이상으로 월 강수량에 대한 장기예측성을 확인 할 수 있었다. 이상과 같이 두 모형의 예측성 차이는 비교적 크지 않은 것으로 나타났으나, 예측범위에 대한 적중률이나 3분위 예측확률로부터 판단할 때 예측성에 대한 월별 편차는 인공신경망모형의 결과가 상대적으로 작게 나타났다.

일반계 고등학생 사교육비 지출에 대한 베이지안 분위회귀모형 분석 (Bayesian quantile regression analysis of private education expenses for high scool students in Korea)

  • 오현숙
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1457-1469
    • /
    • 2017
  • 일반계 고등학생의 사교육비 지출은 대학입시와 맞물려 최근 더욱 증가하고 있는 동시에 가구소득 수준, 지역 등에 따라 양극화되고 있다. 기존의 사교육비 연구는 주로 다중회귀모형을 토대로 최소자승법을 이용하였으나 자료가 최소자승법의 기본가정인 정규성과 등분산성을 만족하지 않으면 분석결과의 신뢰성에 대한 문제가 발생된다. 본 연구는 2015년도 사교육실태조사자료에 대하여 정규성과 등분산성이 성립되지 않음을 확인하고 이를 통제할 수 있는 베이지안 분위회귀모형을 적합한 후 깁스 샘플링 방법을 이용하여 사교육비 지출규모 수준 (분위수)에 따라 영향요인들을 분석하였다. 분석결과 학생의 성별, 부모의 나이, 방과후 학교 참여시간과 비용은 사교육비 지출규모에 의미있는 영향을 주지 못하였다. 가구소득은 사교육비 지출규모의 모든 수준에서 동일하게 영향을 주는 요인으로 파악되었다. 그 외, 거주지역, 총사교육시간, 학생의 성적, 부모의 교육정도, 가구의 경제활동주체, 방과후 학교 참여여부, EBS 교재비용은 사교육비 지출 규모의 수준에 따라 다르게 영향을 주었다.

비교차 제약식을 이용한 다중 선형 분위수 회귀모형에 관한 비교연구 (A comparison study of multiple linear quantile regression using non-crossing constraints)

  • 방성완;신승준
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.773-786
    • /
    • 2016
  • 분위수 회귀는 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 그러나 여러 개의 분위수 함수를 개별적으로 추정하게 되면 이들이 서로 교차할 가능성이 있으며, 이러한 분위수 함수의 교차(quantile crossing) 현상 분위수의 이론적 기본 특성에 위배된다. 본 논문에서는 다중 비교차 분위수 함수의 추정의 대표적인 방법들의 특성을 적합식과 계산 알고리즘의 측면에서 살펴보고, 모의실험과 실제 자료 분석을 통해 그 성능을 비교하였다.

원격상관 기후지수를 이용한 금강유역 장기 강우량 예측 (Long-term rainfall prediction of Geum river basin using teleconnected climate indices)

  • 이정우;김남원;김철겸;이정은
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.211-211
    • /
    • 2018
  • 미해양대기청 기후예측센터(Climate Prediction Center, NOAA)에서 제공하고 있는 기후지수(climate indices)를 예측인자로 하고 금강유역의 5~6월의 강우량을 예측대상으로 하는 원격상관기반 통계모형을 구축하였다. 1988년부터 2017년까지의 30년 자료에 대해 예측인자와 예측대상간의 시간지연상관분석을 수행한 결과 NAO(North Atlantic Oscillation), EP/NP(East Pacific/North Pacific Oscillation), EA(East Atlantic Pattern), WP(Western Pacific Index) 등과 상관성이 높은 것으로 분석되었으며, 이러한 시간지연 기후지수를 이용하여 4개월전에 5,6월 강수량을 예측할 수 있는 다중회귀모형을 개발하였다. 관측 강우량 아노말리가 큰 경우에는 다소 과소 예측되고, 아노말리가 작은 경우에는 다소 과다 예측되는 경향을 보였지만 관측 강우량과 예측 강우량간의 상관계수가 0.75로서 비교적 우수한 예측 결과를 나타내었다. 5~6월 강우량 아노말리의 3분위 예측성을 평가한 결과 평년이상 적중률은 77.8%, 평년수준은 81.8%로서 예측 성공률이 높았으며, 5, 6월 누적강우량이 매우 작았던 92년과 95년을 제외하고는 강우량이 적은 해에도 예측성이 우수하여 평년이하 적중률이 70.0%를 나타내었다. 따라서 본 개발모형은 최소 4개월 이전 선행시간을 가지고 늦봄, 초여름강우량을 예측할 수 있는 저비용의 가뭄 예측 도구로 유용하게 활용될 수 있을 것이다.

  • PDF

통계적 기상예측정보를 이용한 경안천 유출량 장기 전망 (Long-term runoff prediction of Gyeongan-cheon watershed using statistically forecasted weather information)

  • 김철겸;이정우;이정은;김현준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.413-413
    • /
    • 2022
  • 본 연구에서는 통계적 방법으로 도출된 장기 기상예측정보를 이용하여 유역에서의 유출량 전망 가능성을 검토하였다. 먼저 한강권역의 월 강수량과 기온에 대해 글로벌 기후지수와의 원격상관성을 기반으로 다중회귀모형 기반의 통계적 예측모형을 구성하여 미래기간(1~12개월)에 대한 월 단위 기상예측정보를 도출하였다. 월 단위로 도출된 강수량과 기온은 통계적 상세화 기법을 통해 한강권역 주요 ASOS 관측소 지점별로 일 단위 강수량과 기온자료로 변환하였으며, 상세화된 일 자료를 유역모형인 SWAT의 입력자료로 활용하여 경안천 유역의 미래기간에 대한 유출량을 도출하였다. 유출량 예측성을 평가하기 위하여 과거기간(2003~2021년)을 대상으로 관측유출량과 예측기상정보로부터 산출된 예측유출량을 비교하였다. 각 월별로 예측된 유출량의 중앙값과 관측값의 적합도를 분석한 결과, PBIAS는 -5.2~-2.7%, RSR은 0.79~0.91, NSE는 0.34~0.38, r은 0.59~0.62로 강수량 및 기온의 예측성에 비해 낮게 나타났다. 전 기간에 대해 월별로 분석한 예측결과에 대한 3분위 확률은 5월, 6월, 7월, 9월, 11월은 평균 42.8%로 예측성이 충분한 것으로 나타났으나, 나머지 월에서의 평균 예측성은 17.3%로 매우 낮게 나타났다. 상세화된 기상정보를 이용하여 유역모델링을 통해 산정한 유출량에 대한 전망 결과는 기상예측결과에 비해 상대적으로 예측성이 낮은 것으로 분석되었다. 이는 관측값 자체에서 나타날 수 있는 불확실성에 기인할 수도 있으며, 유출량에 지배적인 영향을 주는 강수량의 예측성에 대한 문제가 유역 모델링 과정에서 증폭되어 나타나는 문제일 수도 있다. 또한 지점별 일 자료로 상세화되는 과정에서의 불확실성, 우리나라 여름철 유출량 변동성 등 여러 가지 요인이 복합적으로 영향을 주어 나타나는 것으로 생각된다. 향후 다양한 대상유역에 대한 검토와 기상예측모형의 보완, 상세화 과정에서의 불확실성 해소 등을 통해 예측성을 개선할 계획이다.

  • PDF

베이지안 다중 비교차 분위회귀 분석 기법을 이용한 비정상성 빈도해석 모형 개발 (A Development of Nonstationary Frequency Analysis Model using a Bayesian Multiple Non-crossing Quantile Regression Approach)

  • 오랑치맥 솜야;김용탁;권영준;권현한
    • 한국연안방재학회지
    • /
    • 제4권3호
    • /
    • pp.119-131
    • /
    • 2017
  • Global warming under the influence of climate change and its direct impact on glacial and sea level are known issue. However, there is a lack of research on an indirect impact of climate change such as coastal structure design which is mainly based on a frequency analysis of water level under the stationary assumption, meaning that maximum sea level will not vary significantly over time. In general, stationary assumption does not hold and may not be valid under a changing climate. Therefore, this study aims to develop a novel approach to explore possible distributional changes in annual maximum sea levels (AMSLs) and provide the estimate of design water level for coastal structures using a multiple non-crossing quantile regression based nonstationary frequency analysis within a Bayesian framework. In this study, 20 tide gauge stations, where more than 30 years of hourly records are available, are considered. First, the possible distributional changes in the AMSLs are explored, focusing on the change in the scale and location parameter of the probability distributions. The most of the AMSLs are found to be upward-convergent/divergent pattern in the distribution, and the significance test on distributional changes is then performed. In this study, we confirm that a stationary assumption under the current climate characteristic may lead to underestimation of the design sea level, which results in increase in the failure risk in coastal structures. A detailed discussion on the role of the distribution changes for design water level is provided.