• 제목/요약/키워드: 다중 회귀

검색결과 3,935건 처리시간 0.032초

로버스트주성분회귀에서 최적의 주성분선정을 위한 기준 (A Criterion for the Selection of Principal Components in the Robust Principal Component Regression)

  • 김부용
    • Communications for Statistical Applications and Methods
    • /
    • 제18권6호
    • /
    • pp.761-770
    • /
    • 2011
  • 회귀모형에 연관성이 높은 설명변수들이 포함되면 다중공선성의 문제가 야기되며, 동시에 자료에 회귀 이상점들이 포함되면 최소자승추정량에 바탕을 둔 제반 통계적 추론은 심각한 결함을 갖게 된다. 이러한 현상들은 데이터마이닝 분야에서 많이 볼 수 있는데, 본 논문에서는 두 가지 문제를 동시에 해결하기 위한 방안으로서 로버스트주성분회귀를 제안하였다. 특히 최적의 주성분을 선정하기 위한 새로운 기준을 개발하였는데, 설명변수들의 표본공분산 대신에 MVE-추정량을 기반으로 하였으며, 고유치가 아니라 상태지수의 크기에 바탕을 둔 선정기준을 제안하였다. 그리고 주성분모형에서의 추정을 위하여 회귀이상점에 대해 로버스트한 LTS-추정을 도입하였다. 제안된 선정기준이 기존의 기준들보다 다중공선성과 이상점이 유발하는 문제들을 잘 해결할 수 있음을 모의실험을 통하여 확인하였다.

조건부 합성기법과 MODIS LST를 활용한 토양수분 다중선형 회귀모형 산정 연구 (A Study on Estimation of Soil Moisture Multiple Linear Regression Model Using Conditional Merging and MODIS Land Surface Temperature Data)

  • 정충길;이지완;김다래;김세훈;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.103-104
    • /
    • 2017
  • 본 연구에서는 다중회귀분석모형(MLRM)과 MODIS (MODerate resolution Imaging Spectroradiometer) LST (Land Surface Temperature) 자료를 이용하여 전국 공간토양수분을 산정하였다. 공간토양수분을 산정하기 위한 과정은 크게 두가지로 구분된다. 첫 번째로 기존의 MODIS LST 자료를 조건부 합성 보정기법을 적용하여 실측 LST 자료와 비교하여 위성 LST 자료가 갖고 있는 오차를 보정하였다. 그 결과, 조건부 합성 보정기법을 적용하기전 전국 71개 지상 관측지점에서 관측한 실측 LST와 MODIS LST의 R2는 전체 평균 0.70으로 어는정도 유의성 있는 상관관계를 나타냈으나 조건부 합성 보정기법을 적용한 후 실측 LST와 MODIS LST의 R2는 전체 평균 0.92로 상당히 크게 향상됨을 알 수 있었다. 두 번째로 보정된 MODIS LST를 이용하여 다중회귀분석 모형을 개발하고 토양수분을 예측하는 단계로 입력자료로 위성영상 자료와 관측자료를 융합하여 사용하였다. 위성영상 자료로는 보정된 MODIS LST와 MODIS NDV를 구축하였고 일단위 강수량 및 일조시간의 기상자료는 기상청으로부터 전국 68개 지점에 대해 구축하여 IDW 공간보간기법을 이용한 공간자료로 구축하였다. 토양수분 결과를 비교하기 위한 관측 토양수분은 자동농업기상관측(Automated Agriculture Observing System, AAOS)지점에서 2013년 1월부터 2015년 12월까지의 실측 일단위 토양수분 자료를 구축하여 사용하였다. 다중회귀분석 모형은 각각의 입력자료를 독립인자로서 조합하여 12개의 시나리오를 만들었다. 시공간적 경향을 고려하기 위하여 계절별, 토양 토성(soil texture)를 구분하여 회귀분석을 실시하였다. 관측 토양수분과 모의 토양수분을 비교한 결과 $R^2$가 0.80 (철원), 0.90 (춘천), 0.80 (수원), 0.63 (서산), 0.77 (청주), 0.82 (전주), 0.52 (순천), 0.63 (진주), 0.99 (보성)로 높은 상관성을 보였다. 본 연구에서는 토양수분을 예측하기 위한 인자 중 가장 민간함 LST를 보정하지 않는 토양수분 예측 방법은 상당한 오차를 포함하게 되어 실측 토양수분 결과와 크게 차이가 나타남을 보여주었다.

  • PDF

시강우량 다중회귀분석에 의한 첨두유량 예측 (Peak discharge prediction by multiple regression analysis using hourly precipitation data)

  • 박창언
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.380-380
    • /
    • 2017
  • 유역에서 발생되는 유출량의 크기를 예측하는 것은 홍수피해를 대비하기 위한 가장 기초적인 활동으로 이루어지며, 이를 위하여 많은 수문모형들이 개발되어 활용되어지고 있다. 이러한 수문모형의 적용을 위해서는 먼저 해당 유역을 재현할 수 있는 매개변수의 보정이 이루어져야 하며 적절한 정도 이상의 검정결과를 확보하여야만 적용이 가능하다. 그러나, 유역 내의 각종 수문특성을 모형의 매개변수로 자세히 나타내는 것은 쉬운 작업이 아니며, 특히 정해진 기간 내에 적용해야 하는 유역이 다수인 경우에는 더욱 힘든 작업이 될 수밖에 없다. 기후변화에 따라 예견되는 강우량 발생 시나리오를 바탕으로 남한 일대의 홍수영향을 지자체별로 평가하기 위한 작업에서는 각 지자체별 많은 소유역에서의 적절한 수문모형 매개변수를 개별적으로 찾아내는 것은 사실상 불가능할 것으로 예견되어, 기후변화 시나리오에서 주어지는 시간별 강우량 자료를 활용하여 첨두유량을 예측할 수 있는 통계적인 방법을 적용하였다. 홍수영향을 평가하기 위하여는 수문곡선 자체보다는 첨두유량의 크기가 더 중요할 것으로 판단되어, 홍수통제소에 제공하는 각 유량관측지점의 유량자료와 시간별 강우량자료로부터 단위 호우사상별 첨두유량과 일정 시간간격 강우량 사이의 다중회귀분석을 통하여 첨두유량 예측 가능성을 확인하였다. 다중회귀분석을 위한 시간간격별 강우량은 각 강우사상에 대하여 첨두유량 발생 직전의 1시간~12시간의 1시간 간격, 1일, 2일, 3일, 5일, 10일 등 17가지의 시간간격 동안의 강우량 자료를 찾아 다중회귀분석에 활용하였으며, 2006년부터 2015년까지 최근 10년 동안의 홍수통제소 자료를 활용하였다. 대상지역은 경기도 남부의 너부대교, 경안교, 복하교, 수직교 수위관측소지점으로 선정하였으며, 일정 크기 이상의 첨두유량 자료를 선별하여 해당 기간에 대한 강우량 자료를 준비하고, 유출량의 크기별로 분류하여 절반의 호우사상은 매개변수 보정에 그리고 나머지 절반의 호우사상은 모형의 검정에 사용하였다. 매개변수 보정결과는 $R^2$ 값이 0.87~0.96을 보이는 등 첨두유량의 예측에 충분히 적용가능한 것으로 판단되었으며, 보정되어진 매개변수로 실시한 검정에서는 0.76~0.85의 $R^2$ 값을 보였다. 본 연구의 결과를 바탕으로, 충분한 유량자료와 시간별 강우량자료만 준비된다면 첨두유량을 예측할 수 있는 회귀방정식으로 이루어진 간단한 모형을 구성할 수 있으며, 이를 활용하여 임의로 주어지는 시간별 강우량 자료를 활용하여 첨두유량의 예측이 가능할 것으로 판단되었다.

  • PDF

다중회귀를 이용한 대구시 주거지역의 오존농도 예측

  • 이정환;최성우;최혁
    • 한국환경과학회:학술대회논문집
    • /
    • 한국환경과학회 2006년도 추계 학술발표회 발표논문집
    • /
    • pp.117-118
    • /
    • 2006
  • 본 연구에서는 2001년부터 2005년까지의 최근 5년간의 대구시 보건환경연구원의 대기질 자동측정망 자료와 대구기상대의 기상자료를 이용하여 다중회귀분석을 통하여 대구시 주거 지역의 오존농도를 예측하였다. 대구시 주거지역의 고농도 오존은 측정소별로 대명동은 총 327회 중 153회(46.79%), 신암동은 총 310회 중 143회(46.13%), 만촌동은 총 262회 중 140회(53.44%)로 기온과 일사량이 증가하는 5, 6월에 주로 많이 발생하였다. 다중회귀분석 결과 각 측정소별로 수정된 $R^2$는 각각 0.611, 0.655, 0.624으로 양호한 회귀 모형을 나타내었다.

  • PDF

실시간 수위 예측을 위한 다중선형회귀 모형의 비교 (Comparison of Different Multiple Linear Regression Models for Real-time Flood Stage Forecasting)

  • 최승용;한건연;김병현
    • 대한토목학회논문집
    • /
    • 제32권1B호
    • /
    • pp.9-20
    • /
    • 2012
  • 최근 수위 예측을 위한 개념적 기반, 수문학적, 물리적 기반 모형 등의 단점을 극복하고자 홍수예측을 위해 자료지향형 모형 중의 하나인 다중선형회귀 모형이 널리 도입되고 있다. 본 연구의 목적은 이러한 다중선형회귀 모형의 서로 다른 회귀계수 선정 방법에 따른 홍수예측 성능을 비교 검토하고 이를 통해 적절한 다중회귀 홍수예측 모형을 구축하는 것이다. 이를 위해 입력자료의 자기상관분석을 통해 독립변수의 시간 규모를 결정한 후 최소 자승법, 가중 최소 자승법, 단계별 선택법의 각기 다른 회귀계수 산정 방법을 이용한 홍수예측 모형을 구축하고 중랑천 유역의 다양한 홍수사상에 대해 적용하였다. 구축된 모형들의 성능을 평가하기 위해 평균제곱근오차, Nash-Suttcliffe 효율계수, 평균절대오차, 수정 결정계수와 같이 4개의 통계지표들을 사용하였다. 모의결과 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형이 가장 정확한 예측 결과를 보였고, 최소자승법을 이용한 홍수예측 모형이 가중 최소자승법을 이용한 홍수예측 모형보다 좀 더 나은 예측 결과를 나타냈다.

Semi-Markov 모형에 기초한 다중상태 생존자료의 준모수적 분석

  • 여성칠
    • Communications for Statistical Applications and Methods
    • /
    • 제5권3호
    • /
    • pp.777-792
    • /
    • 1998
  • 병원의 임상연구실험에서 종종 환자들의 치료에 따른 병세의 호전상태를 여러단계로 분류하여 상이한 치료방법에 대한 치료효과간의 차이론 알고자 하는 경우가 있다. 이와 같이 다중상태의 생존자료를 분석하기 위해서 본 논문에서는 semi-Markov 모형에 Cox 회귀모형을 적용하여 회귀계수와 기저생존함수를 추정하고 이를 바탕으로 반응확률함수를 추정하였다. 그리고 본 논문의 결과를 실제 임상실험에서 얻어진 자료에 적용하여 분석하였다.

  • PDF

MODIS 다중 위성영상 기반의 토양수분 및 가뭄지수 산정연구 (Estimation of Spatio-temporal soil moisture and drought index based on MODIS multi-satellite images)

  • 정지훈;김주연;김형석;정다은;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.446-446
    • /
    • 2022
  • 본 연구에서는 MODIS(MODerate resolution Imaging Spectroradiometer) 다중 위성영상을 기반으로 전국 시공간 토양수분 및 토양수분 기반의 가뭄지수 SWDI(Soil Water Deficit Index)를 산정하였다. 시공간 토양수분의 산정을 위해 입력자료로 MODIS 위성의 지표면온도(Land Surface Temperature, LST), 증발산 및 식생(Enhanced Vegetation Index, EVI; Fraction of Photosynthetically Active Radiation, FPAR; Leaf Area Index, LAI; Normalized Difference Vegetation Index, NDVI) 관련 산출물 자료와 지상 관측자료인 일 단위 강수량 자료를 구축하였다. MODIS 위성영상은 산출물별로 제공되는 QC(Quality Control) 영상을 활용해 보정을 수행하였고, 공간 강수량 자료는 기상청에서 제공하는 전국 92개 지점의 종관기상관측자료를 구축하여 공간보간기법인 역거리가중법을 적용해 생성하였다. 실측 토양수분은 농촌진흥청에서 제공하는 76개 지점의 토양 깊이 10 cm에 설치된 TDR(Time Domain Reflectomerty) 센서에서 측정된 토양수분 자료를 활용하였으며, 토양수분 모의 시 토양 속성을 고려하기 위해 국립농업과학원에서 제공하는 토양도를 구축하여 활용하였다. 토양수분 산정 모형은 다중선형회귀모형(Multiple Linear Regression Model, MLRM)을 활용하였으며, 계절 및 토성에 따른 회귀식을 산정하였다. 회귀식 기반의 토양수분과 토성별 포장용수량 및 영구위조점 값을 이용하여 SWDI를 산정하고, 실제 가뭄 발생 시기 및 지역과의 비교하고자 한다.

  • PDF

이미지 분석을 이용한 살모넬라 신속 진단키트의 측정감도 향상 (Improvement of the detection limit of rapid detection kit for Salmonella Typhimurium using image analysis system)

  • 이상대;김기영;박샛별;문지혜
    • 농업과학연구
    • /
    • 제39권3호
    • /
    • pp.421-425
    • /
    • 2012
  • 식중독을 일으키는 대표적인 원인균인 살모넬라를 검출하기 위해 측방 유동형 간이진단 키트를 제작하였다. 또한, 제작된 간이진단 키트의 검출한계를 향상시키고 살모넬라 균수를 정량적으로 분석하기 위해 이미지 분석 시스템을 적용하였다. 그 결과 간이진단 키트의 검출한계는 $10^6\;cfu/mL$에서 $10^5\;cfu/mL$로 향상시킬 수 있었다. 살모넬라 균수의 정량적 분석을 위해 $T_{peak}/C_{peak}$$T_{area}/C_{area}$값을 이용하여 다중회귀분석을 수행하였으며 개발된 다중회귀방정식 중에서 가장 단순하고 결정계수가 높은 다중회귀방정식을 선정하였다. 추가로 제작된 간이진단 키트를 이용하여 개발된 다중회귀방정식을 검증한 결과 결정계수가 0.9393으로 우수한 선형성을 나타내었다. 본 연구에서 개발된 다중회귀방정식을 이용하여 더 정확하게 간이진단 키트에서 측정된 살모넬라 균수를 예측하는 것이 가능하였다.

다중선형회귀 및 인공신경망 모형을 이용한 대설피해에 따른 피해액 예측에 관한 연구 (Prediction of damages induced by Snow using Multiple-linear regression and Artificial Neural Network model)

  • 권순호;이의훈;정건희;김중훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.20-20
    • /
    • 2017
  • 최근 기후변화 영향에 따라 전 세계적으로 인명피해 및 재산피해를 유발하는 자연재난이 지속적으로 증가하고 있으며, 그로 인한 자연재해의 규모가 점점 더 커지고 있다. 실제로 우리나라에서도 지난 1994 년에서 2013 년까지 지난 20 년간 자연재해에 의한 피해액은 12조 3천억 원으로 집계되었으며, 이 중 강우와 태풍에 의한 피해가 85 % 이고, 대설에 의한 피해는 약 13 % 로 자연재해 중 대부분의 피해는 강우 및 태풍에서 발생하지만, 폭설에 의한 피해도 적지 않은 것으로 나타났다. 이에 따라, 정확한 예측을 위해 신뢰도 높은 자료 구축을 통한 대설피해 예측에 관한 연구가 필요한 시점이다. 본 연구에서는 대설피해액 예측을 위해 우리나라의 63개 기상 관측소에서 관측한 적설심 자료 및 기상관측 자료와 사회 경제 자료 총 11개를 대설피해 예측을 위한 입력변수로 선정하고, 이를 기상관측소가 속한 도시의 면적에 따라 3개의 지역으로 구분하였다. 주성분분석을 활용하여 선정된 입력변수들을 4개의 주성분으로 구분하고, 인공신경망 및 다중선형 회귀 모형을 구성하여 각 지역별 대설피해 예측의 오차를 분석하였다. 적용결과, 인공신경망 모형을 이용한 대설피해 예측의 수정결정계수는 22.8 %~48.2 %를 나타냈고, 다중선형회귀 모형의 수정결정 계수는 9.2 %~39.7% 로 나타났다. 그러므로 인공신경망 모형이 다중회귀 모형보다 선택된 입력자료를 활용하여 대설피해를 예측하는 목적으로 조금 더 우수한 결과를 나타내었다. 향후 자료를 보완 및 모형의 고도화를 통해 보다 정확한 대설피해 예측 함수 개발이 가능할 것으로 기대된다.

  • PDF

수계 상류 관측 수위자료를 이용한 하류 홍수위 예측기법 (Forecasting Technique of Downstream Water Level using the Observed Water Level of Upper Stream)

  • 김상문;최병웅;이남주
    • Ecology and Resilient Infrastructure
    • /
    • 제7권4호
    • /
    • pp.345-352
    • /
    • 2020
  • 최근 하천범람에 따른 피해를 최소화하기 위해서는 대피를 위한 선행시간을 확보하는 것이 매우 중요하다. 본 연구에서는 현재 하천에서 측정되고 있는 수위 관측 자료를 이용하여 이상호우 발생시 하류의 수위를 예측하였다. 수위 예측을 위해 다중회귀모형 및 인공신경망 모형을 섬강시험유역에 적용하였다. 다중회귀모형 및 인공신경망 모형의 학습에는 섬강시험유역의 2002년부터 2010년까지의 수위 관측 자료를 이용하였으며, 학습된 모형을 이용하여 발생 가능한 수위를 예측하였다. 모의 결과 인공신경망 수위예측모형의 결정계수는 0.991 - 0.999로 나타났으며, 다중회귀수위예측 모형의 결정계수는 0.945 - 0.990로 나타나 인공신경망을 이용한 수위예측모형이 다중회귀모형보다 좀 더 나은 예측 결과를 나타내는 것을 확인할 수 있었다. 본 연구결과는 향후 하천에서 선행시간을 확보한 홍수 예보 구축에 활용할 수 있을 것으로 판단된다.