• 제목/요약/키워드: 회귀 모형 함수

검색결과 294건 처리시간 0.028초

붓스트랩 방법을 이용한 일반화 자기회귀 조건부 이분산모형에서의 조건부 분산 예측 (Prediction of Conditional Variance under GARCH Model Based on Bootstrap Methods)

  • 김희영;박만식
    • Communications for Statistical Applications and Methods
    • /
    • 제16권2호
    • /
    • pp.287-297
    • /
    • 2009
  • 일반적으로 일반화 자기회귀 조건부 이분산(GARCH)모형 하에서, 우도함수에 기반한 자료의 예측구간의 추정은 오차항의 분포에 민감하게 반응하고 더욱이 조건부분산의 경우 구간추정이 현실적으로 쉽게 풀리지 않는 문제이다. 이를 해결하기 위해 붓스트랩방법(bootstrap method)이 적용될 수 있음을 최근 연구들을 통해 밝혀졌다. 본 논문에서는 GARCH모형 하에서 자료와 변동성(조건부 분산)의 예측구간 추정을 위해 최근 소개된 Pascual 등 (2006)의 논문을 토대로 붓스트랩 방법를 정리하였다 실제 사례분석을 위해 국내 주가수익률자료를 이용하였다.

합성곱 신경망을 이용한 오염부하량 예측에 관한 연구 (A study on pollutant loads prediction using a convolution neural networks)

  • 송철민
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.444-444
    • /
    • 2021
  • 하천의 오염부하량 관리 계획은 지속적인 모니터링을 통한 자료 구축과 모형을 이용한 예측결과를 기반으로 수립된다. 하천의 모니터링과 예측 분석은 많은 예산과 인력 등이 필요하나, 정부의 담당 공무원 수는 극히 부족한 상황이 일반적이다. 이에 정부는 전문가에게 관련 용역을 의뢰하지만, 한국과 같이 지형이 복잡한 지역에서의 오염부하량 배출 특성은 각각 다르게 나타나기 때문에 많은 예산 소모가 발생 된다. 이를 개선하고자, 본 연구는 합성곱 신경망 (convolution neural network)과 수문학적 이미지 (hydrological image)를 이용하여 강우 발생시 BOD 및 총인의 부하량 예측 모형을 개발하였다. 합성곱 신경망의 입력자료는 일반적으로 RGB (red, green, bule) 사진을 이용하는데, 이를 그래도 오염부하량 예측에 활용하는 것은 경험적 모형의 전제(독립변수와 종속변수의 관계)를 무너뜨리는 결과를 초래할 수 있다. 이에, 본 연구에서는 오염부하량이 수문학적 조건과 토지이용 등의 변수에 의해 결정된다는 인과관계를 만족시키고자 수문학적 속성이 내재된 수문학적 이미지를 합성곱 신경망의 훈련자료로 사용하였다. 수문학적 이미지는 임의의 유역에 대해 2차원 공간에서 무차원의 수문학적 속성을 갖는 grid의 집합으로 정의되는데, 여기서 각 grid의 수문학적 속성은 SCS 토양보존국(soil conservation service, SCS)에서 발표한 수문학적 토양피복형수 (curve number, CN)를 이용하여 산출한다. 합성곱 신경망의 구조는 2개의 Convolution Layer와 1개의 Pulling Layer가 5회 반복하는 구조로 설정하고, 1개의 Flatten Layer, 3개의 Dense Layer, 1개의 Batch Normalization Layer를 배열하고, 마지막으로 1개의 Dense Layer가 연결되는 구조로 설계하였다. 이와 함께, 각 층의 활성화 함수는 정규화 선형함수 (ReLu)로, 마지막 Dense Layer의 활성화 함수는 연속변수가 도출될 수 있도록 회귀모형에서 자주 사용되는 Linear 함수로 설정하였다. 연구의 대상지역은 경기도 가평군 조종천 유역으로 선정하였고, 연구기간은 2010년 1월 1일부터 2019년 12월 31일까지로, 2010년부터 2016년까지의 자료는 모형의 학습에, 2017년부터 2019년까지의 자료는 모형의 성능평가에 활용하였다. 모형의 예측 성능은 모형효율계수 (NSE), 평균제곱근오차(RMSE) 및 평균절대백분율오차(MAPE)를 이용하여 평가하였다. 그 결과, BOD 부하량에 대한 NSE는 0.9, RMSE는 1031.1 kg/day, MAPE는 11.5%로 나타났으며, 총인 부하량에 대한 NSE는 0.9, RMSE는 53.6 kg/day, MAPE는 17.9%로 나타나 본 연구의 모형은 우수(good)한 것으로 판단하였다. 이에, 본 연구의 모형은 일반 ANN 모형을 이용한 선행연구와는 달리 2차원 공간정보를 반영하여 오염부하량 모의가 가능했으며, 제한적인 입력자료를 이용하여 간편한 모델링이 가능하다는 장점을 나타냈다. 이를 통해 정부의 물관리 정책을 위한 의사결정 및 부족한 물관리 분야의 행정력에 도움이 될 것으로 생각된다.

  • PDF

선형 평활스플라인 함수 추정과 적용 (A Linear Smoothing Spline Estimation and Applications)

  • 윤용화;김경무;김종태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제9권1호
    • /
    • pp.29-36
    • /
    • 1998
  • 본 논문은 Eubank (1994, 1997)에 의해 이론적으로 제안된 선형 평활스플라인 추정량에 대한 알고리즘을 개발함으로 선형 스플라인의 추정을 보다 쉽고 효율적으로 사용할 수 있도록 하는데 목적이 있다. 이 알고리즘을 이용하여 여러가지 모형의 예들에 대하여 추정량의 적합성을 조사하였고, 제시된 선형 평활스플라인 추정량이 비모수 함수 추정의 도구로서 잘 적합됨을 알 수 있었다.

  • PDF

시간강수계열의 강수량 모의발생을 위한 추계학적 모형 (A Stochastic Simulation Model for the Precipitation Amounts of Hourly Precipitation Series)

  • 이정식;이재준;박종영
    • 한국수자원학회논문집
    • /
    • 제35권6호
    • /
    • pp.763-777
    • /
    • 2002
  • 본 연구의 목적은 간헐 수문사상인 시간강수계열의 구조적 특성을 고찰하여 강수량 모의발생을 위한 추계학적 모형을 개발하는 것이다. 이를 위하여 본 연구에서는 강수발생과정에 대한 추계학적 모형은 이재준과 이정식(2002)이 개발한 추계학적 모형을 이용하였으며, 강수량과정을 위하여 사상내의 시간강수량을 비정상 1차 자기회귀모형으로 기술하였다. 시간강수계열의 강수발생과정과 강수량과정을 조합하면 시간강수사상의 발생패턴과 사상기간내의 강수의 종속구조를 모의할 수 있는 시간강수계열에 대한 모의모형이 얻어지며, 이 모형의 적합성을 구명하기 위해 서울을 대상으로 하여 실적강수자료를 분석하였다. Monte Carlo 모의결과는 모형이 사상기간내의 강수강도, 지속 기간, 크기의 주변 및 조건부 분포를 잘 재현하고 있음을 보여주었다. 실적 및 모의 자료에 대한 자기상관함수도 비교적 작은 시간지체에서는 유사하였다

일반화선형모형에서 선형성의 타당성을 진단하는 그래프 (A Graphical Method of Checking the Adequacy of Linear Systematic Component in Generalized Linear Models)

  • 김지현
    • Communications for Statistical Applications and Methods
    • /
    • 제15권1호
    • /
    • pp.27-41
    • /
    • 2008
  • 그림으로 일반화 선형모형의 적합성을 진단하는 방법을 제안한다. 이 그림은 일반화 선형모형에서 연결함수를 설명변수들의 선형결합으로 표현할 수 있다는 가정을 진단할 때 유용하다. 이 그림에서 연결함수와 설명변수들의 관계를 비모수적으로 추정하는 작업이 필요한데, 이를 위해 여러 가능한 기법중에서 부스팅 기법을 적용하였다. 정규분포와 이항분포 자료로 모의실험을 실시하여 새로이 제안한 진단그림의 효과성을 보였다. 그리고 진단그림의 한계와 기술적 세부사항들을 설명하였다.

회귀모형에서 이상치 검색을 이용한 로버스트 변수변환방법 (Robust Response Transformation Using Outlier Detection in Regression Model)

  • 서한손;이가연;윤민
    • 응용통계연구
    • /
    • 제25권1호
    • /
    • pp.205-213
    • /
    • 2012
  • 선형회귀모형에서 자료를 모형에 적합시킬 때 일반적으로 반응변수 변환을 시도하지만 적절한 변환함수의 결정은 몇개의 이상치들에 민감하게 반응한다는 것이 잘 알려져 있다. 이에 따라 이상치에 영향을 받지 않는 변수변환 방법들이 연구, 개발되고 있으나 최근에 Cheng (2005)에 의해 최소절사제곱추정치에 기반을 둔 절사 우도추정치 방법처럼 이상치의 숫자를 미리 정해야한다거나 많은 계산량이 필요하다는 단점들을 갖고 있다. 본 논문에서는 그와 같은 문제점을 해결하고 추정치의 강건성을 개선하는 새로운 방법을 제안하며 제안된 방법에서는 반응변수 변환에 따른 이상치 탐색법에 있어서 Hadi와 Simonoff (1993)가 제시한 단계적 절차를 응용, 적용한다.

장수의 환경생태학적 요인에 관한 지리가중회귀분석 (Geographically Weighted Regression on the Environmental-Ecological Factors of Human Longevity)

  • 최돈정;서용철
    • 대한공간정보학회지
    • /
    • 제20권3호
    • /
    • pp.57-63
    • /
    • 2012
  • 정규최소자승법(OLS : Ordinary Least Square)은 장수인구의 지역적 분포와 적용된 환경변수들의 관계가 공간상에서 동일하다고 가정한다. 따라서 장수현상이나 그와 관련된 변수의 공간적 특성을 충분히 설명할 수 없다. 지리가중 회귀분석(GWR : Geographically Weighted Regression)모형은 지리적 가중 함수를 통해 인접지역들의 공간적 유사성을 대변할 수 있다. 또한 환경특성에 따른 장수인구분포의 공간적 변이를 국지적으로 설명할 수 있는 특징이 있다. 이러한 관점에서 본 논문은 기존의 연구에서 제시된 장수의 환경생태학적 요인들에 대해 보통 최소자승법과 GWR모델간의 비교분석을 수행하였다. 연구결과 GWR모형이 OLS모형보다 높은 모형 부합도를 가지고 특정 환경 변수가 가지는 효과에 대한 공간적 변동성을 설명할 수 있는 것으로 나타났다.

Support Vector Regression을 이용한 GARCH 모형의 추정과 투자전략의 성과분석 (Estimation of GARCH Models and Performance Analysis of Volatility Trading System using Support Vector Regression)

  • 김선웅;최흥식
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.107-122
    • /
    • 2017
  • 주식시장의 주가 수익률에 나타나는 변동성은 투자 위험의 척도로서 재무관리의 이론적 모형에서뿐만 아니라 포트폴리오 최적화, 증권의 가격 평가 및 위험관리 등 투자 실무 영역에서도 매우 중요한 역할을 하고 있다. 변동성은 주가 수익률이 평균을 중심으로 얼마나 큰 폭의 움직임을 보이는가를 판단하는 지표로서 보통 수익률의 표준편차로 측정한다. 관찰 가능한 표준편차는 과거의 주가 움직임에서 측정되는 역사적 변동성(historical volatility)이다. 역사적 변동성이 미래의 주가 수익률의 변동성을 예측하려면 변동성이 시간 불변적(time-invariant)이어야 한다. 그러나 대부분의 변동성 연구들은 변동성이 시간 가변적(time-variant)임을 보여주고 있다. 이에 따라 시간 가변적 변동성을 예측하기 위한 여러 계량 모형들이 제안되었다. Engle(1982)은 변동성의 시간 가변적 특성을 잘 반영하는 변동성 모형인 Autoregressive Conditional Heteroscedasticity(ARCH)를 제안하였으며, Bollerslev(1986) 등은 일반화된 ARCH(GARCH) 모형으로 발전시켰다. GARCH 모형의 실증 분석 연구들은 실제 증권 수익률에 나타나는 두터운 꼬리 분포 특성과 변동성의 군집현상(clustering)을 잘 설명하고 있다. 일반적으로 GARCH 모형의 모수는 가우스분포로부터 추출된 자료에서 최적의 성과를 보이는 로그우도함수에 대한 최우도추정법에 의하여 추정되고 있다. 그러나 1987년 소위 블랙먼데이 이후 주식 시장은 점점 더 복잡해지고 시장 변수들이 많은 잡음(noise)을 띠게 됨에 따라 변수의 분포에 대한 엄격한 가정을 요구하는 최우도추정법의 대안으로 인공지능모형에 대한 관심이 커지고 있다. 본 연구에서는 주식 시장의 주가 수익률에 나타나는 변동성의 예측 모형인 GARCH 모형의 모수추정방법으로 지능형 시스템인 Support Vector Regression 방법을 제안한다. SVR은 Vapnik에 의해 제안된 Support Vector Machines와 같은 원리를 회귀분석으로 확장한 모형으로서 Vapnik의 e-insensitive loss function을 이용하여 비선형 회귀식의 추정이 가능해졌다. SVM을 이용한 회귀식 SVR은 두터운 꼬리 분포를 보이는 주식시장의 변동성과 같은 관찰치에서도 우수한 추정 성능을 보인다. 2차 손실함수를 사용하는 기존의 최소자승법은 부최적해로서 추정 오차가 확대될 수 있다. Vapnik의 손실함수에서는 입실론 범위내의 예측 오차는 무시하고 큰 예측 오차만 손실로 처리하기 때문에 구조적 위험의 최소화를 추구하게 된다. 금융 시계열 자료를 분석한 많은 연구들은 SVR의 우수성을 보여주고 있다. 본 연구에서는 주가 변동성의 분석 대상으로서 KOSPI 200 주가지수를 사용한다. KOSPI 200 주가지수는 한국거래소에 상장된 우량주 중 거래가 활발하고 업종을 대표하는 200 종목으로 구성된 업종 대표주들의 포트폴리오이다. 분석 기간은 2010년부터 2015년까지의 6년 동안이며, 거래일의 일별 주가지수 종가 자료를 사용하였고 수익률 계산은 주가지수의 로그 차분값으로 정의하였다. KOSPI 200 주가지수의 일별 수익률 자료의 실증분석을 통해 기존의 Maximum Likelihood Estimation 방법과 본 논문이 제안하는 지능형 변동성 예측 모형의 예측성과를 비교하였다. 주가지수 수익률의 일별 자료 중 학습구간에서 대칭 GARCH 모형과 E-GARCH, GJR-GARCH와 같은 비대칭 GARCH 모형에 대하여 모수를 추정하고, 검증 구간 데이터에서 변동성 예측의 성과를 비교하였다. 전체 분석기간 1,487일 중 학습 기간은 1,187일, 검증 기간은 300일 이다. MLE 추정 방법의 실증분석 결과는 기존의 많은 연구들과 비슷한 결과를 보여주고 있다. 잔차의 분포는 정규분포보다는 Student t분포의 경우 더 우수한 모형 추정 성과를 보여주고 있어, 주가 수익률의 비정규성이 잘 반영되고 있다고 할 수 있다. MSE 기준으로, SVR 추정의 변동성 예측에서는 polynomial 커널함수를 제외하고 linear, radial 커널함수에서 MLE 보다 우수한 예측 성과를 보여주었다. DA 지표에서는 radial 커널함수를 사용한 SVR 기반의 지능형 GARCH 모형이 가장 우수한 변동성의 변화 방향에 대한 방향성 예측력을 보여주었다. 추정된 지능형 변동성 모형을 이용하여 예측된 주식 시장의 변동성 정보가 경제적 의미를 갖는지를 검토하기 위하여 지능형 변동성 거래 전략을 도출하였다. 지능형 변동성 거래 전략 IVTS의 진입규칙은 내일의 변동성이 증가할 것으로 예측되면 변동성을 매수하고 반대로 변동성의 감소가 예상되면 변동성을 매도하는 전략이다. 만약 변동성의 변화 방향이 전일과 동일하다면 기존의 변동성 매수/매도 포지션을 유지한다. 전체적으로 SVR 기반의 GARCH 모형의 투자 성과가 MLE 기반의 GARCH 모형의 투자 성과보다 높게 나타나고 있다. E-GARCH, GJR-GARCH 모형의 경우는 MLE 기반의 GARCH 모형을 이용한 IVTS 전략은 손실이 나지만 SVR 기반의 GARCH 모형을 이용한 IVTS 전략은 수익으로 나타나고 있다. SVR 커널함수에서는 선형 커널함수가 더 좋은 투자 성과를 보여주고 있다. 선형 커널함수의 경우 투자 수익률이 +526.4%를 기록하고 있다. SVR 기반의 GARCH 모형을 이용하는 IVTS 전략의 경우 승률도 51.88%부터 59.7% 사이로 높게 나타나고 있다. 옵션을 이용하는 변동성 매도전략은 방향성 거래전략과 달리 하락할 것으로 예측된 변동성의 예측 방향이 틀려 변동성이 소폭 상승하거나 변동성이 하락하지 않고 제자리에 있더라도 옵션의 시간가치 요인 때문에 전체적으로 수익이 실현될 수도 있다. 정확한 변동성의 예측은 자산의 가격 결정뿐만 아니라 실제 투자에서도 높은 수익률을 얻을 수 있기 때문에 다양한 형태의 인공신경망을 활용하여 더 나은 예측성과를 보이는 변동성 예측 모형을 개발한다면 주식시장의 투자자들에게 좋은 투자 정보를 제공하게 될 것이다.

안장점근사를 이용한 자기회귀계수에 대한 소표본 점근추론 (Small Sample Asymptotic Inferences for Autoregressive Coefficients via Saddlepoint Approximation)

  • 나종화;김정숙
    • 응용통계연구
    • /
    • 제20권1호
    • /
    • pp.103-115
    • /
    • 2007
  • 본 논문에서는 1차 자기회귀모형에서 자기회귀계수에 대한 여러 가지 추정량들의 분포함수에 대한 근사 방법에 대해 연구하였다. 자기회귀계수의 여러 추정량들을 이차형식의 관점에서 이해하고, Na와 Kim(2005)에 의한 안장점근사의 결과를 이용한 새로운 근사법을 제시하였다. 이 방법은 정규근사를 비롯한 기존의 근사법과는 달리 추정량에 대한 근사분포의 유도과정이 불필요하며, 소표본은 물론 통계적 추론의 주요 관심영역에서의 근사정도가 매우 뛰어난 장점을 가지고 있다. 모의실험을 통해 Edgeworth 근사를 비롯한 기존의 여러 근사법보다 효율이 뛰어남을 확인하였다.

호우 위험도 평가를 이용한 피해예측 (Damage Prediction Using Heavy Rain Risk Assessment)

  • 김종성;최창현;이종소;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.154-154
    • /
    • 2017
  • 전 세계적인 기후변동과 기후변화의 영향으로 대규모 인명 및 재산피해를 유발하는 자연재난의 빈도와 강도가 증가하고 있다. 이렇게 변화하는 상황에서 효율적인 대책을 수립하기 위해서는 재해에 노출된 특성을 지역적 특성과 함께 고려하여 지역별로 재해에 위험한 정도를 평가하는 것이 선행되어지고, 재난 피해 발생전에 피해 지역 및 범위를 예측하는 것이 필요하다고 판단된다. 따라서 본 연구에서는 국내 자연재난 피해의 65% 이상을 차지하는 호우피해를 대상으로 PSR(Pressure-State-Response) 구조를 이용하여 호우피해위험지수(Heavy rain Damage Risk Index, HDRI)를 제안하여 호우 위험도를 평가하고자하였다. 또한 도출된 지역별 위험등급에 따른 호우피해 예측함수를 개발하여 재해발생 전에 개략적인 피해의 범위를 예측하고자 하였다. 먼저 지역별 호우 위험도 평가를 위해 압력지표, 현상지표, 대책지표를 구축하고, 주성분분석을 이용하여 평가지표를 결정하였다. 결정된 평가지표를 동일한 가중치를 부여하여 호우피해위험지수를 도출하였다. 분석결과, 경기도 31개 지자체 중에서 가장 안전한 1등급인 지자체는 15개의 지자체로 나타났으며, 2등급인 지자체는 7개, 3등급인 지자체는 9개로 분류되었다. 지자체별 호우 위험도 등급에 따라서 재해기간별 총강우량, 재해일수, 선행강우량(1~5일), 지속시간별 최대강우량(1~24시간) 등의 자료를 설명변수로 구축하였고, 다중회귀모형과 주성분분석을 활용하여 예측함수를 개발하였다. 등급별 호우피해 예측함수는 N-RMSE가 12~18%로 호우피해를 적절하게 예측하는 것으로 평가되었다. 본 연구를 통해 지자체별 호우피해위험도 등급을 파악 할 수 있으며, 평가된 호우피해위험도 등급별로 호우피해 예측함수 개발을 통해 사전에 호우피해 발생 및 규모를 파악할 수 있게 되었다. 따라서 본 연구의 결과는 각 지자체 및 관련 부처에서 효과적인 방재체계를 수립하는데 있어 기초자료로 활용될 수 있을 것으로 판단된다.

  • PDF