DOI QR코드

DOI QR Code

Filtered Coupling Measures for Variable Selection in Sparse Vector Autoregressive Modeling

필터링된 잔차를 이용한 희박벡터자기회귀모형에서의 변수 선택 측도

  • 이승규 (성균관대학교 통계학과) ;
  • 백창룡 (성균관대학교 통계학과)
  • Received : 2015.05.18
  • Accepted : 2015.07.12
  • Published : 2015.10.31

Abstract

Vector autoregressive (VAR) models in high dimension suffer from noisy estimates, unstable predictions and hard interpretation. Consequently, the sparse vector autoregressive (sVAR) model, which forces many small coefficients in VAR to exactly zero, has been suggested and proven effective for the modeling of high dimensional time series data. This paper studies coupling measures to select non-zero coefficients in sVAR. The basic idea based on the simulation study reveals that removing the effect of other variables greatly improves the performance of coupling measures. sVAR model coefficients are asymmetric; therefore, asymmetric coupling measures such as Granger causality improve computational costs. We propose two asymmetric coupling measures, filtered-cross-correlation and filtered-Granger-causality, based on the filtered residuals series. Our proposed coupling measures are proven adequate for heavy-tailed and high order sVAR models in the simulation study.

벡터자기회귀모형은 다차원의 시계열 자료간의 선형종속 관계를 연구하는데 효율적인 모형이다. 하지만 차원이 높아질 경우 추정해야할 모수가 급격히 증가하여 추정이 불안정해지고 예측력의 저하 및 해석의 어려움을 동반하는 문제를 가지고 있다. 이를 보완하기 위해서 많은 계수를 0으로 두는 희박벡터자기회귀모형이 제안되었고 고차원 시계열 분석에서 유용함이 밝혀졌다. 이 논문에서는 희박벡터자기회귀모형 추정에 있어서 어떠한 계수를 0으로 두어야 하는지를 판단해주는 한 쌍의 변수에 대한 상관 정도를 추정해주는 커플링 측도를 제안한다. 먼저 이 논문에서는 부분 스펙트럼 일관성에 기반을 둔 커플링 측도를 사용한 변수 선택의 경우 다른 변수의 효과를 제거한 잔차에 기반을 두었기에 좋은 효율성을 보임을 밝힌다. 하지만 부분 스펙트럼 일관성의 경우 벡터자기회귀모형 계수의 비대칭성을 고려하지 못한다는 단점이 있어 이를 보완하고자 필터링을 통해 다른 변수의 효과를 제거한 잔차에 기반을 둔 동시에 비대칭성을 가지는 커플링 측도들, 필터링된 잔차를 이용한 교차 상관성과 그래인저 인과관계를 제안한다. 모의실험을 통해 우리가 제안한 방법론들이 두터운 꼬리를 가지거나 높은 차수의 희박벡터자기회귀모형의 경우에도 매우 정확하게 0이 아닌 변수를 선택함을 보인다.

Keywords

References

  1. Bernanke, B. S., Boivin, J. and Eliasz, P. (2004). Measuring the effects of monetary policy: A factoraugmented vector autoregressive (FAVAR) approach. Technical report, National Bureau of Economic Research.
  2. Brillinger, D. R. (1981). Time Series: Data Analysis and Theory, 36, SIAM.
  3. Dahlhaus, R. (2000). Graphical interaction models for multivariate time series, Metrika, 51, 157-172. https://doi.org/10.1007/s001840000055
  4. Dahlhaus, R., Eichler, M. and Sandkuhler, J. (1997). Identification of synaptic connections in neural ensembles by graphical models. Journal of Neuroscience Methods, 77, 93-107. https://doi.org/10.1016/S0165-0270(97)00100-3
  5. Davis, R. A., Zang, P. and Zheng, T. (2015). Sparse vector autoregressive modeling, arXiv:1207.0520.
  6. Granger, C. W. (1969). Investigating causal relations by econometric models and cross-spectral methods, Econometrica, 37, 424-438. https://doi.org/10.2307/1912791
  7. Haufe, s., Muller, K. R., Nolte, G. and Kramer, N. (2010). Sparse causal discovery in multivariate time series, Journal of Machine Learning Research : Workshop and Conference Proceedings, 6, 97-106.
  8. Hsu, N.-J., Hung, H.-L. and Chang, Y.-M. (2008). Subset selection for vector autoregressive processes using lasso, Computational Statistics & Data Analysis, 52, 3645-3657. https://doi.org/10.1016/j.csda.2007.12.004
  9. Reinsel, G. C. (2003). Elements of Multivariate Time Series Analysis, Springer Science & Business Media.
  10. Song, S. and Bickel, P. J. (2011). Large vector autoregressions. arXiv:1106.3915.
  11. Sims, C. A. (1980). Macroeconomics and reality, Econometrica: Journal of the Econometric Society, 1-48.
  12. Valdes-Sosa, P. A., Sanchez-Bornot, J. M., Lage-Castellanos, A., Vega-Hernandez, M., Bosch-Bayard, J., Melie-Garcia, L. and Canales-Rodriguez, E. (2005). Estimating brain functional connectivity with sparse multivariate autoregression, Philosophical Transactions of the Royal Society B, 360, 969-981. https://doi.org/10.1098/rstb.2005.1654