DOI QR코드

DOI QR Code

다변량 장기 종속 시계열에서의 이상점 탐지

Outlier detection for multivariate long memory processes

  • 김경희 (성균관대학교 통계학과) ;
  • 유승연 (성균관대학교 통계학과) ;
  • 백창룡 (성균관대학교 통계학과)
  • 투고 : 2022.03.23
  • 심사 : 2022.05.09
  • 발행 : 2022.06.30

초록

본 논문에서는 장기 종속 다변량 시계열 자료에 대한 이상점 탐지 기법을 연구한다. 기존 다변량 시계열 이상점 탐지 방법은 단기 종속 시계열 모형인 VARMA에 기반한 방법으로, 장기억성을 띈 다변량 시계열 자료에는 적합하지 않다. 자기회귀 모형을 통해서 장기 종속성, 즉 장기억성을 고려하기 위해서는 높은 차수의 모형이 필요하고, 이는 곧 추정의 불안성으로 이어지기에 장기억성을 효율적으로 다룰 수 없기 때문이다. 따라서, 본 논문은 이러한 문제를 보완하고자 VHAR 구조에 기반한 이상점 탐지 방법을 제시하고자 한다. 또한 더욱 정확한 추론을 위해서 로버스트한 방법을 이용하여 VHAR 계수를 추정하였고 이를 활용하여 이상점을 탐지하였다. 모의실험 결과 우리가 제안한 방법론이 기존 VARMA에 기반한 방법론보다 이상점 탐지에 더 효과적임을 살펴볼 수 있었다. 주가지수에 대한 실증자료 분석에서도 기존의 방법론은 탐지하지 못하는 추가 이상점을 찾음을 확인할 수 있었다.

This paper studies the outlier detection method for multivariate long memory time series. The existing outlier detection methods are based on a short memory VARMA model, so they are not suitable for multivariate long memory time series. It is because higher order of autoregressive model is necessary to account for long memory, however, it can also induce estimation instability as the number of parameter increases. To resolve this issue, we propose outlier detection methods based on the VHAR structure. We also adapt the robust estimation method to estimate VHAR coefficients more efficiently. Our simulation results show that our proposed method performs well in detecting outliers in multivariate long memory time series. Empirical analysis with stock index shows RVHAR model finds additional outliers that existing model does not detect.

키워드

참고문헌

  1. Andersen TG, Bollerslev T, Diebold FX, and Labys P (2003). Modeling and forecasting realized volatility. Econometrica, 71, 579-625. https://doi.org/10.1111/1468-0262.00418
  2. Baek C, Kechagias S, and Pipiras V (2017). Semiparametric, parametric, and possibly sparse models for multivariate long-range dependence. Wavelets and Sparsity XVII, Vol. 10394, International Society for Optics and Photonics 103941S.
  3. Baek C and Park M (2021). Sparse vector heterogeneous autoregressive modeling for realized volatility. Journal of the Korean Statistical Society, 50, 495-510. https://doi.org/10.1007/s42952-020-00090-5
  4. Boubacar-Mainassara Y, Esstafa Y, and Saussereau B (2021). Estimating farima models with uncorrelated but non-independent error terms. Statistical Inference for Stochastic Processes, 24, 549-608. https://doi.org/10.1007/s11203-021-09243-7
  5. Corsi F (2009). A simple approximate long-memory model of realized volatility. Journal of Financial Econometrics, 7, 174-196. https://doi.org/10.1093/jjfinec/nbp001
  6. Fox AJ (1972). Outliers in time series. Journal of the Royal Statistical Society: Series B (Methodological), 34, 350-363. https://doi.org/10.1111/j.2517-6161.1972.tb00912.x
  7. Fox J and Weisberg S (2002). Robust regression: appendix to An R and S-PLUS companion to applied regression.
  8. Hawkins D (1980). Identification of outliers
  9. Kleiner B, Martin RD, and Thomson DJ (1979). Robust estimation of power spectra. Journal of the Royal Statistical Society: Series B (Methodological), 41, 313-338. https://doi.org/10.1111/j.2517-6161.1979.tb01087.x
  10. Lee J (2017). Detecting outlier with exponential smoothing in time series. Seoul National University.
  11. Lee K and Baek C (2021). Outlier detection for long memory processes. The Korean Data & Information Science Society, 32, 1205-1218. https://doi.org/10.7465/jkdi.2021.32.6.1205
  12. Ripley B, Venables B, Bates DM, Hornik K, Gebhardt A, and Firth D (2013). R package 'MASS'
  13. Tsay RS (1988). Outliers, level shifts, and variance changes in time series. Journal of Forecasting, 7, 1-20. https://doi.org/10.1002/for.3980070102
  14. Tsay RS, Pena D, and Pankratz AE (2000). Outliers in multivariate time series. Biometrika, 87, 789-804. https://doi.org/10.1093/biomet/87.4.789