DOI QR코드

DOI QR Code

시계열 자료에서의 특이치 발견

Outlier detection in time series data

  • 투고 : 2016.05.25
  • 심사 : 2016.08.02
  • 발행 : 2016.08.31

초록

본 논문의 목표는 분위수 자기회귀모형을 활용하여 시계열 자료에서 특이치를 발견하는 알고리즘을 제안하고, 기존의 방법들과 그 성능을 비교하여 실제 주가 조작 사례에 적용해 보는 것이다. 지금까지의 특이치 발견 연구는 대부분 일반적인 데이터 형태에서만 있어왔기 때문에 시계열 데이터에서의 연구는 미미한 편이다. 또한 모수적인 방법에만 제한되었는데, 모수적 모형은 복잡할 뿐만 아니라 소요되는 분석 시간도 길기 때문에 편리하지 않다. 따라서 본 연구에서는 분위수 자기회귀모형을 활용한 특이치 발견 알고리즘을 새롭게 제시하고, 다양한 경우의 모의실험을 통해 기존 알고리즘과 비교하도록 한다. 특히 시계열 자료에서의 특이치 발견은 주가 조작을 적발하는 데에 유용하게 활용될 수 있다. 시간에 따라 관측되던 주가가 갑자기 그 동안의 흐름에서 벗어나 특이치로 발견되었다면 혹시 인위적인 개입으로 조작된 것은 아닌지 의심해 볼 수 있기 때문이다. 따라서 실제 주가 조작 사례에 적용해 봄으로써 얼마나 빠른 시일 내에 주가 조작을 적발해 낼 수 있는지 살펴보았다.

This study suggests an outlier detection algorithm that uses quantile autoregressive model in time series data, eventually applying it to actual stock manipulation cases by comparing its performance to existing methods. Studies on outlier detection have traditionally been conducted mostly in general data and those in time series data are insufficient. They have also been limited to a parametric model, which is not convenient as it is complicated with an analysis that takes a long time. Thus, we suggest a new algorithm of outlier detection in time series data and through various simulations, compare it to existing algorithms. Especially, the outlier detection algorithm in time series data can be useful in finding stock manipulation. If stock price which had a certain pattern goes out of flow and generates an outlier, it can be due to intentional intervention and manipulation. We examined how fast the model can detect stock manipulations by applying it to actual stock manipulation cases.

키워드

참고문헌

  1. Chen, C. and Liu, L. M. (1993a). Forecasting time series with outliers, Journal of Forecasting, 12, 13-35. https://doi.org/10.1002/for.3980120103
  2. Chen, C. and Liu, L. M. (1993b). Joint estimation of model parameters and outlier effects in time series, Journal of the American Statistical Association, 88, 284-297.
  3. Eo, S. H., Hong, S. M., and Cho, H. (2014). Identification of outlying observations with quantile regression for censored data. arXiv preprint arXiv:1404.7710.
  4. Fox, A. J. (1972). Outliers in time series, Journal of the Royal Statistical Society, Series B, 34, 350-363.
  5. Fried, R. (2004). Robust filtering of time series with trends, Journal of Nonparametric Statistics, 16, 313-328. https://doi.org/10.1080/10485250410001656444
  6. Hoaglin, D. C., Iglewicz, B., and Tukey, J. W. (1986). Performance of some resistant rules for outlier labeling, Journal of the American Statistical Association, 81, 991-999. https://doi.org/10.1080/01621459.1986.10478363
  7. Koenker, R. and Xiao, Z. (2006). Quantile autoregression, Journal of the American Statistical Association, 101, 980-990. https://doi.org/10.1198/016214506000000672
  8. Nardi, A. and Schemper, M. (1999). New residuals for cox regression and their application to outlier screening, Biometrics, 55, 523-529. https://doi.org/10.1111/j.0006-341X.1999.00523.x
  9. Rousseeuw, P. J. (1984). Least median of squares regression, Journal of the American Statistical Association, 79, 871-880. https://doi.org/10.1080/01621459.1984.10477105
  10. Rousseeuw, P. J. and Croux, C. (1993). Alternatives to the median absolute deviation, Journal of the American Statistical Association, 88, 1273-1283. https://doi.org/10.1080/01621459.1993.10476408
  11. Rousseeuw, P. J. and Leroy, A. M. (1988). A robust scale estimator based on the shortest half, Statistica Neerlandica, 42, 103-116. https://doi.org/10.1111/j.1467-9574.1988.tb01224.x
  12. SAS Institute Inc (2008). SAS/STAT 9.2 User's Guide: the QUANTREG Procedure, Cary, SAS Institute Inc, NC.
  13. Siegel, A. F. (1982). Robust regression using repeated medians, Biometrika, 69, 242-244. https://doi.org/10.1093/biomet/69.1.242
  14. Tukey, J. W. (1977). Exploratory Data Analysis, Addison-Wesley, MA.