DOI QR코드

DOI QR Code

Selection of bandwidth for local linear composite quantile regression smoothing

국소 선형 복합 분위수 회귀에서의 평활계수 선택

  • Received : 2017.07.27
  • Accepted : 2017.09.11
  • Published : 2017.10.31

Abstract

Local composite quantile regression is a useful non-parametric regression method widely used for its high efficiency. Data smoothing methods using kernel are typically used in the estimation process with performances that rely largely on the smoothing parameter rather than the kernel. However, $L_2$-norm is generally used as criterion to estimate the performance of the regression function. In addition, many studies have been conducted on the selection of smoothing parameters that minimize mean square error (MSE) or mean integrated square error (MISE). In this paper, we explored the optimality of selecting smoothing parameters that determine the performance of non-parametric regression models using local linear composite quantile regression. As evaluation criteria for the choice of smoothing parameter, we used mean absolute error (MAE) and mean integrated absolute error (MIAE), which have not been researched extensively due to mathematical difficulties. We proved the uniqueness of the optimal smoothing parameter based on MAE and MIAE. Furthermore, we compared the optimal smoothing parameter based on the proposed criteria (MAE and MIAE) with existing criteria (MSE and MISE). In this process, the properties of the proposed method were investigated through simulation studies in various situations.

국소복합분위수 회귀모형을 활용한 비모수적 함수 추정방법이 높은 효율성과 더불어 활발히 연구되고 있다. 이러한 추정과정에 커널을 사용한 자료 평활방법이 대표적으로 사용되고 있으며, 그 성능은 커널보다는 평활계수의 선택 크게 의존한다. 한편, 회귀함수 추정방법의 성능을 평가하는 기준으로는 통상적으로 $L_2$-노름이 사용되어 평균제곱오차 또는 평균적분제곱오차를 최소화하는 평활계수의 선택에 대한 많은 연구가 진행되어 왔다. 본 논문에서는 국소선형 복합 분위수 회귀방법을 활용한 비모수 회귀모형 추정량의 성능을 결정하는 평활계수 선택의 최적성에 관해 연구하였다. 특히, 여러 장점을 가졌으나 수리적 어려움으로 연구가 미흡한 평균절대오차 및 평균적분절대오차를 최적의 기준으로 삼아 최적의 평활계수를 구하고 그 유일성에 관해 연구하였다. 나아가 기존의 평가기준인 평균제곱오차 및 평균적분제곱오차를 사용한 선택과의 관계를 파악하고 그 성능을 비교하였다. 이러한 과정에서 다양한 상황에서의 모의실험을 통해 제안한 방법의 특성을 규명하였다.

Keywords

References

  1. Breiman, L. and Friedman, J. H. (1997). Predicting multivariate responses in multiple linear regression, Journal of the Royal Statistical Society, Series B, 59, 3-54. https://doi.org/10.1111/1467-9868.00054
  2. Fan, J. and Gijbels, I. (1992). Variable bandwidth and local linear regression smoothers, The Annals of Statistics, 20, 2008-2036. https://doi.org/10.1214/aos/1176348900
  3. Fan, J. and Gijbels, I. (1996). Local Polynomial Modelling and Its Applications, Chapman and Hall, London.
  4. Fan, J., Hu, T. C., and Truong, Y. K. (1994). Robust non-parametric function estimation, Scandinavian Journal of Statistics, 21, 433-446.
  5. Kai, B., Li, R., and Zou, H (2010). Local composite quantile regression smoothing: an efficient and safe alternative to local polynomial regression, Journal of the Royal Statistical Society, Series B, 72, 49-69. https://doi.org/10.1111/j.1467-9868.2009.00725.x
  6. Schucany, W. R. (1989). Locally optimal window widths for kernel density estimation with large sample, Statistics and Probability Letters, 7, 401-405. https://doi.org/10.1016/0167-7152(89)90094-1
  7. Sheather, S. J. (2004). Density estimation, Statistical Science, 19 588-597. https://doi.org/10.1214/088342304000000297
  8. Welsh, A. H. (1996). Robust estimation of smooth regression and spread functions and their derivatives, Statistica Sinica, 6, 347-366.
  9. Yu, K. and Jones, M. C. (1998). Local linear quantile regression, Journal of the American Statistical Association, 93, 228-237. https://doi.org/10.1080/01621459.1998.10474104
  10. Zou, H. and Yuan, M. (2008). Composite quantile regression and the Oracle model selection theory, The Annals of Statistics, 36, 1108-1126. https://doi.org/10.1214/07-AOS507