DOI QR코드

DOI QR Code

Firework plot as a graphical exploratory data analysis tool for evaluating the impact of outliers in skewness and kurtosis of univariate data

일변량 자료의 왜도와 첨도에서 특이점의 영향을 평가하기 위한 탐색적 자료분석 그림도구로서의 불꽃그림

  • Moon, Sungho (Department of Data Management, Busan University of Foreign Studies)
  • 문승호 (부산외국어대학교 데이터경영학과)
  • Received : 2016.01.18
  • Accepted : 2016.01.28
  • Published : 2016.02.29

Abstract

Outliers and influential data points distort many data analysis measures. Jang and Anderson-Cook (2014) proposed a graphical method called a rework plot for exploratory analysis purpose so that there could be a possible visualization of the trace of the impact of the possible outlying and/or influential data points on the univariate/bivariate data analysis and regression. They developed 3-D plot as well as pairwise plot for the appropriate measures of interest. This paper further extends their approach to identify its strength. We can use rework plots as a graphical exploratory data analysis tool to evaluate the impact of outliers in skewness and kurtosis of univariate data.

특이점 및 영향점은 자료분석을 하는 데 사용되는 계량적이고 기술적인 많은 측도들을 왜곡한다. 각종 자료분석에 있어서의 특이점 검색을 위한 검정 통계량이나 그림도구에 관한 연구는 꾸준히 전개되어 왔다. Jang과 Anderson-Cook (2014)은 불꽃그림이란 이름을 붙인 그림도구를 발표하였는데 이상점이나 영향점이 일변량/이변량 자료분석 및 회귀분석에 어떠한 영향을 미치는지 알기 위하여 3-D 불꽃그림 및 불꽃그림 행렬을 제시하였다. 본 연구에서는 이러한 불꽃그림이 일변량 자료의 왜도와 첨도에서 특이점의 영향을 평가하기 위한 탐색적 자료분석 그림도구로서 사용될 수 있음을 보였다.

Keywords

References

  1. Beckman, R. J. and Cook, R. D. (1983). Outlier....s, Technometrics, 25, 119-147.
  2. Belsley, D. A., Kuh, E., Welch, R. E. (1980). Regression Diagnostics: Identifying Influential Data and Source of Collinearity, Wiley, New York.
  3. Chatterjee, S. and Hadi, A. S. (2012). Regression Analysis by Example, 5th ed, Wiley, Hoboken.
  4. Cook, R. D. (1977). Detection of influential observation in linear regression, Technometrics, 19, 15-18.
  5. Cook, R. D. (1979). Influential observation in linear regression, Journal of American Statistical Association, 74, 169-174. https://doi.org/10.1080/01621459.1979.10481634
  6. Emerson, J. D. and Strenio, J. (1983). The Spread-versus-Level plot in Hoaglin, D. C., Mosteller, F., and Tukey, J. W.(Eds.) (1983). Understanding Robust and Exploratory Data Analysis, Wiley, New York.
  7. Fox, J. (2008). Applied Regression Analysis and Generalized Linear Models, 2nd ed., Sage, New York.
  8. Hampel, F. R. (1974). The influence curve and its role in robustness, The Annal of Statistics, 45, 383-393.
  9. Jang, D. H. and Anderson-Cook, C. M. (2014). Firework plot as a graphical exploratory data analysis tool for evaluating the impact of outliers in data exploration and regression, Quality and Reliability Engineering International, 30, 1409-1425. https://doi.org/10.1002/qre.1563
  10. Maronna, R. A., Martin, D., and Yohai, V. J. (2006). Robust Statistics, John Wiley & Sons, New York.