DOI QR코드

DOI QR Code

Visualizing multidimensional data in multiple groups

다그룹 다차원 데이터의 시각화

  • Received : 2016.10.04
  • Accepted : 2016.11.29
  • Published : 2017.02.28

Abstract

A typical approach to visualizing k (${\geq}2$)-group multidimensional data is to use Fisher's canonical discriminant analysis (CDA). CDA finds the best low-dimensional subspace that accommodates k group centroids in the Mahalanobis space. This paper proposes an alternative visualization procedure functioning in the Euclidean space, which finds the primary dimension with maximum discrimination of k group centroids and the secondary dimension with maximum dispersion of all observational units. This hybrid procedure is especially useful when the number of groups k is two.

k (${\geq}2$) 그룹의 p-차원 데이터의 시각화에서 가장 전형적인 방법은 Fisher의 정준판별분석(canonical discriminant analysis; CDA)이다. CDA는 마할라노비스 공간에서 k개 그룹 중심을 근사하게 통과하는 저차원 부공간에 관측점들을 사영한다. 본 논문은 척도화 유클리드 공간에서 다그룹 다차원 데이터를 시각화하는 방법을 제안하는데, 저차원 부공간의 제1축(또는 제1축과 제2축)은 그룹 중심들의 최대변별(maximum discrimination)에서 찾고 부공간의 제2축(또는 제3축)은 관측개체들의 최대산포(maximum dispersion)에서 찾는다. 이러한 혼종방법(hybrid method)은 2-그룹 다차원 자료의 시각화에서 특히 유용하다.

Keywords

References

  1. Choi, Y. S., Hyun, G. H., and Jung, S. M. (2005). MANCOVA biplot, Korean Communications in Statistics, 12, 705-712.
  2. Choi, Y. S. and Shin, S. M. (2013). Understanding Biplots Analysis Using R, Freedom Academy, Korea.
  3. Fisher, R. A. (1936). The use of multiple measurements in taxonomic problems, Annals of Eugenics, 7, 179-188. https://doi.org/10.1111/j.1469-1809.1936.tb02137.x
  4. Gabriel, K. R. (1971). The biplot graphic display of matrices with application to principal component analysis, Biometrika, 58, 453-467. https://doi.org/10.1093/biomet/58.3.453
  5. Gower, J. C. and Hand, D. J. (1996). Biplots, Chapman and Hall, London.
  6. Huh, M. H. (2012). Exploratory Multivariate Data Analysis, Freedom Academy, Korea.
  7. Huh, M. H. (2013). Biplots of multivariate data guided by linear and/or logistic regression, Communications for Statistical Applications and Methods, 20, 129-136. https://doi.org/10.5351/CSAM.2013.20.2.129
  8. Huh, M. H., Lee, Y. G., and Yi, S. K. (2007). Visualizing (X,Y) data by partial least squares method, Korean Journal of Applied Statistics, 20, 345-355. https://doi.org/10.5351/KJAS.2007.20.2.345
  9. Park, M. R. and Huh, M. H. (1996). Canonical correlation biplot, Korean Communications in Statistics, 3, 11-19.