DOI QR코드

DOI QR Code

Multidimensional scaling of categorical data using the partition method

분할법을 활용한 범주형자료의 다차원척도법

  • Shin, Sang Min (Department of Management Information Systems, Dong-A University) ;
  • Chun, Sun-Kyung (Department of Statistics, Pusan National University) ;
  • Choi, Yong-Seok (Department of Statistics, Pusan National University)
  • Received : 2017.10.23
  • Accepted : 2017.12.13
  • Published : 2018.02.28

Abstract

Multidimensional scaling (MDS) is an exploratory analysis of multivariate data to represent the dissimilarity among objects in the geometric low-dimensional space. However, a general MDS map only shows the information of objects without any information about variables. In this study, we used MDS based on the algorithm of Torgerson (Theory and Methods of Scaling, Wiley, 1958) to visualize some clusters of objects in categorical data. For this, we convert given data into a multiple indicator matrix. Additionally, we added the information of levels for each categorical variable on the MDS map by applying the partition method of Shin et al. (Korean Journal of Applied Statistics, 28, 1171-1180, 2015). Therefore, we can find information on the similarity among objects as well as find associations among categorical variables using the proposed MDS map.

다차원척도법은 개체간의 비유사성을 저차원 공간에 기하적으로 표현하기 위한 다변량 자료의 탐색적 분석기법이다. 그러나 일반적인 다차원척도그림에서는 개체들의 유사성 정보만이 표현될 뿐 변수와 관련된 정보가 나타나지 않기 때문에 그림의 해석 상에 한계점이 존재한다. 본 연구에서는 범주형 자료를 다중표시행렬로 변환하고 Torgerson (1958)의 알고리즘에 의한 다차원척도법을 적용하여 개체들의 군집화 성향과 군집들의 상대적 크기를 다차원척도그림으로 시각화하였다. 그리고 Shin 등 (2015)의 분할법을 적용하여 범주형변수의 범주수준별 정보를 다차원척도그림 상에 투영하여 추가적인 정보를 표현하였다. 따라서 본 연구에서 제안하고자 하는 다차원척도그림을 이용하면 개체들의 유사성 정보와 함께 범주형변수들 사이의 연관성도 탐색할 수 있는 장점이 있다.

Keywords

References

  1. Choi, Y. S. (2014). Walk in Multidimensional Scaling, Free Academy, Seoul.
  2. Choi, Y. S. and Shin, S. M. (2013). Understanding of Biplot Analysis using R, Free Academy, Seoul.
  3. Cox, T. F. and Cox, M. A. A. (2000). Multidimensional Scaling (2nd ed), Chapman & Hall, London.
  4. Gabriel, K. R. (1971). The biplot graphic display of matrices with application to principal component analysis, Biometrika, 58, 453-467. https://doi.org/10.1093/biomet/58.3.453
  5. Gower, J. C. (1992). Generalized biplots, Biometrika, 79, 475-493. https://doi.org/10.1093/biomet/79.3.475
  6. Gower, J. C. and Hand, D. J. (1996). Biplots, Chapman & Hall, London.
  7. Gower, J. C. and Harding, S. A. (1988). Nonlinear biplots, Biometrika, 75, 445-455. https://doi.org/10.1093/biomet/75.3.445
  8. Shin, S. M., Kim, E. S., and Choi, Y. S. (2015). Multidimensional scaling using the pseudo-points based on partition method, Korean Journal of Applied Statistics, 28, 1171-1180. https://doi.org/10.5351/KJAS.2015.28.6.1171
  9. Torgerson, W. S. (1958). Theory and Methods of Scaling, Wiley, New York.
  10. Young, G. and Householder, A. S. (1938). Discussion of a set of points in terms of their mutual distances, Psychometrika, 3, 19-22. https://doi.org/10.1007/BF02287916