Abstract
In general, exploratory data analysis consists of three processes: i) assessment of clustering tendency, ii) cluster analysis, and iii) cluster validation. This analysis method requiring a number of iterations of step ii) and iii) to converge is computationally inefficient. In this paper, we propose a density function-based approximate fuzzy clustering method with a hierachical structure which consosts of two phases: Phase I is a features(i.e., number of clusters and cluster centers) extraction process based on the tendency assessment of a given data and Phase II is a standard FCM with the cluster centers intialized by the results of the Phase I. Numerical examples are presented to show the validity of the proposed clustering method.
자료 분석 과정을 살펴 보면 1) 자료가 갖는 경향 평가, 2) 클러스터 분석, 3) 클러스터의 타당성 조사라는 과정을 거쳐 이루어진다. 이 분석법은 2) 및 3) 단계의 반복 수행으로 인하여 많은 계산 시간이 소요되므로 비효율적인 방법이라 할 수 있다. 본 논문에서는, 이와 같은 단점을 보완하기 위하여 자료가 갖는 개략적 특성을 파악하여 자료 속에 존재하는 클러스터의 근사적 개수 및 중심을 정한 후, 이 정보를 기존의 일반적인 퍼지 클러스터링 알고리즘에 입력하여 클러스터링을 수행하는 밀도함수를 이용한 계층적 구조의 근사적 클러스터링 알고리즘을 제안하고, 예제를 통하여 제안된 알고리즘의 타당성을 보인다.