Clustering Validity Assessment Using Relative Criteria for finding Optimal Clusters

최적의 군집을 찾기 위한 상대적 군집 평가 방법

  • 김영옥 (숭실대학교 컴퓨터학과 데이터마이닝 연구실) ;
  • 이수원 (숭실대학교 컴퓨터학과 데이터마이닝 연구실)
  • Published : 2002.10.01

Abstract

군집 분석은 데이터의 속성을 분석하여 서로 유사한 패턴을 가진 데이터를 묶는 방법이다. 군집 분석은 많은 응용 분야에서 쓰이고 있으나, 수행된 군집 분석 결과가 과연 정확한 결과이고 의미 있는 결과인지를 평가하는데 어려움이 있다. 본 논문에서는 군집이 형성된 데이터를 분석하여 군집 분석 결과를 평가하는 상대적 군집 평가 방법을 제안한다. 본 논문에서는 상대적 군집 평가 방법의 인덱스를 정의하고 형성된 군집 분석 결과에 적용해 최적의 군집, 의미 있는 군집을 찾을 수 있음을 보인다. 또한 실험을 통해 제안한 인덱스의 적합성을 보이며, 제안한 인덱스가 기존의 인덱스에 비해 최적의 군집, 의미 있는 군집을더 잘 찾을 수 있음을 보인다.

Keywords