Adaptive Euclidean Distance Measure Method for Numeric Data Distribution

수치 데이터 분포에 적응적 유클리드 거리 측정 기법

  • Choi, You-Hwan (Department of Computer Science and Engineering, Sogang University) ;
  • Joo, Bum-Joon (Department of Computer Science and Engineering, Sogang University) ;
  • Jung, Sung-Won (Department of Computer Science and Engineering, Sogang University)
  • 최유환 (서강대학교 컴퓨터공학과) ;
  • 조범준 (서강대학교 컴퓨터공학과) ;
  • 정성원 (서강대학교 컴퓨터공학과)
  • Published : 2011.06.29

Abstract

데이터의 군집 분석에서 두 개의 서로 다른 데이터에 대한 유사도(거리)를 어떻게 정의하는가는 매우 중요한 문제이다. 수치속성에 대한 거리 측정 방법에는 다양한 기법이 존재하지만 각 속성의 크기와 범위가 서로 크게 다를 경우 이들을 동일한 인자로 여기고 거리 측정을 하게 되면 논리적인 오류를 범할 수 있다. 기존의 군집 분석 연구에서 사용된 거리 측정 기법은 데이터의 정규화 과정을 통해 이 문제를 해결하려고 노력하지만 일반적인 정규화는 이상치의 존재나 데이터의 편중된 분포 등의 이유로 속성별 거리가 왜곡될 수 있다. 본 논문은 이러한 문제점을 해결하기 위해 정규화된 데이터에서 각 속성의 비중을 고려한 적응적 유클리드 거리 측정 기법(AEDM: Adaptive Euclidean Distance Measure)을 제안한다. AEDM은 유클리드 거리를 기반으로 정규화 된 데이터의 형태에 따라 가중치를 부여하여 데이터의 분포에 관계없이 각 속성간의 거리를 충분히 반영하기 때문에 더욱 정확한 군집 분석을 가능하게 한다.

Keywords

Acknowledgement

Supported by : 한국연구재단