DOI QR코드

DOI QR Code

A Study on Initial Seeds Selection of K-Means for Big Data Clustering

빅데이터 클러스터링을 위한 K-Means 초기 중심 선정 연구

  • Kim, Yeong-Ju (Dept of Computer Engineering, Mok-po University) ;
  • Heo, Yu-Gyeong (Dept of Computer Engineering, Mok-po University) ;
  • Back, Jong-Sang (Dept of Information & Electronic Engineering, Mok-po University) ;
  • Jeong, Hwan-Jong (Dept of Information & Electronic Engineering, Mok-po University) ;
  • Lee, Sung-Ro (Dept of Information & Electronic Engineering, Mok-po University) ;
  • Jung, Min-A (Dept of Computer Engineering, Mok-po University)
  • 김영주 (목포대학교 컴퓨터공학과) ;
  • 허유경 (목포대학교 컴퓨터공학과) ;
  • 백종상 (목포대학교 정보전자공학과) ;
  • 정환종 (목포대학교 정보전자공학과) ;
  • 이성로 (목포대학교 정보전자공학과) ;
  • 정민아 (목포대학교 컴퓨터공학과)
  • Published : 2014.11.05

Abstract

K-Means 알고리즘은 구현이 쉽고, 패턴수가 n일 때 시간 복잡도가 O(n)인 장점을 가져 대용량 데이터에서 널리 이용된다. 그러나, K-Means 알고리즘은 초기 클러스터 중심을 어떻게 선정하는가에 따라 할당-재계산 횟수, 클러스터링 결과를 결정짓는다. 본 논문에서는 K-Means 알고리즘에서 클러스터 초기 중심 선정 연구를 살펴보고 계통임의추출법을 적용하여 K-Means 초기 중심 선정 방법을 제안한다. 제안한 방법은 대용량 데이터의 클러스터링 시간을 감소하고 정확도를 향상시킬 수 있다.

Keywords