Annual Conference of KIPS (한국정보처리학회:학술대회논문집)
- 2014.11a
- /
- Pages.750-752
- /
- 2014
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
A Study on Initial Seeds Selection of K-Means for Big Data Clustering
빅데이터 클러스터링을 위한 K-Means 초기 중심 선정 연구
- Kim, Yeong-Ju (Dept of Computer Engineering, Mok-po University) ;
- Heo, Yu-Gyeong (Dept of Computer Engineering, Mok-po University) ;
- Back, Jong-Sang (Dept of Information & Electronic Engineering, Mok-po University) ;
- Jeong, Hwan-Jong (Dept of Information & Electronic Engineering, Mok-po University) ;
- Lee, Sung-Ro (Dept of Information & Electronic Engineering, Mok-po University) ;
- Jung, Min-A (Dept of Computer Engineering, Mok-po University)
- 김영주 (목포대학교 컴퓨터공학과) ;
- 허유경 (목포대학교 컴퓨터공학과) ;
- 백종상 (목포대학교 정보전자공학과) ;
- 정환종 (목포대학교 정보전자공학과) ;
- 이성로 (목포대학교 정보전자공학과) ;
- 정민아 (목포대학교 컴퓨터공학과)
- Published : 2014.11.05
Abstract
K-Means 알고리즘은 구현이 쉽고, 패턴수가 n일 때 시간 복잡도가 O(n)인 장점을 가져 대용량 데이터에서 널리 이용된다. 그러나, K-Means 알고리즘은 초기 클러스터 중심을 어떻게 선정하는가에 따라 할당-재계산 횟수, 클러스터링 결과를 결정짓는다. 본 논문에서는 K-Means 알고리즘에서 클러스터 초기 중심 선정 연구를 살펴보고 계통임의추출법을 적용하여 K-Means 초기 중심 선정 방법을 제안한다. 제안한 방법은 대용량 데이터의 클러스터링 시간을 감소하고 정확도를 향상시킬 수 있다.
Keywords