Annual Conference of KIPS (한국정보처리학회:학술대회논문집)
- 2003.05a
- /
- Pages.345-348
- /
- 2003
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
K-means Clustering Method according to Documentation Numbers
문서 수에 따른 가중치를 적용한 K-means 문서 클러스터링
- Cho, Cea-Sung (Dept. of Computer Information, ChongIn College) ;
- An, Dong-Un (Dept. of Computer Information, ChongIn College) ;
- Jeong, Sung-Jong (Dept. of Computer Information, ChongIn College) ;
- Lee, Shin-Won (Dept. of Computer Engineering, Chonbuk National University)
- Published : 2003.05.16
Abstract
본 논문에서는 이 문서 클러스터링 방법 중 계층적 방법인 Kmeans 클러스터링 알고리즘을 이용하여 문서를 클러스터링 하고자 한다 기존의 Kmeans 클러스터링 알고리즘은 문서의 수가 많을 경우 하나의 클러스터링에 너무 많은 문서들이 할당되는 문제점이 있다. 이 치우침을 완화하고자 각 클러스터링에 할당된 문서 수에 따라서 문서에 가중치를 부여한 후 다시 클러스터링을 하는 방법을 제안하였다. 실험 결과는 정확률, 재현율을 결합한 조화 평균(F-measure)를 사용하여 평가하였으며 기존 알고리즘보다 9%이상의 성능 향상을 나타냈다.
Keywords