유전자 알고리즘을 이용한 군집화 기법의 적합도 함수에 관한 연구

A Study on Fitness Function of Clustering Algorithm based on Genetic Algorithm

  • 이수정 (연세대학교 컴퓨터과학과) ;
  • 권혜련 (연세대학교 컴퓨터과학과) ;
  • 김은주 (연세대학교 컴퓨터과학과) ;
  • 이일병 (연세대학교 컴퓨터과학과)
  • 발행 : 2001.04.01

초록

최근 관심의 대상이 되고 있는 CRM, eCRM에는 데이터 마이닝 기법이 핵심 기술로 이용되고 있다. 이러한 데이터 마이닝 기법가운데 가장 널리 사용되고 있는 군집화는, 데이터 집합을 유사한 데이터의 군집들로 분할하여 데이터 속에 존재하는 의미 있는 정보를 얻는 것이다. 그런데 기존의 군집화 알고리즘은 사전에 군집의 개수를 미리 결정해줘야 하고 잡음에 민감하여 지역적 최적해(local minima)에 수렴할 수 있다는 문제점을 가지고 있다. 이러한 문제점의 개선을 위해, 본 논문에서는 유사도 개념을 적합도 함수로 사용하는 유전자 알고리즘을 적용한 군집화 기법을 제안하다. 특히 적합도 하수에 사용된 군집의 대표값 개념은 요약 정보만을 이용하여 계산속도가 향상되기 때문에 대용량 데이터를 다루는 마이닝에 적합할 것을 기대된다.

키워드