Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)
- 2005.05a
- /
- Pages.423-426
- /
- 2005
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
an Automatic Calculation Method of Feature Weights in k Nearest Neighbor Algorithms
kNN 알고리즘에서의 속성 가중치 자동계산 방법
- Lee, Kang-Il (Dept of Information and Communication Engineering, Dong-Guk University) ;
- Lee, Chang-Hwan (Dept of Information and Communication Engineering, Dong-Guk University)
- Published : 2005.05.13
Abstract
기억기반학습의 일종인 최근접 이웃(k nearest neighbor) 알고리즘은 과거의 데이터들 중에서 새로운 개체와 유사한 데이터들을 이용해서 새로운 개체의 목적 값을 예측하는 것이다. 이 경우 속성의 가중치를 계산하는 방식은 kNN의 성능을 결정하는 중요한 요소가 된다. 본 논문에서는 기존의 다른 이론들과 달리 정보이론에서 사용되는 엔트로피 개념을 이용해서 속성의 가중치를 이론적이고, 효과적으로 계산하는 새로운 방법을 제시하고자한다. 제안된 방법은 각 속성이 목적속성에 제공하는 정보의 양에 따라 가중치를 자동으로 계산하여 kNN의 성능을 향상시킨다. 마지막으로 이러한 방식의 성능을 다수의 실험을 통해 비교하였다.
Keywords