Decision Tree Algorithm with Improved Entropy Using an Expert Opinion

전문가 의견을 반영하는 향상된 의사결정나무의 엔트로피 기법

  • Bak, Sun-Bin (School of Information and Communication Eng., SungKyunKwan University) ;
  • Kim, Dong-Moon (School of Information and Communication Eng., SungKyunKwan University) ;
  • Yoon, Tae-Bok (School of Information and Communication Eng., SungKyunKwan University) ;
  • Lee, Jee-Hyong (School of Information and Communication Eng., SungKyunKwan University)
  • 박선빈 (성균관대학교 정보통신공학부) ;
  • 김동문 (성균관대학교 정보통신공학부) ;
  • 윤태복 (성균관대학교 정보통신공학부) ;
  • 이지형 (성균관대학교 정보통신공학부)
  • Published : 2007.11.02

Abstract

최근 데이터의 양이 많아지고 다양해짐에 따라서 데이터를 활용하기 위한 데이터 마이닝에 관한 관심이 중대되고 있다. 데이터 분석을 위한 수집 데이터에는 수집 과정에서 분석가가 원치 않은 데이터 잡음이 발생하는 경우가 있고 그 데이터가 다른 데이터들과 같은 가중치로 데이터 마이닝에 반영되는 경우 예상과 다른 결과를 얻을 수 있다. 따라서 데이터 분석 시 데이터와 전문가 의견이 고려된 데이터 엔트로피(Entropy)를 사용하여 잡음 데이터를 다를 필요가 있다. 본 논문에서는 전문가의견을 이용한 전문가 의견 목록을 만들고 이를 데이터와 비교하여 유사한 정도에 따라 각 데이터에 가중치를 부여한다. 그리고 이 데이터를 활용한 의사결정나무(Decision Tree)를 사용하여 기존 데이터를 이용한 의사결정나무 보다 데이터 잡음의 영향을 줄이는 방법을 제안한다. 제안한 방법은 학습자의 학습 활동에서 수집된 학습 행위 데이터를 사용하여 실험하였다.

Keywords