• 제목/요약/키워드: ID3 결정트리

검색결과 20건 처리시간 0.022초

시간 가중치 엔트로피를 이용한 결정 트리 생성 알고리즘 (ID3 Algorithm Improved with Time-weighted Entropy)

  • 동립권;이지형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.625-627
    • /
    • 2005
  • 결정 트리(Decision Tree)는 주어진 데이터의 경향을 학습하는 데 사용되는 대표적인 방식이다. 이것은 주어진 데이터를 구조화하기 위하여 데이터의 속성과 정보의 엔트로피에 기반을 둔 정보획득량을 이용한다. 본 논문에서는 유비쿼터스 환경에서 사용자 프로파일 정보처럼 시간에 따라 그 경향이 변하는 데이터에 유용하게 적용할 수 있는 시간 가중치 엔트로피를 정의한다. 그리고 ID3 알고리즘을 기반으로 새롭게 제안하는 시간 가중치 엔트로피를 이용하는 향상된 ID3 알고리즘을 쓰고 사용자의 경향을 분석한다. 본 논문에서 제안하는 엔트로피를 이용하는 방식은 데이터들의 시간에 관한 영향을 고려해서 기준방식보다 분석결과가 더욱 유리하다. 두 방식의 비교 테스트 결과를 보면 시간 가중치 엔트로피를 이용하는 알고리즘은 기존의 ID3 알고리즘보다 구성된 트리의 구조가 매우 간단하고 유리하다.

  • PDF

퍼지 결정 트리를 이용한 효율적인 퍼지 규칙 생성 (Efficient Fuzzy Rule Generation Using Fuzzy Decision Tree)

  • 민창우;김명원;김수광
    • 전자공학회논문지C
    • /
    • 제35C권10호
    • /
    • pp.59-68
    • /
    • 1998
  • 데이터 마이닝의 목적은 유용한 패턴을 찾음으로써 데이터를 이해하는데 있으므로, 찾아진 패턴은 정확할뿐 아니라 이해하기 쉬워야한다. 따라서 정확하고 이해하기 쉬운 패턴을 추출하는 데이터 마이닝에 대한 연구가 필요하다. 본 논문에서는 퍼지 결정 트리를 이용한 효과적인 데이터 마이닝 알고리즘을 제안한다. 제안된 알고리즘은 ID3, C4.5와 같은 결정 트리 알고리즘의 이해하기 쉬운 장점과 퍼지의 표현력을 결합하여 간결하고 이해하기 쉬운 규칙을 생성한다. 제안된 알고리즘은 히스토그램에 기반하여 퍼지 소속함수를 생성하는 단계와 생성된 소속 함수를 이용하여 퍼지 결정 트리를 구성하는 두 단계로 이루어진다. 또한 제안된 방법의 타당성을 검증하기 위하여 표준적인 패턴 분류 벤치마크 데이터인 Iris 데이터와 Wisconsin Breast Cancer 데이터에 대한 실험 결과를 보인다.

  • PDF

퍼지 ID3를 이용한 CEO핵심역량의 패턴분석 (Pattern Analysis of Core Competency of CEO Using Fuzzy ID3)

  • 박봉경;황승국
    • 한국지능시스템학회논문지
    • /
    • 제20권2호
    • /
    • pp.273-278
    • /
    • 2010
  • 중소기업에서도 시스템적으로 기업을 운영하는 곳도 있지만 대부분의 중소기업에서는 CEO 개인의 역량과 수준에 따라 기업의 경영패턴이 달라진다고 할 수 있다. 이러한 관점에서 중소기업의 CEO의 역량과 수준에 대한 연구는 매우 의미있다고 할 수 있다. 따라서, 본 연구에서는 중소제조업체의 CEO를 대상으로 설문을 통하여 중소기업 CEO의 핵심역량을 발굴하고 중소기업 CEO의 핵심역량을 평가할 수 있는 모델을 제안하였다. 또한 중소기업 CEO의 핵심역량과 수준에 대한 전문가 평가를 통하여 구한 데이터를 ID3와 퍼지ID3를 이용하여 패턴분석을 하였으며, 그 결과로 생성되는 if-then 퍼지룰과 의사결정트리가 중소기업의 CEO 핵심역량 평가에 유용하다는 것을 보였다.

RFID 시스템을 위한 하이브리드 하이퍼 쿼리 트리 알고리즘 (A Hybrid Hyper Query Tree Algorithm for RFID System)

  • 김태희;이성준;안광선
    • 정보처리학회논문지A
    • /
    • 제15A권5호
    • /
    • pp.287-294
    • /
    • 2008
  • RFID 시스템에서 리더와 태그는 단일 무선 공유 채널을 갖기 때문에 RFID 수동형 태그를 위한 태그 충돌 중재가 태그 인식을 위한 중요한 이슈이다. 본 논문에서는 태그 충돌 방지를 위한 하이브리드 하이퍼 쿼리 트리 알고리즘($H^{2}QT$, Hybrid Hyper Query Tree)을 제안한다. 제안된 알고리즘은 쿼리 트리를 기반으로 태그가 리더에게 ID를 전송하는 시점을 전송ID 상위 3비트 내의 '1'값을 이용하여 결정한다. 또한 전송 받은 Tag의 상위 3비트는 충돌이 발생하더라도 전송 슬롯에 따라 다르므로 제안한 알고리즘에서 예측이 가능하다. 시뮬레이션을 통한 성능 평가에서 다른 트리 기반 프로토콜에 비해 제안한 알고리즘이 쿼리 횟수에서 높은 성능을 갖는다는 것을 보여준다.

퍼지 결정트리를 이용한 패턴분류를 위한 데이터 마이닝 알고리즘 (Data Mining Algorithm Based on Fuzzy Decision Tree for Pattern Classification)

  • 이중근;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권11호
    • /
    • pp.1314-1323
    • /
    • 1999
  • 컴퓨터의 사용이 일반화됨에 따라 데이타를 생성하고 수집하는 것이 용이해졌다. 이에 따라 데이타로부터 자동적으로 유용한 지식을 얻는 기술이 필요하게 되었다. 데이타 마이닝에서 얻어진 지식은 정확성과 이해성을 충족해야 한다. 본 논문에서는 데이타 마이닝을 위하여 퍼지 결정트리에 기반한 효율적인 퍼지 규칙을 생성하는 알고리즘을 제안한다. 퍼지 결정트리는 ID3와 C4.5의 이해성과 퍼지이론의 추론과 표현력을 결합한 방법이다. 특히, 퍼지 규칙은 속성 축에 평행하게 판단 경계선을 결정하는 방법으로는 어려운 속성 축에 평행하지 않는 경계선을 갖는 패턴을 효율적으로 분류한다. 제안된 알고리즘은 첫째, 각 속성 데이타의 히스토그램 분석을 통해 적절한 소속함수를 생성한다. 둘째, 주어진 소속함수를 바탕으로 ID3와 C4.5와 유사한 방법으로 퍼지 결정트리를 생성한다. 또한, 유전자 알고리즘을 이용하여 소속함수를 조율한다. IRIS 데이타, Wisconsin breast cancer 데이타, credit screening 데이타 등 벤치마크 데이타들에 대한 실험 결과 제안된 방법이 C4.5 방법을 포함한 다른 방법보다 성능과 규칙의 이해성에서 보다 효율적임을 보인다.Abstract With an extended use of computers, we can easily generate and collect data. There is a need to acquire useful knowledge from data automatically. In data mining the acquired knowledge needs to be both accurate and comprehensible. In this paper, we propose an efficient fuzzy rule generation algorithm based on fuzzy decision tree for data mining. We combine the comprehensibility of rules generated based on decision tree such as ID3 and C4.5 and the expressive power of fuzzy sets. Particularly, fuzzy rules allow us to effectively classify patterns of non-axis-parallel decision boundaries, which are difficult to do using attribute-based classification methods.In our algorithm we first determine an appropriate set of membership functions for each attribute of data using histogram analysis. Given a set of membership functions then we construct a fuzzy decision tree in a similar way to that of ID3 and C4.5. We also apply genetic algorithm to tune the initial set of membership functions. We have experimented our algorithm with several benchmark data sets including the IRIS data, the Wisconsin breast cancer data, and the credit screening data. The experiment results show that our method is more efficient in performance and comprehensibility of rules compared with other methods including C4.5.

RFID 시스템을 위한 개선된 하이브리드 쿼리 트리 알고리즘 (An Improved Hybrid Query Tree Algorithm for RFID System )

  • 김태희;이성준;안광선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.802-805
    • /
    • 2008
  • RFID 시스템에서 리더와 태그는 단일 무선 공유 채널을 갖기 때문에 RFID 수동형 태그를 위한 태그 충돌 중재가 태그 인식을 위한 중요한 이슈이다. 본 논문에서는 태그 충돌 방지를 위한 Improved Hybrid Query Tree algorithm 을 제안한다. 제안된 알고리즘은 쿼리 트리를 기반으로 태그가 리더에게 ID 를 전송하는 시점을 전송 ID 상위 3 비트 내의 '1' 값을 이용하여 결정한다. 또한 전송받은 Tag 의 상위 3 비트는 충돌이 발생하더라도 전송 슬롯에 따라 다르므로 제안한 알고리즘에서 예측이 가능하다. 시뮬레이션을 통한 성능 평가에서 다른 트리 기반 프로토콜에 비해 제안한 알고리즘이 쿼리 횟수에서 높은 성능을 갖는다는 것을 보여준다.

지지 벡터 머신을 이용한 다변수 결정 트리 (A Multivariate Decision Tree using Support Vector Machines)

  • 강선구;이병우;나용찬;조현성;윤철민;양지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.278-283
    • /
    • 2006
  • 결정 트리는 큰 가설 공간을 가지고 있어 유연하고 강인한 성능을 지닐 수 있다. 하지만 결정트리가 학습 데이터에 지나치게 적응되는 경향이 있다. 학습데이터에 과도하게 적응되는 경향을 없애기 위해 몇몇 가지치기 알고리즘이 개발되었다. 하지만, 데이터가 속성 축에 평행하지 않아서 오는 공간 낭비의 문제는 이러한 방법으로 해결할 수 없다. 따라서 본 논문에서는 다변수 노드를 사용한 선형 분류기를 이용하여 이러한 문제점을 해결하는 방법을 제시하였으며, 결정트리의 성능을 높이고자 지지 벡터 머신을 도입하였다(SVMDT). 본 논문에서 제시한 알고리즘은 세 가지 부분으로 이루어졌다. 첫째로, 각 노드에서 사용할 속성을 선택하는 부분과 둘째로, ID3를 이 목적에 맞게 바꾼 알고리즘과 마지막으로 기본적인 형태의 가지치기 알고리즘을 개발하였다. UCI 데이터 셋을 이용하여 OC1, C4.5, SVM과 비교한 결과, SVMDT는 개선된 결과를 보였다.

  • PDF

퍼지 ID3를 이용한 지속가능경영의 패턴분석에 관한 연구 (A Study on Pattern Analysis of Sustainability Management Using Fuzzy ID3)

  • 김홍진;황승국
    • 한국지능시스템학회논문지
    • /
    • 제18권5호
    • /
    • pp.700-705
    • /
    • 2008
  • 본 논문에서는 중소기업의 지속가능경영을 평가하기 위한 평가모델을 제안하였다. 또한, 퍼지 ID3에 의하여 구해진 패턴분석에 대한 if-then 룰과 의사결정트리를 보여준다. 본 논문에서 제안한 평가모델은 중소기업의 경쟁력 향상의 평가도구로서 사용이 가능하다. 중소기업이 퍼지 ID3를 이용한 지속가능경영의 패턴분석에 사용된 평가 룰을 사전에 알 수 있다면 중소기업들의 자체 평가에 효과적으로 사용될 수 있으리라 기대된다.

요양보호사의 서비스평가에 대한 퍼지적 접근 (A Fuzzy Approach to Evaluation of Home-helper's Service)

  • 장윤정
    • 한국지능시스템학회논문지
    • /
    • 제21권1호
    • /
    • pp.62-67
    • /
    • 2011
  • 본 연구는 요양보호사의 서비스평가에 관련된 요인을 파악하고자 한다. 나아가 퍼지ID3를 이용한 패턴분석을 통해 서비스 평가 수준을 결정하는 일정한 룰을 발견하여 요양보호서비스의 질을 높이기 위한 방안을 제시하고자 한다. 요양보호사 230명의 설문지를 분석한 결과, 요양보호사의 서비스평가에는 요양서비스를 제공하는데 필요한 지식 및 기술과 담당하고 있는 이용자의 정보파악이 통계적으로 유의미한 관계가 있다는 것을 알 수 있었다. 한편, 퍼지 ID3를 이용한 패턴분석에 의하면 요양보호사의 지식 및 기술수준이 상대적으로 낮다고 하더라도 이용자정보 파악 수준이 높으면 서비스평가 수준이 높다는 것을 알 수 있었다. 따라서 본 연구에 의하면 요양보호사의 서비스평가에는 지식 및 기술 보다 이용자정보 파악이 보다 중요한 변인이라는 사실이 시사되었다.

데이터 마이닝을 위한 퍼지 결정트리 (A Fuzzy Decision Tree for Data Mining)

  • 이중근;민창우;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.63-65
    • /
    • 1998
  • 사회 전 분야에서 데이터가 폭발적으로 증가함에 따라 데이터를 이해하고 분석하는 새로운 자동적이고 지능적인 데이터 분석 도구와 기술이 필요하게 되었다. KDD(Knowledge Discovery in Databases)는 이러한 필요로부터 데이터에서 유용하고 이해 가능한 지식을 추출하는 연구이다. 데이터 마이닝(Data Mining)은 KDD에서 가장 중요한 단계로 데이터로부터 지식을 추출하는 단계이다. 데이터 마이닝에서 생성된 지식은 좋은 분류율을 가져야하고 이해하기 쉬워야한다. 본 논문에서는 퍼지 결정트리(FDT : Fuzzy Decision Tree)에 기반한 효율적인 데이터 마이닝 알고리즘을 제안한다. FDT의 각 링크는 속성(attribute) 값을 갖는 퍼지 집합이며, EDT의 각 경로는 퍼지 규칙을 생성한다. 제안된 알고리즘은 ID3의 이해성과 퍼지이론의 추론과 표현력을 결합한 방법으로 히스토그램에 이루어진다. 마지막으로 제안된 방법의 타당성을 검증하기 위해 표준적인 패턴 분류 벤치마크 데이터에 대한 실험 결과를 보인다.

  • PDF