• 제목/요약/키워드: Classification Tree Method

검색결과 358건 처리시간 0.025초

뇌파의 의사 결정 트리 분석과 가능성 기반 서포트 벡터 머신 분석을 통한 우울증 환자의 분류 (EEG Classification for depression patients using decision tree and possibilistic support vector machines)

  • 심우현;이기영;채정호;정재승;이도헌
    • Bioinformatics and Biosystems
    • /
    • 제1권2호
    • /
    • pp.134-138
    • /
    • 2006
  • 우울증은 가장 유병율이 높은 '기분 장애'(mood disorder)의 일종으로, 약 20%의 인구가 일생동안 우울증 증상을 한번쯤 경험한다. 이러한 우울증은 크게 '우울 장애'(major depressive disorder)와 '양극성 장애'(bipolar disorder)로 구분된다. 환자의 질병 분류에 따라 사용되는 약과 의학적 처방이 다르기 때문에, 우울증 환자의 빠르고 정확한 진단 및 분류는 매우 중요하다. 기존의 다면성 인성검사(MMPI)와 같은 통계적인 방법이 우울증 환자의 진단을 위해 사용돼 왔으나, 장시간의 집중력을 요구하기 때문에 집중력 저하의 특징을 보이는 우울증 환자들에게 적용하는데 어려움이 있다. 이 논문에서는 이러한 문제를 해결하고자, 빠른 측정이 가능하고 측정동안 집중력을 요하지 않는 EEC 데이터의 분석을 통해 우울증 환자의 분류를 시도하였다. EEG 채널 간 정보 흐름에서의 비선형성과 근사 엔트로피(approximate entropy)의 크기를 속성(attribute)으로 사용하여 데이터 마이닝 기법 중 의사 결정 트리(decision tree)와 가능성 기반 서포트 벡터머신(possibilistic support vector machines) 통해 분석을 수행하였다. 30명의 주요 우울장애환자와 24명의 양극성 장애 환자를 통해 위의 분석을 수행한 결과 의사 결정 트리의 경우 85.19% 의 정확도를 가지며 분류해냈고, 가능성 기반 서포트 벡터머신의 경우 77.78%의 정확도를 보여줬다. 본 연구는 가능성 기반 서포트 벡터 머신 분석이 우울증 환자는 진단하고 분류하는데 유용하게 적용될 수 있는 가능성을 제시하고 있다.

  • PDF

특징공간을 사선 분할하는 퍼지 결정트리 유도 (Fuaay Decision Tree Induction to Obliquely Partitioning a Feature Space)

  • 이우향;이건명
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권3호
    • /
    • pp.156-166
    • /
    • 2002
  • 결정트리 생성은 특징값들로 기술된 사례들로부터 분류 규칙을 추출하는 유용한 기계학습 방법중 하나이다. 결정트리는 특징공간을 분할하는 형태에 따라 단변수(univariate) 결정트리와 다변수(multivariate) 결정트리로 대별된다. 실제 현장에서 얻어지는 데이터는 관측오류, 불확실성, 주관적인 판단 등의 이유로 특징값 자체에 오류를 포함하는 경우가 많다. 이러한 오류에 대해 강건한 결정트리를 생성하기 위한 방법으로 퍼지 기법을 도입한 결정트리 생성 방법에 대한 연구가 진행되어 왔다. 현재까지 대부분의 퍼지 결정트리에 대한 연구는 단변수 결정트리에 퍼지 기법을 도입한 것들이며, 다변수 결정트리에 퍼지 기법을 적용한 것은 찾아보기 힘들다. 이 논문에서는 다변수 결정트리에 퍼지 기법을 적용하여 퍼지사선형 결정트리라고 하는 퍼지 결정트리를 생성하는 방법을 제안한다. 또한 제안한 결정트리 생성 방법의 특성을 보이기 위한 실험 결과를 보인다.

Decision Tree를 이용한 효과적인 유방암 진단 (Effective Diagnostic Method Of Breast Cancer Data Using Decision Tree)

  • 정용규;이승호;성호중
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.57-62
    • /
    • 2010
  • 최근 의료분야에서는 대규모의 데이터를 빠르게 검색 및 추출이 가능하게 의사결정트리 기법에 대한 연구들이 진행되고 있다. 현재 CART, C4.5, CHAID 등 여러 기법이 개발되었는데, 이러한 클레시파이 기법들은 몇몇 의사결정 나무 알고리즘이 이진분리로 분류를 하는데, 나머지 데이터의 결과가 손실될 우려가 있다. 그중 C4.5는 엔트로피의 측정값에 높고 낮음으로 트리 모양을 구성해 가는 방식이고, CART 알고리즘은 엔트로피 매트릭스를 사용하여 범주형 자료나 연속형 자료에 적용할수가 있다. 이에 본 논문에서는 클래시파이 기법 중 C4.5와 CART를 유방암 환자 데이터에 대해 적용하여 실험하여, 그 결과 분석을 통한 성능 평가를 수행하였다. 실험에서는 교차검증을 통해 그 결과에 대한 정확성을 측정하였다.

Waste Database Analysis Joined with Local Information Using Decision Tree Techniques

  • Park, Hee-Chang;Cho, Kwang-Hyun
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2005년도 춘계학술대회
    • /
    • pp.164-173
    • /
    • 2005
  • Data mining is the method to find useful information for large amounts of data in database. It is used to find hidden knowledge by massive data, unexpectedly pattern, relation to new rule. The methods of data mining are decision tree, association rules, clustering, neural network and so on. The decision tree approach is most useful in classification problems and to divide the search space into rectangular regions. Decision tree algorithms are used extensively for data mining in many domains such as retail target marketing, fraud detection, data reduction and variable screening, category merging, etc. We analyze waste database united with local information using decision tree techniques for environmental information. We can use these decision tree outputs for environmental preservation and improvement.

  • PDF

순차적으로 선택된 특성과 유전 프로그래밍을 이용한 결정나무 (A Decision Tree Induction using Genetic Programming with Sequentially Selected Features)

  • 김효중;박종선
    • 경영과학
    • /
    • 제23권1호
    • /
    • pp.63-74
    • /
    • 2006
  • Decision tree induction algorithm is one of the most widely used methods in classification problems. However, they could be trapped into a local minimum and have no reasonable means to escape from it if tree algorithm uses top-down search algorithm. Further, if irrelevant or redundant features are included in the data set, tree algorithms produces trees that are less accurate than those from the data set with only relevant features. We propose a hybrid algorithm to generate decision tree that uses genetic programming with sequentially selected features. Correlation-based Feature Selection (CFS) method is adopted to find relevant features which are fed to genetic programming sequentially to find optimal trees at each iteration. The new proposed algorithm produce simpler and more understandable decision trees as compared with other decision trees and it is also effective in producing similar or better trees with relatively smaller set of features in the view of cross-validation accuracy.

적외선 영상에서의 시계열 특징 추출을 이용한 Gunnery 분류 기법 연구 (Gunnery Classification Method Using Profile Feature Extraction in Infrared Images)

  • 김재협;조태욱;천승우;이종민;문영식
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권10호
    • /
    • pp.43-53
    • /
    • 2014
  • Gunnery 표적으로부터 발생하는 영상특징은 장비의 위치를 탐지하고 종류를 판별하는 주요 정보로 활용될 수 있다. 본 논문에서는 Gunnery 영상에서 표적 영역의 밝기값을 획득하여 특징을 추출하고 분류하는 기법을 제안한다. 제안하는 기법에서는 38~40개의 신호 기반 특징과 2개의 모델 기반 특징을 추출하여 분석하고 분류모델에 적용한다. 다중 클래스 분류를 위하여 트리(tree) 기반의 분류 모델을 설계하였으며, 시스템에서 요구하는 Gunnery의 종류와 특성에 따라 유사도를 정의하여 트리 구조를 설계하였다. 트리 구성 단계에서는 각 레벨마다 SVM(Support Vector Machine)을 이용하여 분류 하였으며 시스템에서 요구하는 분류 성능을 만족함을 확인하였다.

어휘 인식 시스템에서 학습 모델 분류를 위한 결정 트리 학습 알고리즘 (Decision Tree Learning Algorithms for Learning Model Classification in the Vocabulary Recognition System)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제11권9호
    • /
    • pp.153-158
    • /
    • 2013
  • 인식 대상 학습 모델이 분류되어 있지 않거나 명확하게 분류되지 않은 경우 어휘 인식을 결정하지 못하여 인식률이 저하되며 학습 모델 분류 형태가 변경되거나 새로운 학습 모델이 추가되면 인식 모델의 결정 트리 구조가 변경되어야 하는 구조적 문제가 발생한다. 이러한 문제점을 해결하기 위하여 학습 모델 분류를 위한 결정 트리 학습 알고리즘을 제안한다. 음운 현상이 충분히 반영된 음성 데이터베이스를 구성하고 학습 효과를 확보하기 위하여 학습 모델 분류를 위한 결정 트리 방법을 사용하였다. 본 연구에서는 실내 환경에 대하여 어휘 종속 인식과 어휘 독립 인식 실험을 수행한 결과 실내 환경의 어휘 종속 실험에서는 98.3%의 인식 성능을 보였고, 어휘 독립 실험에서 98.4%의 인식 성능을 보였다.

고장수목을 이용한 변전소의 지진취약도 분석 (Seismic Fragility Analysis of Substation Systems by Using the Fault Tree Method)

  • 김민규;전영선;최인길;오금호
    • 한국지진공학회논문집
    • /
    • 제13권2호
    • /
    • pp.47-58
    • /
    • 2009
  • 본 연구에서는 변전소 시스템의 지진취약도 분석을 수행하여 변전소에 대한 지진취약도 함수를 제시하였다. 변전소는 여러 개의 설비와 구조물이 복합적으로 구성되어 있는 시스템이므로 각 설비에 대한 지진취약도 분석을 수행하여 이를 바탕으로 고장수목을 작성하여 변전소 전체의 파괴확률을 산정함으로써 변전소에 대한 지진취약도 평가를 수행하였다. 이를 위하여 국내 변전소의 현황을 파악하여 지진피해추정을 위한 변전소의 분류형식을 결정하였으며, 결정된 대표변전소 형식에 대한 평가대상 기기를 선정하였다. 대표 변전소 형식으로는 765kV, 345kV, 154kV 변전소의 GIS형 변전소로 결정하였다. 각 변전소의 취약도 검토대상 기기로는 변압기와 절연 애자를 선택하였다. 각 변전소의 변압기와 절연애자의 파괴모드와 파괴기준을 설정하여 지진취약도 곡선을 도출하였다. 최종적으로 변전소에 대한 고장수목을 이용하여 각 기기의 지진취약도 곡선으로부터 변전소 전체의 파괴확률을 산정하여 정의된 손상상태별 변전소의 지진취약도 함수를 산정하였다.

다중공선성과 불균형분포를 가지는 공정데이터의 분류 성능 향상에 관한 연구 (A Study on Improving Classification Performance for Manufacturing Process Data with Multicollinearity and Imbalanced Distribution)

  • 이채진;박정술;김준석;백준걸
    • 대한산업공학회지
    • /
    • 제41권1호
    • /
    • pp.25-33
    • /
    • 2015
  • From the viewpoint of applications to manufacturing, data mining is a useful method to find the meaningful knowledge or information about states of processes. But the data from manufacturing processes usually have two characteristics which are multicollinearity and imbalance distribution of data. Two characteristics are main causes which make bias to classification rules and select wrong variables as important variables. In the paper, we propose a new data mining procedure to solve the problem. First, to determine candidate variables, we propose the multiple hypothesis test. Second, to make unbiased classification rules, we propose the decision tree learning method with different weights for each category of quality variable. The experimental result with a real PDP (Plasma display panel) manufacturing data shows that the proposed procedure can make better information than other data mining procedures.

벌점 부분최소자승법을 이용한 분류방법 (A new classification method using penalized partial least squares)

  • 김윤대;전치혁;이혜선
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권5호
    • /
    • pp.931-940
    • /
    • 2011
  • 분류분석은 학습표본으로부터 분류규칙을 도출한 후 새로운 표본에 적용하여 특정 범주로 분류하는 방법이다. 데이터의 복잡성에 따라 다양한 분류분석 방법이 개발되어 왔지만, 데이터 차원이 높고 변수간 상관성이 높은 경우 정확하게 분류하는 것은 쉽지 않다. 본 연구에서는 데이터차원이 상대적으로 높고 변수간 상관성이 높을 때 강건한 분류방법을 제안하고자 한다. 부분최소자승법은 연속형데이터에 사용되는 기법으로서 고차원이면서 독립변수간 상관성이 높을 때 예측력이 높은 통계기법으로 알려져 있는 다변량 분석기법이다. 벌점 부분최소자승법을 이용한 분류방법을 실제데이터와 시뮬레이션을 적용하여 성능을 비교하고자 한다.