• Title/Summary/Keyword: classifiers

Search Result 743, Processing Time 0.025 seconds

Classification of High Dimensionality Data through Feature Selection Using Markov Blanket

  • Lee, Junghye;Jun, Chi-Hyuck
    • Industrial Engineering and Management Systems
    • /
    • v.14 no.2
    • /
    • pp.210-219
    • /
    • 2015
  • A classification task requires an exponentially growing amount of computation time and number of observations as the variable dimensionality increases. Thus, reducing the dimensionality of the data is essential when the number of observations is limited. Often, dimensionality reduction or feature selection leads to better classification performance than using the whole number of features. In this paper, we study the possibility of utilizing the Markov blanket discovery algorithm as a new feature selection method. The Markov blanket of a target variable is the minimal variable set for explaining the target variable on the basis of conditional independence of all the variables to be connected in a Bayesian network. We apply several Markov blanket discovery algorithms to some high-dimensional categorical and continuous data sets, and compare their classification performance with other feature selection methods using well-known classifiers.

Evaluation of Bayesian Model Averaging (BMA) of Bayesian Network Classifiers (BNCs) on Small Datasets (작은 데이터에 대한 베이지안망 분류기(BNC)의 베이지안 모델 평균화(BMA) 성능 평가)

  • 황규백;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.22-24
    • /
    • 2003
  • 작은 데이터에서 베이지안망 분류기(Bayesian network classifier, BNC)를 학습할 때, 과대적합(overfitting)으로 인한 일반화 성능의 저하가 초래된다 이런 경우, 베이지안 모델 평균화(Bayesian model averaging, BMA)는 모델 자체에 대한 불확실성을 분석 과정에서 고려함으로써, 성능 저하를 피할 수 있는 수단을 제공한다. 본 논문에서는 BNC의 BMA의 작은 데이터에 대한 성능을 평가 및 분석한다. 특히, 노드의 순서에 대한 평균화의 효과가 연구된다. 인공데이터에 대한 실험 결과, 노드의 순서가 BNC의 BMA의 분류 성능에 미치는 영향은 지대하며, 이는 데이터의 크기가 극히 작은 경우의 성능 저하에 직접적인 원인이 된다.

  • PDF

A Pattern Recognition Algorithm based on Dynamic Selection of Micro Classifiers (마이크로 인식기의 동적 선택에 의한 패턴인식)

  • Song, Hyeo-Jung;Kim, Baek-Sop
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.397-400
    • /
    • 2002
  • 최근 패턴인식분야에서 성능향상을 목적으로 개별인식기들을 결합하거나 동적 선택에 대한 연구가 활발하게 진행되고 있다. 인식기를 동적으로 선택하는 경우에는 전체 학습패턴으로부터 학습한 개별 인식기를 이용하거나 클러스터링 알고리즘을 이용하여 학습패턴들을 특징공간에서의 부 영역으로 분할한 다음 각 클래스를 하나의 영역과 대응하는 방법이 사용되어 왔다. 이러한 접근방법에서는 각 패턴의 지역적인 정보를 이용하기 때문에 클래스 사이의 결정 경계부분에 대한 지역적인 정보를 이용하기 어렵다. 본 논문에서는 학습패턴의 지역적 영역에 대한 마이크로 인식기를 설계하여 임의의 테스트 패턴에 대한 지역적 영역에서 가장 성능이 좋은 인식기를 동적으로 선택하여 인식 성능을 향상시키는 방법을 제안한다.

  • PDF

Data Fusion, Ensemble and Clustering for the Severity Classification of Road Traffic Accident in Korea (데이터융합, 앙상블과 클러스터링을 이용한 교통사고 심각도 분류분석)

  • Sohn, So-Young;Lee, Sung-Ho
    • Journal of Korean Institute of Industrial Engineers
    • /
    • v.26 no.4
    • /
    • pp.354-362
    • /
    • 2000
  • Increasing amount of road tragic in 90's has drawn much attention in Korea due to its influence on safety problems. Various types of data analyses are done in order to analyze the relationship between the severity of road traffic accident and driving conditions based on traffic accident records. Accurate results of such accident data analysis can provide crucial information for road accident prevention policy. In this paper, we apply several data fusion, ensemble and clustering algorithms in an effort to increase the accuracy of individual classifiers for the accident severity. An empirical study results indicated that clustering works best for road traffic accident classification in Korea.

  • PDF

Profiling Green IT Leaders Quantitatively and Qualitatively

  • Kim, Yong Seog;Kwag, Seung Woog
    • Industrial Engineering and Management Systems
    • /
    • v.12 no.2
    • /
    • pp.118-129
    • /
    • 2013
  • In this study, we intend to identify key financial variables that can accurately classify Green IT leaders against Green IT followers. In particular, we build and compare single and meta-classifiers to identify the relationship between environmental performance and financial performance, while focusing on selecting and interpreting a final prediction model with a smaller set of financial performance indicators. Our experimental results demonstrate that several key variables representing the size, financial resources, operational efficiency, and risk-taking tendency of an organization can successfully identify Green IT leaders with approximately 90% of accuracy. In addition, we find that Green IT leaders show a higher utilization rate of Web pages as a green marketing channel than Green IT followers while they share common layouts of Web publication to build green IT brands with some differences.

The Method of Gene Selection for Machine Learning Classifiers In Career Classification (암 분류를 목적으로 하는 기계 학습 분류기를 위한 효과적인 유전자 선택 방법)

  • 박형근;이수정;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.205-207
    • /
    • 2004
  • 유전자 발현 분석 시스템에 있어서 microarray 기술의 발전은 유전 질환 진단의 정확성과 신뢰도를 향상시키는 데에 큰 기여를 하였다. 다양한 microarray기술을 통해 얻은 대량의 유전자 발현 정보는 기계 학습분류기를 이용한 암의 분류와 진단, 예측 분야에도 효과적으로 이용될 수 있다. 이 과정에서 종류에 따른 암의 정확한 분류를 위해서는 되도록 해당 암 클래스와의 직접적인 연관이 있는 유전자만을 선택하여 활용하는 것이 효과적이다. 본 논문에서는 이러한 정보력 있는 유전자(informative gene)를 효과적으로 선택 할 수 있는 유전자 선택 방법을 제시하고, 이를 이용하여 세 가지 벤치마크 암 데이터에 대하여 체계적인 실험을 하였다. 그 결과 향상된 분류 성능을 확인할 수 있었다.

  • PDF

Fast Conditional Independence-based Bayesian Classifier

  • Junior, Estevam R. Hruschka;Galvao, Sebastian D. C. de O.
    • Journal of Computing Science and Engineering
    • /
    • v.1 no.2
    • /
    • pp.162-176
    • /
    • 2007
  • Machine Learning (ML) has become very popular within Data Mining (KDD) and Artificial Intelligence (AI) research and their applications. In the ML and KDD contexts, two main approaches can be used for inducing a Bayesian Network (BN) from data, namely, Conditional Independence (CI) and the Heuristic Search (HS). When a BN is induced for classification purposes (Bayesian Classifier - BC), it is possible to impose some specific constraints aiming at increasing the computational efficiency. In this paper a new CI based approach to induce BCs from data is proposed and two algorithms are presented. Such approach is based on the Markov Blanket concept in order to impose some constraints and optimize the traditional PC learning algorithm. Experiments performed with the ALARM, as well as other six UCI and three artificial domains revealed that the proposed approach tends to execute fewer comparison tests than the traditional PC. The experiments also show that the proposed algorithms produce competitive classification rates when compared with both, PC and Naive Bayes.

Speech Emotion Recognition by Speech Signals on a Simulated Intelligent Robot (모의 지능로봇에서 음성신호에 의한 감정인식)

  • Jang, Kwang-Dong;Kwon, Oh-Wook
    • Proceedings of the KSPS conference
    • /
    • 2005.11a
    • /
    • pp.163-166
    • /
    • 2005
  • We propose a speech emotion recognition method for natural human-robot interface. In the proposed method, emotion is classified into 6 classes: Angry, bored, happy, neutral, sad and surprised. Features for an input utterance are extracted from statistics of phonetic and prosodic information. Phonetic information includes log energy, shimmer, formant frequencies, and Teager energy; Prosodic information includes pitch, jitter, duration, and rate of speech. Finally a patten classifier based on Gaussian support vector machines decides the emotion class of the utterance. We record speech commands and dialogs uttered at 2m away from microphones in 5different directions. Experimental results show that the proposed method yields 59% classification accuracy while human classifiers give about 50%accuracy, which confirms that the proposed method achieves performance comparable to a human.

  • PDF

Recent Developments in Japan Relevant to Structural Vibration Control

  • Seto, Kazuto
    • Proceedings of the Korean Society for Noise and Vibration Engineering Conference
    • /
    • 1993.10a
    • /
    • pp.5-18
    • /
    • 1993
  • This paper reports the recent trends in active vibration control in Japan, especially, based on papers selected in the Proceedings of First International Conference on Motion and Vibration Control (1st MOVIC) held at Yokohama, Japan on Sept.7-11, 1992. Firstly, it classifiers vibration control methods and vibration controllers, especially active dynamic absorbers which are widely used in mechanical and civil engineering. Secondly, it covers basic problems in the control of vibration of flexible structures such as formulating a reduced-order model required for designing vibration controller, proper arranging of sensors and actuators, and preventing of spillover instability. Finally, the practical use of control theories such as LQ control theory, $H^{\infty}$ control theory, neural network theory, and other topics are discussed..

  • PDF

Multiple Optimal Classifiers based on Speciated Evolution for Classifying DNA Microarray Data (DNA 마이크로어레이 데이터의 분류를 위한 종분화 진화 기반의 최적 다중 분류기)

  • 박찬호;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.724-726
    • /
    • 2004
  • DNA 마이크로어레이 기술의 발전은 암의 조기 발견 및 예후 예측을 가능하게 해주었으며, 이와 관련된 많은 연구가 진행 중이다. 마이크로어레이 데이터의 분류에서 관련 유전자들의 선택은 필수적이며, 유전자 선택방법은 분류기와 짝을 이루어 특징-분류기를 형성한다. 이제까지 여러 가지 특징-분류기를 사용하여 마이크로어레이 데이터를 분류해 왔지만, 알고리즘의 한계와 데이터의 결함 등으로 인하여 최적의 특징-분류기를 찾기 어려웠다. 따라서 앙상블 분류기를 이용하여 높은 분류성능을 얻는 방법이 시도되어왔으며. 최적의 것을 찾기 위하여 유전자 알고리즘이 사용되기도 했다. 본 논문에서는 이를 발전시켜 다양한 최적의 앙상블을 생성하기 위해 종분화 방법을 사용한다. 림프종 암 데이터에 대하여 leave-one-out cross-validation을 적용한 결과, 제안한 방법으로 다양한 최적해를 탐색하는 것을 확인할 수 있었다.

  • PDF