• 제목/요약/키워드: Markov Blanket

검색결과 15건 처리시간 0.023초

Classification of High Dimensionality Data through Feature Selection Using Markov Blanket

  • Lee, Junghye;Jun, Chi-Hyuck
    • Industrial Engineering and Management Systems
    • /
    • 제14권2호
    • /
    • pp.210-219
    • /
    • 2015
  • A classification task requires an exponentially growing amount of computation time and number of observations as the variable dimensionality increases. Thus, reducing the dimensionality of the data is essential when the number of observations is limited. Often, dimensionality reduction or feature selection leads to better classification performance than using the whole number of features. In this paper, we study the possibility of utilizing the Markov blanket discovery algorithm as a new feature selection method. The Markov blanket of a target variable is the minimal variable set for explaining the target variable on the basis of conditional independence of all the variables to be connected in a Bayesian network. We apply several Markov blanket discovery algorithms to some high-dimensional categorical and continuous data sets, and compare their classification performance with other feature selection methods using well-known classifiers.

Development of Correlation Based Feature Selection Method by Predicting the Markov Blanket for Gene Selection Analysis

  • Adi, Made;Yun, Zhen;Keong, Kwoh-Chee
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.183-187
    • /
    • 2005
  • In this paper, we propose a heuristic method to select features using a Two-Phase Markov Blanket-based (TPMB) algorithm. The first phase, filtering phase, of TPMB algorithm works by filtering the obviously redundant features. A non-linear correlation method based on Information theory is used as a metric to measure the redundancy of a feature [1]. In second phase, approximating phase, the Markov Blanket (MB) of a system is estimated by employing the concept of cross entropy to identify the MB. We perform experiments on microarray data and report two popular dataset, AML-ALL [3] and colon tumor [4], in this paper. The experimental results show that the TPMB algorithm can significantly reduce the number of features while maintaining the accuracy of the classifiers.

  • PDF

소셜미디어 감성분석을 위한 베이지안 속성 선택과 분류에 대한 연구 (Investigating the Performance of Bayesian-based Feature Selection and Classification Approach to Social Media Sentiment Analysis)

  • 강창민;어균선;이건창
    • 경영정보학연구
    • /
    • 제24권1호
    • /
    • pp.1-19
    • /
    • 2022
  • 온라인 사용자들이 소셜 미디어상에 올린 온라인 리뷰 속 숨겨진 감정을 분석하는 감성분석은 소셜미디어의 확산에 힘입어 많은 관심을 받고 있다. 본 연구는 기존 연구들과 차별화된 방법으로 감성분석을 시도하기 위하여 베이지안 네트워크에 기반한 감성 분석 모델을 제안한다. 모델에는 MBFS(Markov Blanket-based Feature Selection)가 속성 선택 기법으로 사용된다. MBFS의 성과를 실증적으로 증명하기 위하여 소셜미디어인 Yelp의 리뷰 데이터를 활용하였다. 벤치마킹 속성 선택 기법으로는 상관관계기반 속성 선택, 정보획득 속성 선택, 획득비율 속성 선택을 사용하였다. 한편, 해당 속성선택방법을 토대로 4개의 머신러닝 알고리즘을 이용하여 분류성과를 비교하였다. 나아가 MBFS로 선택된 속성들 간 인과관계를 확인하고자 베이지안 네트워크를 통해 What-if 분석을 실시하였다. 본 연구에서 택한 머신러닝 분류기는 베이지안 네트워크 기반의 TAN (Tree Augmented Naive Bayes), NB (Naive Bayes), S-Spouses(Sons & Spouses), A-markov (Augmented Markov Blanket)이다. 성과분석 결과 본 연구에서 제안한 MBFS 방법이 정확도, 정밀도, F1점수 측면에서 벤치마킹 방법보다 더 우수한 성과를 나타내었다.

망막 질환 진단을 위한 베이지안 네트워크에 기초한 데이터 분석 (Bayesian Network-based Data Analysis for Diagnosing Retinal Disease)

  • 김현미;정성환
    • 한국멀티미디어학회논문지
    • /
    • 제16권3호
    • /
    • pp.269-280
    • /
    • 2013
  • 본 논문에서 망막 질환 요인간의 의존도 분석을 위해 효율적인 분류기를 활용할 수 있는 방안을 제시하였다. 먼저 여러 베이지안 네트워크 중에서 TAN (Tree-Augmented Naive Bayesian Network), GBN(General Bayesian Network)과 Markov Blanket으로 특징축소된 GBN과의 분류성능과 예측정확률을 비교분석하였다. 그리고 처음으로, 높은 성능을 보인 TAN을 망막 질환 임상데이터의 의존도 분석에 적용하였다. 의존도 분석 결과, 망막 질환의 진단과 예후 예측에 활용의 가능성을 보였다.

효율적인 의료데이터마이닝을 위한 특징축소와 레이지안망 학습 (Features Reduction and Baysian Networks Learning for Efficient Medical Data Mining)

  • 정용규;김인철
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.258-265
    • /
    • 2002
  • 베이지안망은 기존의 방법에 비해 불확실한 상황에서도 지식을 표현하고 결론을 추론하는데 유용한 것으로 알려져 있다. 본 논문에서는 대표적인 베이지안망 분류기들을 제시하고, 동일 임상데이터에 대해 서로 다른 유형별 베이지안망 분류기들을 학습하였다. 베이지안망을 적용할 때 변수의 수가 많아짐에 따라 베이지안망의 구조를 학습하는데 탐색공간이 넓어져 어려움이 있다. 본 연구에서는 이런 탐색공간을 효율적으로 줄이기 위하여 클래스 노드의 Markov blanket에 속한 특징들로 집합을 축소하는 것을 제안하고, 실험을 통해 이 특징 축소방법이 베이지안망 분류기들의 성능을 높여 줄 수 있는지 알아보았다. 분류기들의 성능에서는 축소한 특징집합으로부터 얻은 베이지안망으로 확장한 나이브 베이지안망 분류기가 가장 우수한 정확도를 가짐을 실험을 통해 알 수 있었다.

  • PDF

Fast Conditional Independence-based Bayesian Classifier

  • Junior, Estevam R. Hruschka;Galvao, Sebastian D. C. de O.
    • Journal of Computing Science and Engineering
    • /
    • 제1권2호
    • /
    • pp.162-176
    • /
    • 2007
  • Machine Learning (ML) has become very popular within Data Mining (KDD) and Artificial Intelligence (AI) research and their applications. In the ML and KDD contexts, two main approaches can be used for inducing a Bayesian Network (BN) from data, namely, Conditional Independence (CI) and the Heuristic Search (HS). When a BN is induced for classification purposes (Bayesian Classifier - BC), it is possible to impose some specific constraints aiming at increasing the computational efficiency. In this paper a new CI based approach to induce BCs from data is proposed and two algorithms are presented. Such approach is based on the Markov Blanket concept in order to impose some constraints and optimize the traditional PC learning algorithm. Experiments performed with the ALARM, as well as other six UCI and three artificial domains revealed that the proposed approach tends to execute fewer comparison tests than the traditional PC. The experiments also show that the proposed algorithms produce competitive classification rates when compared with both, PC and Naive Bayes.

베이지안 추론을 이용한 컴퓨터 오락추구 행동 예측 분석 (An Analysis on Prediction of Computer Entertainment Behavior Using Bayesian Inference)

  • 이혜주;정의현
    • 컴퓨터교육학회논문지
    • /
    • 제21권3호
    • /
    • pp.51-58
    • /
    • 2018
  • 본 연구에서는 컴퓨터 오락추구 행동의 예측 분석을 목적으로 한국아동 청소년패널조사(KCYPS) 데이터를 대상으로 베이지안 추론을 사용하여 컴퓨터 오락추구 행동과 관련 변수들의 상호의존성과 인과관계를 조사하였다. 이를 위해 일반 베이지안 네트워크를 통한 마코프 블랭킷(Markov Blanket)을 추출하였다. 또한 변수들의 확률을 변화시켜 컴퓨터 오락추구 행동에 대한 변수들의 영향 정도를 분석하였다. 연구결과, 컴퓨터 오락추구 행동은 관련 변수들(학교학습활동, 비행-흡연, 비행-조롱, 팬덤활동, 학교규칙)의 값을 조정하였을 때 유의미하게 변화되는 것으로 나타났다. 본 연구의 결과로 베이지안 추론은 청소년의 컴퓨터 오락추구 행동을 예측하고 조절하는 등 교육 분야에서 활용될 수 있음을 제시하였다.

베이지안 네트워크를 이용한 기업의 사회적 책임활동과 재무성과 (Bayesian Network Analysis for the Dynamic Prediction of Financial Performance Using Corporate Social Responsibility Activities)

  • 선은정
    • 경영과정보연구
    • /
    • 제34권5호
    • /
    • pp.71-92
    • /
    • 2015
  • 본 연구는 기업의 사회적 책임(CSR: corporate social responsibility)활동이 재무성과에 미치는 영향을 베이지안 네트워크를 통해 분석하였다. 본 연구에서는 선행연구에서 널리 사용되어 온 분석방법인 다중회귀분석방법의 종속변수와 설명변수간에 획일적인 선형함수만을 가정하는데에서 나오는 문제점을 극복하고자 한다. 즉, 기업의 재무성과에 영향을 미치는 경영자의 사회적 책임활동간에 존재하는 인과관계를 도출할 필요가 있다. 이는 어떤 변수가 다른 어떤 변수와 직접 또는 간접적 인과관계를 통하여 기업의 재무성과에 영향을 주는지를 의사결정자에게 알려줌으로써 보다 효과적으로 기업의 재무성과를 개선시킬 수 있도록 지원할 수 있다. 이를 위하여 본 연구에서는 일반 베이지안 네트워크 (GBN: General Bayesian Network)을 제안하고 GBN에서 유도되는 마코프 블랭킷 (Markov Blanket)을 제시한다. 본 연구는 경제정의실천시민연합 산하 경제정의연구소에서 조사한 한국의 대표적 기업 약200개의 2005년부터 2011년까지 경제정의지수(Korean economic justice institute index: KEJI index)를 기초로 실험한 결과 기업성과측정치에 따라 차이는 보이지만 건전성(CSR1_20)과 경제발전기여도(CSR7_10)는 모든 기업의 재무성과에 직접적인 인과관계를 나타내었으며, 소비자보호만족도(CSR4_7), 환경보호만족도(CSR5_10) 및 종업원만족도(CSR6_10)는 각 측정지표간의 직 간접적인 인과관계를 나타내어 서로에게 중요한 영향을 미치고 있음을 나타내었다. 또한, what-if 민감도 분석을 통해 기업재무성과에 직접적인 인과관계가 있는 변수들의 사전확률이 변할 대 사후확률의 변화를 분석하여, 본 연구에서 제안한 방법이 모두 통계적으로 유의한 결과를 제공한다는 것이 실증적으로 검증되었다.

  • PDF

베이지안 네트워크 분류와 비즈니스 프로세스 모델링을 통한 신용카드 회원 이탈에 관한 연구 (An Empirical Study on the Churning Behavior through Bayesian Network Classifier and Business Process Modeling)

  • 이건창;이근영;조남용
    • 지식경영연구
    • /
    • 제10권4호
    • /
    • pp.1-15
    • /
    • 2009
  • 국내에서 신용카드는 대표적인 지불 수단으로 정착되었으며 신용카드의 사용자와 신용카드의 발급 매수는 이미 포화상태에 도달해 있다. 이 같은 양적 성장은 정부의 신용카드 활성화 정책과 더불어 신용카드사 간의 과당 경쟁의 영향에 기인하고 있다. 신용차드의 사용층은 대부분의 성인 남녀로 확대되었으며, 특히 복수의 신용카드 소지자를 대상으로 자사가 발급한 신용차드를 사용하게 하기 위한 신용카드사 간의 경쟁이 치열한 상황이다. 이에 따라 신용카드사들이 경쟁사의 카드사용 회원을 자사의 회원으로 확보하는 젓이 불가피하며 마찬가지로 사용 중인 자사의 회원이 경쟁사로 이동하지 않도록 사전에 이탈 징후를 포착하여 유지 캠페인을 수행하는 것이 신용카드사 마케팅의 주요 활동이 되었다. 선행연구에서는 신용카드 회원의 이탈과 관련하여 다양한 데이터마이닝 기법을 이용한 이탈의 특성 분류 연구가 진행되었다. 본 연구는 회원 이탈에 영향을 주는 요인을 효과적으로 발견하기 위한 방법으로 베이지안 네트워크(Bayesian Network)를 활용한다. 특히, 베이지안 네트워크의 일종인 일반 베이지안 네트워크(General Bayesian Network)를 이용하여 회원의 이탈요인에 영향을 주는 요인들의 집합인 마코프 블랭킷(Makov Blanket)을 도출한다. 한편, 마코프 블랭킷에 포함된 변수를 이용해 민감도 분석을 수행하여 영향이 큰 요인을 찾아내고 이를 비즈니스 프로세스에 적용하여 실무적인 의의를 실증하고자 한다.

  • PDF

이동 통신망에 있어서 새로운 셀 체류시간 모형화에 따른 최적 이동성 관리 (Optimal Mobility Management of PCNs Using Two Types of Cell Residence Time)

  • 홍정식;장인갑;이창훈
    • 한국경영과학회지
    • /
    • 제27권3호
    • /
    • pp.59-74
    • /
    • 2002
  • This study investigates two basic operations of mobility management of PCNs (Personal Communication Networks), i.e., the location update and the paging of the mobile terminal. From the realistic consideration that a user either moves through several cells consecutively or stays in a cell with long time, we model the mobility pattern by introducing two types of CRT (Cell Residence Time). Mobility patterns of the mobile terminal are classified Into various ways by using the ratios of two types of CRT. Cost analysis is performed for distance-based and movement-based location update schemes combined with blanket polling paging and selective paging scheme. It is demonstrated that in a certain condition of mobility pattern and call arrival pattern, 2-state CRT model produces different optimal threshold and so, is more effective than IID ( Independently-Identically-Distributed) CRT model. An analytical model for the new CRT model is compact and easily extendable to the other location update schemes.