• Title/Summary/Keyword: 의사결정나무 분석

Search Result 407, Processing Time 0.033 seconds

A decision tree method using distance-based weighted (거리 기반 가중치를 이용한 의사결정나무 방법)

  • Yoon, Taebok;Lee, Jee-Hyong;Choo, MoonWon;Choi, YoungMee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.510-511
    • /
    • 2010
  • IT기술의 발달과 함께 다양한 분야에서 사용자에게 지능적이고 적응된 서비스를 제공하기 위한 연구가 활발하다. 특히, 데이터 마이닝은 이와 같은 서비스를 위한 방법으로 유용하게 사용되며, 수집된 데이터로부터 숨겨진 패턴을 찾는데 빈번하게 이용된다. 하지만, 수집된 데이터에 예상하지 못한 정보가 섞여 있다면 분석이 어렵고, 분석 결과 또한 신뢰하기 어려울 것이다. 기존에는 수집 데이터에서 의미 없는 데이터를 선별하여 제거하는데 주로 연구 되었으나, 유용한 데이터도 함께 제거될 수 있다는 문제를 가지고 있다. 본 논문은 수집 데이터를 의미 정도에 따라 가중치를 부여하고, 의사결정나무 생성에 반영하였고, 실험을 통하여 유효성을 확인하였다.

Convergence analysis for geographic variations and risk factors in the prevalence of hyperlipidemia using measures of Korean Community Health Survey (지역사회건강조사 지표를 이용한 고지혈증 유병율의 지역 간 변이와 위험 요인의 융복합적 분석)

  • Kim, Yoo-Mi;Kang, Sung-Hong
    • Journal of Digital Convergence
    • /
    • v.13 no.8
    • /
    • pp.419-429
    • /
    • 2015
  • We investigate how the regional prevalence of hyperlipidemia is affected by health-related and socioeconomic factors with a special emphasis on geographic variations. We focus on the likelihood of hyperlipidemia as function of various region-specific attributes. We analysis a data set at the level of 249 small administrative districts collected from 2012 Korean Community Health Survey by Korea Centers for Disease Control and Prevention. To estimate, we use several methods including correlation analysis, multiple regression and decision tree model. We find that the average prevalence of hyperlipidemia in 249 small districts is 9.6% and its coefficient of variation is 28.3%. Prevalence of hyperlipidemia in continental and capital regions is higher than in southeast coastal regions. Further findings using decision tree model suggest that variations of hyperlipidemia prevalence between regions is more likely to be associated with rate of employee, level of stress, prevalence of hypertension, angina pectoris, and osteoarthritis in their regions.

A study on analysis of factors on in-hospital mortality for community-acquired pneumonia (지역사회획득 폐렴 환자의 퇴원시 사망 요인 분석)

  • Kim, Yoo-Mi
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.3
    • /
    • pp.389-400
    • /
    • 2011
  • This study was carried out to analysis factors related to in-hospital mortality of community-acquired peumonia using administrative database. The subjects were 5,353 community-acquired pneumonia inpatients of the Korean National Hospital Discharge Injury Survey 2004-2006 data. The data were analyzed using chi-squared test and decision tree model in the data mining technique. Among the decision tree model, C4.5 had the best performance. The critical factors on in-hospital mortality of communityacquired pneumonia are admission route, respiratory failure, congenital heart failure including age, comorbidity, and bed size. This study was carried out using the administrative database including patients' characteristics and comorbidity. However further study should be extensively including hospital characteristics, regional medical resources, and patient management practice behavior.

Network Forensic using Fuzzy Decision Tree (퍼지 의사결정 나무를 이용한 네트워크 증거 분석)

  • Lee, Yong-Hyun;Lee, Seong-Yong;Kim, Dong-Kook;Noh, Bong-Nam
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.1017-1020
    • /
    • 2007
  • 컴퓨터의 생활 전반에 걸친 영향으로, 컴퓨터는 우리 생활 속에서 빼놓을 수 없는 하나의 정보 매체로 자리 매김 되었다. 하지만 그 이면에는 컴퓨터를 이용한 전산망 침해 행위, 전자기록 위.변조, 각종 음란물 유통, 바이러스 제작 유포 등 많은 위험들이 우리를 위협하고 있다. 그래서 컴퓨터를 사용한 범죄 행위를 탐지하는 방법에 대한 관심이 높아지고 있다. 또한 각종 범죄 행위는 인터넷을 통한 범죄가 늘고 있어, 네트워크 정보를 통한 포렌식에 관한 연구가 활발하다. 하지만, 매일 많은 양의 패킷을 분석하는 것은 많은 전문 인력과 비용이 소요된다. 본 논문에서는 의사결정나무를 이용한 패킷분석을 통하여 네트워크 포렌식의 정보를 추출하는 방법을 제안한다.

  • PDF

머신러닝 기반 KOSDAQ 시장의 관리종목 지정 예측 연구

  • Yun, Yang-Hyeon;Kim, Tae-Gyeong;Kim, Su-Yeong;Park, Yong-Gyun
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2021.11a
    • /
    • pp.185-187
    • /
    • 2021
  • 관리종목 지정 제도는 상장 기업 내 기업의 부실화를 경고하여 기업에게는 회생 기회를 주고, 투자자들에게는 투자 위험을 경고하기 위한 시장규제 제도이다. 본 연구는 관리종목과 비관리종목의 기업의 재무 데이터를 표본으로 하여 관리종목 지정 예측에 대한 연구를 진행하였다. 분석에 쓰인 분석 방법은 로지스틱 회귀분석, 의사결정나무, 서포트 벡터 머신, 소프트 보팅, 랜덤 포레스트, LightGBM이며 분류 정확도가 82.73%인 LightGBM이 가장 우수한 예측 모형이었으며 분류 정확도가 가장 낮은 예측 모형은 정확도가 71.94%인 의사결정나무였다. 대체적으로 앙상블을 이용한 학습 모형이 단일 학습 모형보다 예측 성능이 높았다.

  • PDF

Determinants of job finding using student's characteristic information (학생정보를 이용한 대졸 취업에 미치는 영향력 분석)

  • Cho, Jang-Sik
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.5
    • /
    • pp.849-856
    • /
    • 2011
  • In this paper, we study the influence analysis of admission and enrollment variables including individual characteristics variables on employment of graduate students at K university. First, logistic regression analysis is used to examine the main effects of admission, enrollment variables including student's individual characteristics on employment. Also, decision tree analysis is used to examine the interaction effects for the variables on employment. The results of this paper may be helpful to K university in designing effective job finding strategies for graduate students.

Study on Development of Classification Model and Implementation for Diagnosis System of Sasang Constitution (사상체질 분류모형 개발 및 진단시스템의 구현에 관한 연구)

  • Beum, Soo-Gyun;Jeon, Mi-Ran;Oh, Am-Suk
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2008.08a
    • /
    • pp.155-159
    • /
    • 2008
  • In this thesis, in order to develop a new classification model of Sasang Constitutional medical types, which is helpful for improving the accuracy of diagnosis of medical types. various data-mining classification models such as discriminant analysis. decision trees analysis, neural networks analysis, logistics regression analysis, clustering analysis which are main classification methods were applied to the questionnaires of medical type classification. In this manner, a model which scientifically classifies constitutional medical types in the field of Sasang Constitutional Medicine, one of a traditional Korean medicine, has been developed. Also, the above-mentioned analysis models were systematically compared and analyzed. In this study, a classification of Sasang constitutional medical types was developed based on the discriminate analysis model and decision trees analysis model of which accuracy is relatively high, of which analysis procedure is easy to understand and to explain and which are easy to implement. Also, a diagnosis system of Sasang constitution was implemented applying the two analysis models.

  • PDF

통계적 분류방법을 이용한 문화재 정보 분석

  • Kang, Min-Gu;Sung, Su-Jin;Lee, Jin-Young;Na, Jong-Hwa
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2009.05a
    • /
    • pp.120-125
    • /
    • 2009
  • 본 논문에서는 통계적 분류방법을 이용하여 문화재 자료의 분석을 수행하였다. 분류방법으로는 선형판별분석, 로지스틱회귀분석, 의사결정나무분석, 신경망분석, SVM분석을 사용하였다. 각각의 분류방법에 대한 개념 및 이론에 대해 간략히 소개하고, 실제자료 분석에서는 "지역별 문화재 통계분석 및 모형개발 연구 1차(2008)"에 사용된 자료 중 익산시 자료를 근거로 매장문화재에 대한 분류방법별 적합모형을 구축하였다. 구축된 모형과 모의실험의 결과를 통해 각각의 적합모형에 대한 비교를 수행하여 모형의 성능을 비교하였다. 분석에 사용된 도구로는 최근 가장 관심을 갖는 R-project를 사용하였다.

  • PDF

A Study on the Combined Decision Tree(C4.5) and Neural Network Algorithm for Classification of Mobile Telecommunication Customer (이동통신고객 분류를 위한 의사결정나무(C4.5)와 신경망 결합 알고리즘에 관한 연구)

  • 이극노;이홍철
    • Journal of Intelligence and Information Systems
    • /
    • v.9 no.1
    • /
    • pp.139-155
    • /
    • 2003
  • This paper presents the new methodology of analyzing and classifying patterns of customers in mobile telecommunication market to enhance the performance of predicting the credit information based on the decision tree and neural network. With the application of variance selection process from decision tree, the systemic process of defining input vector's value and the rule generation were developed. In point of customer management, this research analyzes current customers and produces the patterns of them so that the company can maintain good customer relationship and makes special management on the customer who has huh potential of getting out of contract in advance. The real implementation of proposed method shows that the predicted accuracy is higher than existing methods such as decision tree(CART, C4.5), regression, neural network and combined model(CART and NN).

  • PDF