• 제목/요약/키워드: Predictive decision tree

검색결과 112건 처리시간 0.029초

머신러닝을 이용한 경기도 화재위험요인 예측분석 (Predictive Analysis of Fire Risk Factors in Gyeonggi-do Using Machine Learning)

  • 서민송;에베르 엔리케 카스티요 오소리오;유환희
    • 한국측량학회지
    • /
    • 제39권6호
    • /
    • pp.351-361
    • /
    • 2021
  • 화재는 막대한 재산과 인명피해를 초래하고 있으며 크고 작은 화재가 지속해서 발생하고 있다. 따라서 본 연구는 화재 유형별로 화재에 영향을 미치는 각종 위험요인을 예측하고자 한다. 전국에서 화재 발생 건수가 가장 많은 경기도를 대상으로 화재발생위험요인 예측분석을 실시하였다. 또한, 머신러닝 방법인 SVM, RF, GBRT를 활용하여 각 모형의 정확성을 MAE,RMSE를 통해 적합도가 높은 모형을 제시하였으며 이를 토대로 경기도 화재발생요인 예측분석을 실시하였다. 머신러닝 방법 3가지를 비교분석한 결과 RF가 MAE 1.517, RMSE 1.820으로 나타났으며 MAE, RMSE 검증데이터 및 시험데이터의 경우 MAE값 0.024, RMSE값 0.12의 차이로 매우 유사하게 나타나 가장 우수한 예측력으로 나타났다. RF기법을 적용하여 분석한 결과 공통적으로 발화장소가 화재발생에 가장 큰 영향을 주는 위험요인으로 나타났다. 이러한 연구 결과는 화재발생에 영향을 주는 요인들의 위험순서를 파악하여 화재안전관리의 유용한 자료로 활용될 것으로 예상된다.

데이터마이닝 기법을 이용한 건강보험공단의 수술 통계량 근사치 추정 -허니아 수술을 중심으로- (Estimation of a Nationwide Statistics of Hernia Operation Applying Data Mining Technique to the National Health Insurance Database)

  • 강성홍;서숙경;양영자;이애경;배종면
    • Journal of Preventive Medicine and Public Health
    • /
    • 제39권5호
    • /
    • pp.433-437
    • /
    • 2006
  • Objectives: The aim of this study is to develop a methodology for estimating a nationwide statistic for hernia operations with using the claim database of the Korea Health Insurance Cooperation (KHIC). Methods: According to the insurance claim procedures, the claim database was divided into the electronic data interchange database (EDI_DB) and the sheet database (Paper_DB). Although the EDI_DB has operation and management codes showing the facts and kinds of operations, the Paper_DB doesn't. Using the hernia matched management code in the EDI_DB, the cases of hernia surgery were extracted. For drawing the potential cases from the Paper_DB, which doesn't have the code, the predictive model was developed using the data mining technique called SEMMA. The claim sheets of the cases that showed a predictive probability of an operation over the threshold, as was decided by the ROC curve, were identified in order to get the positive predictive value as an index of usefulness for the predictive model. Results: Of the claim databases in 2004, 14,386 cases had hernia related management codes with using the EDI system. For fitting the models with applying the data mining technique, logistic regression was chosen rather than the neural network method or the decision tree method. From the Paper_DB, 1,019 cases were extracted as potential cases. Direct review of the sheets of the extracted cases showed that the positive predictive value was 95.3%. Conclusions: The results suggested that applying the data mining technique to the claim database in the KHIC for estimating the nationwide surgical statistics would be useful from the aspect of execution and cost-effectiveness.

인공지능을 이용한 급성 뇌졸중 환자의 재원일수 예측모형 개발 (Development of Predictive Model for Length of Stay(LOS) in Acute Stroke Patients using Artificial Intelligence)

  • 최병관;함승우;김촉환;서정숙;박명화;강성홍
    • 디지털융복합연구
    • /
    • 제16권1호
    • /
    • pp.231-242
    • /
    • 2018
  • 병원 재원일수의 효율적 관리는 병원의 수익과 환자의 진료비 절감을 위해 매우 중요한 요소이다. 이러한 재원일수의 효율적 관리를 위해서는 병원들이 재원일수에 대해서 벤치마킹을 할 수 있도록 지원이 필요하고 재원일수 절감의 구체적인 방향을 제시해 줄 수 있는 재원일수 예측모형의 개발이 필요하다. 본 연구에서는 2013년과 2014년도 퇴원손상환자자료 중 급성뇌졸중 환자를 추출하여 분석용 자료를 만들고 인공지능을 이용하여 급성뇌졸중 환자의 재원일수 예측모형을 개발하였다. 분석용 자료는 훈련용 60%, 평가용 40%로 분류하였다. 모형개발은 전통적 통계기법인 다중회귀분석기법과 인공지능기법인 대화식 의사결정나무기법, 신경망 기법, 그리고 이들을 모두 통합한 앙상블기법을 이용하였다. 모형평가는 Root ASE(Absolute error) 지표를 이용하였는데, 다중회귀분석은 23.7, 대화식결정나무 23.7, 신경망 분석은 22.7, 앙상블은 22.7로 나타났고 이를 통하여 재원일수 예측모형 개발에 인공지능기법의 유용성이 입증되었다. 앞으로 재원일수 예측모형개발에 인공지능 기법을 보다 효율적으로 활용할 수 있는 방안에 대해서 계속적인 연구가 이루어 질 필요가 있다.

FT NIR 분광법 및 이진분류 머신러닝 방법을 이용한 소나무 종자 발아 예측 (Prediction of Germination of Korean Red Pine (Pinus densiflora) Seed using FT NIR Spectroscopy and Binary Classification Machine Learning Methods)

  • 김용율;구자정;구다은;한심희;강규석
    • 한국산림과학회지
    • /
    • 제112권2호
    • /
    • pp.145-156
    • /
    • 2023
  • 본 연구에서는 -18℃ 및 4℃에서 18년간 저장된 소나무 종자 963개에 대해 FT NIR 스펙트럼을 조사하여 7개 머신러닝 방법(XGBoost, Boosted Tree, Bootstrap Forest, Neural Networks, Decision Tree, Support Vector Machine, PLS-DA)을 이용한 종자발아 예측모델을 만들고, 그 성능을 비교하였다. XGBoost 및 Boosted Tree 모델의 예측성능이 가장 우수하였으며, 정확도, 오분류율 및 AUC 값은 각각 0.9722, 0.0278, 0.9735과 0.9653, 0.0347, 0.9647이었다. 2개 모델에서 종자발아 유무를 예측하는 데 있어 상대적 중요도가 높았던 54개 파수 변수들에 대한 파장대는 크게 6개(811~1,088 nm, 1,137~1,273 nm, 1,336~1,453 nm, 1,666~1,671 nm, 1,879~2,045 nm, 2,058~2,409 nm) 그룹으로 나눌 수 있었으며, 방향족 아미노산, 셀룰로스, 리그닌, 전분, 지방산 및 수분과 관련된 것으로 추정되었다. 이상의 결과를 종합할 때, 본 연구에서 얻어진 FT NIR 스펙트럼 데이터과 2개의 머신러닝 모델은 소나무 저장종자의 발아 유무를 정확도 96% 이상으로 예측할 수 있기에 장기저장 종자 유전자원의 비파괴적 활력검정에 유용하게 활용될 수 있을 것으로 생각된다.

설명 가능한 AI를 적용한 기계 예지 정비 방법 (Explainable AI Application for Machine Predictive Maintenance)

  • 천강민;양재경
    • 산업경영시스템학회지
    • /
    • 제44권4호
    • /
    • pp.227-233
    • /
    • 2021
  • Predictive maintenance has been one of important applications of data science technology that creates a predictive model by collecting numerous data related to management targeted equipment. It does not predict equipment failure with just one or two signs, but quantifies and models numerous symptoms and historical data of actual failure. Statistical methods were used a lot in the past as this predictive maintenance method, but recently, many machine learning-based methods have been proposed. Such proposed machine learning-based methods are preferable in that they show more accurate prediction performance. However, with the exception of some learning models such as decision tree-based models, it is very difficult to explicitly know the structure of learning models (Black-Box Model) and to explain to what extent certain attributes (features or variables) of the learning model affected the prediction results. To overcome this problem, a recently proposed study is an explainable artificial intelligence (AI). It is a methodology that makes it easy for users to understand and trust the results of machine learning-based learning models. In this paper, we propose an explainable AI method to further enhance the explanatory power of the existing learning model by targeting the previously proposedpredictive model [5] that learned data from a core facility (Hyper Compressor) of a domestic chemical plant that produces polyethylene. The ensemble prediction model, which is a black box model, wasconverted to a white box model using the Explainable AI. The proposed methodology explains the direction of control for the major features in the failure prediction results through the Explainable AI. Through this methodology, it is possible to flexibly replace the timing of maintenance of the machine and supply and demand of parts, and to improve the efficiency of the facility operation through proper pre-control.

폐경 여성에서 트리기반 머신러닝 모델로부터 골다공증 예측 (Predictive of Osteoporosis by Tree-based Machine Learning Model in Post-menopause Woman)

  • 이인자;이준호
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제43권6호
    • /
    • pp.495-502
    • /
    • 2020
  • In this study, the prevalence of osteoporosis was predicted based on 10 independent variables such as age, weight, and alcohol consumption and 4 tree-based machine-learning models, and the performance of each model was compared. Also the model with the highest performance was used to check the performance by clearing the independent variable, and Area Under Curve(ACU) was utilized to evaluate the performance of the model. The ACU for each model was Decision tree 0.663, Random forest 0.704, GBM 0.702, and XGBoost 0.710 and the importance of the variable was shown in the order of age, weight, and family history. As a result of using XGBoost, the highest performance model and clearing independent variables, the ACU shows the best performance of 0.750 with 7 independent variables. This data suggests that this method be applied to predict osteoporosis, but also other various diseases. In addition, it is expected to be used as basic data for big data research in the health care field.

의사결정나무분석을 이용한 청소년 우울의 보호요인 예측모형 (Predictors of Protective Factors for Depression in Adolescent using Decision Making Tree Analysis)

  • 김보영
    • 한국콘텐츠학회논문지
    • /
    • 제15권5호
    • /
    • pp.375-385
    • /
    • 2015
  • 본 연구는 의사결정나무 분석을 활용하여 청소년의 우울 보호요인을 예측하여 우울 예방과 조기발견 및 중재 방안을 마련하고자 시도된 서술적 조사연구이다. 연구대상은 G광역시에 소재한 청소년 총 485명이고, 자료 수집은 2013년 9월 23일부터 9월 26일 사이에 이루어졌다. 자료 분석은 SPSS 20.0 프로그램을 이용하여 빈도, 백분율, 평균과 표준편차 및 ${\chi}^2$-test, t-test, 의사결정나무 분석으로 분석하였다. 본 연구 결과, 4개의 경로, 총 12노드가 구축되었고 가족 결속력, 부모 자녀간 의사소통과 또래와의 의사소통이 청소년 우울 보호요인이었다. 우울의 보호요인 예측 정확도에서 분석용은 특이도 76.0%, 민감도 65.4%이었고, 검정용은 특이도 78.2%, 민감도 63.7%이었으며, 전체 분류 정확도는 분석용 70.1%, 검정용 69.7%이었다. 이에 본 연구 결과가 학교와 지역사회에서 청소년 정신보건을 담당하는 전문가들에게 우울을 예방을 위한 프로그램 개발의 기초자료로 제공되고, 나아가 청소년들이 자신들의 목소리를 되찾고 힘차게 성장하기 위한 보호요인 강화를 위한 우울예방 정책 전략에 활용되기를 기대해 본다.

의사결정나무 분석법을 이용한 우울 노인 중 자살 고위험군 규명 (Identification of High-risk Groups of Suicide from the Depressed Elderly using Decision Tree Analysis)

  • 홍세훈;이동원
    • 지역사회간호학회지
    • /
    • 제30권2호
    • /
    • pp.130-140
    • /
    • 2019
  • Purpose: The aim of this study is to explore levels of suicidal ideation and identify subgroups of high suicidal risk among the depressed elderly in Korea. Methods: A descriptive cross-sectional design was adopted on secondary data from the 6th (1st year) Korean national health and nutrition examination survey (KNHANES). A total of 239 depressed elders aged 60 or over who participated in the KNHANES. The prevalence of suicidal ideation and its related factors, including sociodemographic, physical, psychological characteristics and quality of life (EQ-5D index) were examined. Descriptive statistics and a decision tree analysis were performed using the SPSS/WIN 23.0 and SPSS Modeler 14.2 programs. Results: Of the depressed elderly, 28.9% had suicidal ideation. Three groups with high suicidal ideation were identified. Predictive factors included perceived stress level, household income level, quality of life and restriction of activity. In the highest risk group were those depressed elderly with moderate and low levels of stress, less than .71 of EQ-5D index and restriction of activity, and 80.0% of these participants had suicidal ideation. The accuracy of the model was 80.8%, its sensitivity 85.9%, and its specificity 68.1%. Conclusion: Multi-dimensional intervention should be designed to decrease suicide among the depressed elderly, particularly focusing on subgroups with high risk factors. This research is expected to contribute itself to the policy design and solution building in the future as it suggests policy implications in preventing the suicide of the depressed elderly.

의사결정나무 분석을 이용한 한국 노인의 성별에 따른 건강관련 삶의 질 취약군 예측: 국민건강영양조사 자료 분석 (Prediction model of health-related quality of life in older adults according to gender using a decision tree model: a study based on the Korea National Health and Nutrition Examination Survey)

  • 김희선;정석희
    • Journal of Korean Biological Nursing Science
    • /
    • 제26권1호
    • /
    • pp.26-40
    • /
    • 2024
  • Purpose: The aim of this study was to predict the subgroups vulnerable to poorer health-related quality of life (HRQoL) according to gender in older adults. Methods: Data from 5,553 Koreans aged 65 or older were extracted from the Korea National Health and Nutrition Examination Survey. HRQoL was assessed using the EQ-5D tool. Complex sample analysis and decision-tree analysis were conducted using SPSS for Windows version 27.0. Results: The mean scores of the EQ-5D index were 0.93 ± 0.00 in men and 0.88 ± 0.00 in women. In men, poorer HRQoL groups were identified with seven different pathways, which were categorized based on participants' characteristics, such as restriction of activity, perceived health status, muscle exercise, age, relative hand grip strength, suicidal ideation, the number of chronic diseases, body mass index, and income status. Restriction of activity was the most significant predictor of poorer HRQoL in elderly men. In women, the poorer HRQoL groups were identified with nine different pathways, which were categorized based on participants' characteristics, such as perceived health status, restriction of activity, age, education, unmet medical service needs, anemia, body mass index, relative hand grip, and aerobic exercise. Perceived health status was the most significant predictor of poorer HRQoL in elderly women. Conclusion: This study presents a predictive model of HRQoL in older adults according to gender and can be used to detect individuals at risk of poorer HRQoL.

복합만성질환 입원환자의 중증도 보정 사망비에 대한 융복합 연구 (A Convergence Study in the Severity-adjusted Mortality Ratio on inpatients with multiple chronic conditions)

  • 서영숙;강성홍
    • 디지털융복합연구
    • /
    • 제13권12호
    • /
    • pp.245-257
    • /
    • 2015
  • 본 연구는 복합만성질환 입원환자를 대상으로 중증도 보정 사망 예측모형을 개발하고, 중증도 보정 사망비의 변이 요인을 규명하여 변이를 줄일 수 있는 방안을 제시하고자 하였다. 이를 위해 퇴원손상심층조사 자료 2008년부터 2010년까지 자료를 수집하고 주진단이 만성질환이면서 주진단을 포함하여 2개 이상의 만성질환을 보유한 30세 이상의 복합만성질환 입원환자 110,700건을 최종 연구대상으로 선정하였다. 예측 모형 개발 시 데이터마이닝 기법(로지스틱회귀분석, 의사결정나무, 신경망 기법)을 적용하였다. 본 연구에서는 Elixhauser comorbidity index 동반상병 보정지수를 이용하여 의사결정나무분석으로 복합만성질환 입원환자의 중증도 보정 사망 예측모형을 개발하였다. 복합만성질환 입원환자의 의료기관 중증도 보정 사망비(HSMR)를 산출 한 결과 진료비 지불방법별, 병상규모별, 의료기관소재지별로 통계적으로 유의한 차이가 있는 것으로 나타났다. 상기 분석결과를 바탕으로 국가적 차원에서 복합만성질환 입원환자의 사망비를 효율적으로 관리하여 의료의 질 향상과 증가하는 의료비 부담 감소를 위해 지속적인 관심과 노력을 기울여야 할 것이다.