• Title/Summary/Keyword: Decision Tree Algorithm

검색결과 445건 처리시간 0.033초

머신러닝 기법을 활용한 철골 모멘트 골조의 화재 취약도 분석 (Fire Fragility Analysis of Steel Moment Frame using Machine Learning Algorithms)

  • 박성월;김은주
    • 한국전산구조공학회논문집
    • /
    • 제37권1호
    • /
    • pp.57-65
    • /
    • 2024
  • 내화 구조물에서는 환기 계수, 재료 탄성 계수, 항복 강도, 열팽창 계수, 외력 및 화재 위치에서 불확실성이 관찰된다. 환기 불확실성은 화재 온도에 영향을 미치고, 이는 다시 구조물 온도에 영향을 미친다. 이러한 온도는 재료 특성과 함께 불확실한 구조적 응답으로 이어지고 있다. 화재 시 구조적 비선형 거동으로 인해 몬테카를로 시뮬레이션을 사용하여 화재 취약성을 계산하는데, 이는 시간이 많이 소요된다. 따라서 머신러닝 알고리즘을 활용해 화재 취약성 분석을 예측함으로써 효율성을 높이고 정확성을 확보하려는 연구가 진행되고 있다. 이 연구에서는 화재 크기, 위치, 구조 재료 특성의 불확실성을 고려하여 철골 모멘트 골조 건물의 화재 취약성을 예측했다. 화재 시 비선형 구조 거동 결과를 기반으로 한 취약성 곡선은 로그 정규 분포를 따른다. 마지막으로 제안한 방법이 화재 취약성을 정확하고 효율적으로 예측할 수 있음을 보여주었다.

Protecting Accounting Information Systems using Machine Learning Based Intrusion Detection

  • Biswajit Panja
    • International Journal of Computer Science & Network Security
    • /
    • 제24권5호
    • /
    • pp.111-118
    • /
    • 2024
  • In general network-based intrusion detection system is designed to detect malicious behavior directed at a network or its resources. The key goal of this paper is to look at network data and identify whether it is normal traffic data or anomaly traffic data specifically for accounting information systems. In today's world, there are a variety of principles for detecting various forms of network-based intrusion. In this paper, we are using supervised machine learning techniques. Classification models are used to train and validate data. Using these algorithms we are training the system using a training dataset then we use this trained system to detect intrusion from the testing dataset. In our proposed method, we will detect whether the network data is normal or an anomaly. Using this method we can avoid unauthorized activity on the network and systems under that network. The Decision Tree and K-Nearest Neighbor are applied to the proposed model to classify abnormal to normal behaviors of network traffic data. In addition to that, Logistic Regression Classifier and Support Vector Classification algorithms are used in our model to support proposed concepts. Furthermore, a feature selection method is used to collect valuable information from the dataset to enhance the efficiency of the proposed approach. Random Forest machine learning algorithm is used, which assists the system to identify crucial aspects and focus on them rather than all the features them. The experimental findings revealed that the suggested method for network intrusion detection has a neglected false alarm rate, with the accuracy of the result expected to be between 95% and 100%. As a result of the high precision rate, this concept can be used to detect network data intrusion and prevent vulnerabilities on the network.

Hybrid machine learning with HHO method for estimating ultimate shear strength of both rectangular and circular RC columns

  • Quang-Viet Vu;Van-Thanh Pham;Dai-Nhan Le;Zhengyi Kong;George Papazafeiropoulos;Viet-Ngoc Pham
    • Steel and Composite Structures
    • /
    • 제52권2호
    • /
    • pp.145-163
    • /
    • 2024
  • This paper presents six novel hybrid machine learning (ML) models that combine support vector machines (SVM), Decision Tree (DT), Random Forest (RF), Gradient Boosting (GB), extreme gradient boosting (XGB), and categorical gradient boosting (CGB) with the Harris Hawks Optimization (HHO) algorithm. These models, namely HHO-SVM, HHO-DT, HHO-RF, HHO-GB, HHO-XGB, and HHO-CGB, are designed to predict the ultimate strength of both rectangular and circular reinforced concrete (RC) columns. The prediction models are established using a comprehensive database consisting of 325 experimental data for rectangular columns and 172 experimental data for circular columns. The ML model hyperparameters are optimized through a combination of cross-validation technique and the HHO. The performance of the hybrid ML models is evaluated and compared using various metrics, ultimately identifying the HHO-CGB model as the top-performing model for predicting the ultimate shear strength of both rectangular and circular RC columns. The mean R-value and mean a20-index are relatively high, reaching 0.991 and 0.959, respectively, while the mean absolute error and root mean square error are low (10.302 kN and 27.954 kN, respectively). Another comparison is conducted with four existing formulas to further validate the efficiency of the proposed HHO-CGB model. The Shapely Additive Explanations method is applied to analyze the contribution of each variable to the output within the HHO-CGB model, providing insights into the local and global influence of variables. The analysis reveals that the depth of the column, length of the column, and axial loading exert the most significant influence on the ultimate shear strength of RC columns. A user-friendly graphical interface tool is then developed based on the HHO-CGB to facilitate practical and cost-effective usage.

무손실 의료 영상 압축을 위한 적응적 심볼 교환에 기반을 둔 이진 적응 산술 부호화 방법 (A binary adaptive arithmetic coding algorithm based on adaptive symbol changes for lossless medical image compression)

  • 지창우;박성한
    • 한국통신학회논문지
    • /
    • 제22권12호
    • /
    • pp.2714-2726
    • /
    • 1997
  • 본 논문은 디지탈 의료 영상을 효과적으로 무손실 압축하기 위한 적용적 심볼 교환에 기반을 둔 새로운 부호화 방법을 제안한다. 제안하는 알고리즘은 먼저 원영상에 차분 규칙 또는 적용 예측기를 적용하여 차분 영상값을 구하며, 이러한 차분 영상값에 대한 개별 context를 결정한다. 다음 단계에서 context하에서 현재 부호화될 차분 영상값과 모델 템플리트상의 차분 영상값들 사이의 극성 일치를 갖는 심볼의 추정을 기반으로 한 적응적인 심볼 교환 과정을 적용하여 예측 심볼을 얻는다. 예측 심볼은 부호화 될 차분 영상값에 대해 가장 빈번하게 발생하리라고 예측되는 심볼을 가리키며, 예측 심볼이 차분 영상값과 동일할 때 부호화 효율이 높게 유지된다. 마지막 부호화 단계에서 이진 적응 산술 부호기는 특정 context가 주어진 차분 영상값의 예측 여부를 판단하는 이진 판단 트리를 사용하여 차분 영상값을 부호화 한다. 차분 영상값 예측 적중율 향상을 통하여 제안된 알고리즘의 부호화 효율은 ISO JPEG 무손실 예측기를 산술 부호기에 적용한 경우보다 약 33% 정도 높아지고, 차분 예측기 또는 적용 예측기를 산술 부호기에 적용한 경우에 비해 약 23% 정도 높아짐을 알 수 있다. 제안된 부호화 방법은 단위 구간 부분할시 곱셈 연산이 아닌 덧셈 연산을 사용하기 때문에 부호기의 복잡성이 낮고 다중 비트 공간의 영상을 이진 공간 열로 분할하지 않고 바로 다중 비트 의료 영상을 부호기에 적용 할 수 있기 때문에 의료 PACS의 영상 압축부에서 사용될 수 있다.

  • PDF

3D 프린팅 소재 화학물질의 독성 예측을 위한 Data-centric XAI 기반 분자 구조 Data Imputation과 QSAR 모델 개발 (Data-centric XAI-driven Data Imputation of Molecular Structure and QSAR Model for Toxicity Prediction of 3D Printing Chemicals)

  • 정찬혁;김상윤;허성구;;신민혁;유창규
    • Korean Chemical Engineering Research
    • /
    • 제61권4호
    • /
    • pp.523-541
    • /
    • 2023
  • 3D 프린터의 활용이 높아짐에 따라 발생하는 화학물질에 대한 노출 빈도가 증가하고 있다. 그러나 3D 프린팅 발생 화학물질의 독성 및 유해성에 대한 연구는 미비하며, 분자 구조 데이터의 결측치로 인해 in silico 기법을 사용한 독성예측 연구는 저조한 실정이다. 본 연구에서는 화학물질의 분자구조 정보를 나타내는 주요 분자표현자의 결측치를 보간하여 3D 프린팅의 독성 및 유해성을 예측한 Data-centric QSAR 모델을 개발하였다. 먼저 MissForest 알고리즘을 사용해 3D 프린팅으로 발생되는 유해물질의 분자표현자 결측치를 보완하였으며, 서로 다른 4가지 기계학습 모델(결정트리, 랜덤포레스트, XGBoost, SVM)을 기반으로 Data-centric QSAR 모델을 개발하여 생물 농축 계수(Log BCF)와 옥탄올-공기분배계수(Log Koa), 분배계수(Log P)를 예측하였다. 또한, 설명 가능한 인공지능(XAI) 방법론 중 TreeSHAP (SHapley Additive exPlanations) 기법을 활용하여 Data-centric QSAR 모델의 신뢰성을 입증하였다. MissForest 알고리즘 기반 결측지 보간 기법은, 기존 분자구조 데이터에 비하여 약 2.5배 많은 분자구조 데이터를 확보할 수 있었다. 이를 바탕으로 개발된 Data-centric QSAR 모델의 성능은 Log BCF, Log Koa와 Log P를 각각 73%, 76%, 92% 의 예측 성능으로 예측할 수 있었다. 마지막으로 Tree-SHAP 분석결과 개발된 Data-centric QSAR 모델은 각 독성치와 물리적으로 상관성이 높은 분자표현자를 통하여 선택함을 설명할 수 있었고 독성 정보에 대한 높은 예측 성능을 확보할 수 있었다. 본 연구에서 개발한 방법론은 다른 프린팅 소재나 화학공정, 그리고 반도체/디스플레이 공정에서 발생 가능한 오염물질의 독성 및 인체 위해성 평가에 활용될 수 있을 것으로 사료된다.

머신러닝 기반 금속외관 결함 검출 비교 분석 (Comparative analysis of Machine-Learning Based Models for Metal Surface Defect Detection)

  • 이세훈;강성환;신요섭;최오규;김시종;강재모
    • 한국정보통신학회논문지
    • /
    • 제26권6호
    • /
    • pp.834-841
    • /
    • 2022
  • 최근 스마트팩토리와 인공지능 기술의 수요 증가로 인해 다양한 분야에서 인공지능 기술을 적용하는 연구가 진행되고 있다. 결함 검사 분야에서도 인공지능 알고리즘을 도입하기 위한 노력을 기울이고 있다. 특히, 금속 외관의 결함을 검출하는 연구는 다른 소재(목재, 플라스틱, 섬유 등)의 결함을 검출하는 연구에 비해 많은 연구가 이루어지고 있다. 본 논문에서는 머신러닝 기법(서포터 벡터 머신(SVM: Support Vector Machine), 소프트맥스 회귀(Softmax Regression), 결정 트리(Decesion Tree))과 차원 축소 알고리즘(주성분 분석(PCA: Principal Component Analysis), 오토인코더(AutoEncoder))의 9가지 조합과 2가지 합성곱신경망(CNN: Convolutional Neural Network) 기법(자체 알고리즘, ResNet)의 금속 외관의 결함 분류 성능 및 속도를 비교하고 분석하는 연구를 수행하고자 한다. 두 종류의 학습 데이터셋((i) 공용 데이터셋(Public Dataset), (ii) 실측 데이터셋(Actual Dataset))에 대한 실험을 통해 각 데이터셋에 대한 성능 및 속도를 비교 분석하고, 가장 효율적인 알고리즘을 찾아낸다.

Cost-Effectiveness Analysis of Different Management Strategies for Detection CIN2+ of Women with Atypical Squamous Cells of Undetermined Significance (ASC-US) Pap Smear in Thailand

  • Tantitamit, Tanitra;Termrungruanglert, Wichai;Oranratanaphan, Shina;Niruthisard, Somchai;Tanbirojn, Patuou;Havanond, Piyalamporn
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권16호
    • /
    • pp.6857-6862
    • /
    • 2015
  • Background: To identify the optimal cost effective strategy for the management of women having ASC-US who attended at King Chulalongkorn Memorial Hospital (KMCH). Design: An Economical Analysis based on a retrospective study. Subject: The women who were referred to the gynecological department due to screening result of ASC-US at King Chulalongkorn Memorial Hospital, a general and tertiary referral center in Bangkok Thailand, from Jan 2008 - Dec 2012. Materials and Methods: A decision tree-based was constructed to evaluate the cost effectiveness of three follow up strategies in the management of ASC-US results: repeat cytology, triage with HPV testing and immediate colposcopy. Each ASC-US woman made the decision of each strategy after receiving all details about this algorithm, advantages and disadvantages of each strategy from a doctor. The model compared the incremental costs per case of high-grade cervical intraepithelial neoplasia (CIN2+) detected as measured by incremental cost-effectiveness ratio (ICER). Results: From the provider's perspective, immediate colposcopy is the least costly strategy and also the most effective option among the three follow up strategies. Compared with HPV triage, repeat cytology triage is less costly than HPV triage, whereas the latter provides a more effective option at an incremental cost-effectiveness ratio (ICER) of 56,048 Baht per additional case of CIN 2+ detected. From the patient's perspective, the least costly and least effective is repeat cytology triage. Repeat colposcopy has an incremental cost-effectiveness (ICER) of 2,500 Baht per additional case of CIN2+ detected when compared to colposcopy. From the sensitivity analysis, immediate colposcopy triage is no longer cost effective when the cost exceeds 2,250 Baht or the cost of cytology is less than 50 Baht (1USD = 31.58 THB). Conclusions: In women with ASC-US cytology, colposcopy is more cost-effective than repeat cytology or triage with HPV testing for both provider and patient perspectives.

GIS 기반 공간예측모델 비교를 통한 인도네시아 자바지역 산사태 취약지도 제작 (Landslide Susceptibility Mapping by Comparing GIS-based Spatial Models in the Java, Indonesia)

  • 김미경;김상필;노현주;손홍규
    • 대한토목학회논문집
    • /
    • 제37권5호
    • /
    • pp.927-940
    • /
    • 2017
  • 산사태는 인도네시아에서 오랫동안 피해가 많은 재해로 최근 기후변화와 산지 주위의 무분별한 도시 개발로 인해 위험이 가중되고 있다. 인도네시아 자바지역은 매년 산사태가 빈번하게 발생하고, 인도네시아 인구 절반 이상이 거주하고 있어 그 피해가 크다. 하지만 이러한 위험한 상황에도 불구하고 산사태 위험지역에 매년 거주하는 주민이 증가하고 있어 산사태 위험지역 및 취약지 분석에 대한 기술이 필요한 상황이다. 이에 본 연구는 인도네시아 자바지역을 대상으로 GIS 기반 공간예측모델을 이용하여 산사태 취약성을 평가하고자 한다. 연구지역의 산사태 발생 위치, 지형, 수문, 토양, 토지피복 등의 지형공간정보 자료를 구축하였고, 공간예측모델로는 Weight of Evidence (WoE), 의사결정트리 알고리즘, 인공신경망을 선정하여 산사태 취약지도를 제작하였다. 세 가지 모델은 각각 66.95%, 67.04%, 69.67%의 예측정확도를 보였다. 본 연구의 결과는 향후 인도네시아 산사태 피해 예방 및 산사태 관련 재난관리정책에 중요한 자료로 사용될 수 있을 것으로 기대한다.

데이터 마이닝 기법을 활용한 군용 항공기 비행 예측모형 및 비행규칙 도출 연구 (A Study on the Development of Flight Prediction Model and Rules for Military Aircraft Using Data Mining Techniques)

  • 유경열;문영주;정대율
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권3호
    • /
    • pp.177-195
    • /
    • 2022
  • Purpose This paper aims to prepare a full operational readiness by establishing an optimal flight plan considering the weather conditions in order to effectively perform the mission and operation of military aircraft. This paper suggests a flight prediction model and rules by analyzing the correlation between flight implementation and cancellation according to weather conditions by using big data collected from historical flight information of military aircraft supplied by Korean manufacturers and meteorological information from the Korea Meteorological Administration. In addition, by deriving flight rules according to weather information, it was possible to discover an efficient flight schedule establishment method in consideration of weather information. Design/methodology/approach This study is an analytic study using data mining techniques based on flight historical data of 44,558 flights of military aircraft accumulated by the Republic of Korea Air Force for a total of 36 months from January 2013 to December 2015 and meteorological information provided by the Korea Meteorological Administration. Four steps were taken to develop optimal flight prediction models and to derive rules for flight implementation and cancellation. First, a total of 10 independent variables and one dependent variable were used to develop the optimal model for flight implementation according to weather condition. Second, optimal flight prediction models were derived using algorithms such as logistics regression, Adaboost, KNN, Random forest and LightGBM, which are data mining techniques. Third, we collected the opinions of military aircraft pilots who have more than 25 years experience and evaluated importance level about independent variables using Python heatmap to develop flight implementation and cancellation rules according to weather conditions. Finally, the decision tree model was constructed, and the flight rules were derived to see how the weather conditions at each airport affect the implementation and cancellation of the flight. Findings Based on historical flight information of military aircraft and weather information of flight zone. We developed flight prediction model using data mining techniques. As a result of optimal flight prediction model development for each airbase, it was confirmed that the LightGBM algorithm had the best prediction rate in terms of recall rate. Each flight rules were checked according to the weather condition, and it was confirmed that precipitation, humidity, and the total cloud had a significant effect on flight cancellation. Whereas, the effect of visibility was found to be relatively insignificant. When a flight schedule was established, the rules will provide some insight to decide flight training more systematically and effectively.

동적계획법 적용에 의한 삼나무 임분의 간벌시업체계 분석 (Analysis of Optimal Thinning Prescriptions for a Cryptomeria japonica Stand Using Dynamic Programming)

  • 한희;권기범;정혜진;설아라;정주상
    • 한국산림과학회지
    • /
    • 제104권4호
    • /
    • pp.649-656
    • /
    • 2015
  • 이 연구의 목적은 국립산림과학원 한남시험림의 삼나무조림지에서 목재 및 탄소 경영을 위한 최적의 간벌시업체계를 결정하기 위해 수행되었다. 이 문제를 풀기 위해 Paderes and Brodie에 의해 개발된 PATH 알고리즘을 의사결정 지원체계로 그리고 임분생장예측을 위해 권기범 등이 개발한 임분생장모델을 적용하였다. 이 임분생장모델은 개체목간의 거리에 대한 고려가 없이 임목의 고사나 간벌과 같은 임분밀도 조절 요인에 의한 생장효과를 예측할 수 있다. 분석 결과 순현재가를 극대화하기 위한 목재생산경영은 탄소흡수량을 극대화하기 위한 탄소경영에 비해 간벌의 횟수는 적었지만 간벌강도가 상대적으로 큰 값으로 나타났다. 탄소경영의 경우 목재생산경영에 비해 탄소흡수량이 약 6% 증가한데 비해 순수익은 약 3.2% 감소하는 것으로 나타났다. 한편 탄소경영이나 목재생산경영을 위한 집약적 경영은 무간벌 시업조건을 전제로 하는 '무간벌 대조구'의 경우에 비해 약 60% 정도의 탄소흡수 및 순수익 증진효과가 있는 것으로 나타났다.