• 제목/요약/키워드: Model interpretability

검색결과 47건 처리시간 0.03초

Form-finding of lifting self-forming GFRP elastic gridshells based on machine learning interpretability methods

  • Soheila, Kookalani;Sandy, Nyunn;Sheng, Xiang
    • Structural Engineering and Mechanics
    • /
    • 제84권5호
    • /
    • pp.605-618
    • /
    • 2022
  • Glass fiber reinforced polymer (GFRP) elastic gridshells consist of long continuous GFRP tubes that form elastic deformations. In this paper, a method for the form-finding of gridshell structures is presented based on the interpretable machine learning (ML) approaches. A comparative study is conducted on several ML algorithms, including support vector regression (SVR), K-nearest neighbors (KNN), decision tree (DT), random forest (RF), AdaBoost, XGBoost, category boosting (CatBoost), and light gradient boosting machine (LightGBM). A numerical example is presented using a standard double-hump gridshell considering two characteristics of deformation as objective functions. The combination of the grid search approach and k-fold cross-validation (CV) is implemented for fine-tuning the parameters of ML models. The results of the comparative study indicate that the LightGBM model presents the highest prediction accuracy. Finally, interpretable ML approaches, including Shapely additive explanations (SHAP), partial dependence plot (PDP), and accumulated local effects (ALE), are applied to explain the predictions of the ML model since it is essential to understand the effect of various values of input parameters on objective functions. As a result of interpretability approaches, an optimum gridshell structure is obtained and new opportunities are verified for form-finding investigation of GFRP elastic gridshells during lifting construction.

Experimental Analysis of Bankruptcy Prediction with SHAP framework on Polish Companies

  • Tuguldur Enkhtuya;Dae-Ki Kang
    • International journal of advanced smart convergence
    • /
    • 제12권1호
    • /
    • pp.53-58
    • /
    • 2023
  • With the fast development of artificial intelligence day by day, users are demanding explanations about the results of algorithms and want to know what parameters influence the results. In this paper, we propose a model for bankruptcy prediction with interpretability using the SHAP framework. SHAP (SHAPley Additive exPlanations) is framework that gives a visualized result that can be used for explanation and interpretation of machine learning models. As a result, we can describe which features are important for the result of our deep learning model. SHAP framework Force plot result gives us top features which are mainly reflecting overall model score. Even though Fully Connected Neural Networks are a "black box" model, Shapley values help us to alleviate the "black box" problem. FCNNs perform well with complex dataset with more than 60 financial ratios. Combined with SHAP framework, we create an effective model with understandable interpretation. Bankruptcy is a rare event, then we avoid imbalanced dataset problem with the help of SMOTE. SMOTE is one of the oversampling technique that resulting synthetic samples are generated for the minority class. It uses K-nearest neighbors algorithm for line connecting method in order to producing examples. We expect our model results assist financial analysts who are interested in forecasting bankruptcy prediction of companies in detail.

ANFIS에서 생성된 규칙의 해석용이성 평가 (Evaluation of Interpretability for Generated Rules from ANFIS)

  • 송희석;김재경
    • 지능정보연구
    • /
    • 제15권4호
    • /
    • pp.123-140
    • /
    • 2009
  • 퍼지신경망 모형은 인공신경망의 네트워크 구조 표현방법 및 학습알고리듬과 퍼지시스템의 추론방법을 통합한 모형으로 제어 및 예측분야에 성공적으로 적용되고 있다. 본 연구에서는 퍼지신경망 모형 중 우수한 예측정확도로 인해 최근 각광받고 있는 ANFIS (Adaptive Network-based Fuzzy Inference System) 모형에서 생성된 퍼지규칙의 해석용이성을 평가하였다. ANFIS모형은 인간 전문가와 상호작용하면서 규칙을 정제해 나갈 수 있다. 특히 인간전문가의 사전지식을 이용하여 초기 퍼지규칙을 만들고 난 후 모형을 학습하면 최적에 수렴하는 시간을 단축할 뿐 아니라, 전역 최적치 도달가능성이 높아진다고 보고되고 있다. 이러한 관점에서 볼 때 규칙의 해석용이성은 인간 전문가와의 상호작용을 위해 매우 중요한 이슈가 될 수 있다. 본 연구에서는 ANFIS모형과 의사결정나무 모형에서 생성된 규칙을 해석용이성 관점에서 비교하기 위한 측도를 제안하고 각 규칙들을 비교하였다. 본 연구에서 제안된 해석용이성 측도들은 규칙을 생성하는 다양한 기계학습 모형의 규칙생성 능력을 평가하는 기준으로도 활용될 수 있을 것이다.

  • PDF

설명가능 AI 기반의 변수선정을 이용한 기업부실예측모형 (Corporate Bankruptcy Prediction Model using Explainable AI-based Feature Selection)

  • 문건두;김경재
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.241-265
    • /
    • 2023
  • 기업의 부실 예측 모델은 기업의 재무 상태를 객관적으로 모니터링하는 데 필수적인 도구 역할을 한다. 적시에 경고하고 대응 조치를 용이하게 하며 파산 위험을 완화하고 성과를 개선하기 위한 효과적인 관리 전략을 수립할 수 있도록 지원한다. 투자자와 금융 기관은 금융 손실을 최소화하기 위해 부실 예측 모델을 이용한다. 기업 부실 예측을 위한 인공지능(AI) 기술 활용에 대한 관심이 높아지면서 이 분야에 대한 광범위한 연구가 진행되고 있다. 해석 가능성과 신뢰성이 강조되며 기업 부실 예측에서 설명 가능한 AI 모델에 대한 수요가 증가하고 있다. 널리 채택된 SHAP(SHapley Additive exPlanations) 기법은 유망한 성능을 보여주었으나 변수 수에 따른 계산 비용, 처리 시간, 확장성 문제 등의 한계가 있다. 이 연구는 전체 데이터 세트를 사용하는 대신 부트스트랩 된 데이터 하위 집합에서 SHAP 값을 평균화하여 변수 수를 줄이는 새로운 변수 선택 접근법을 소개한다. 이 기술은 뛰어난 예측 성능을 유지하면서 계산 효율을 향상시키는 것을 목표로 한다. 해석 가능성이 높은 선택된 변수를 사용하여 랜덤 포레스트, XGBoost 및 C5.0 모델을 훈련하여 분류 결과를 얻고자 한다. 분류 결과는 고성능 모델 설계를 목표로 soft voting을 통해 생성된 앙상블 모델의 분류 정확성과 비교한다. 이 연구는 1,698개 한국 경공업 기업의 데이터를 활용하고 부트스트래핑을 사용하여 고유한 데이터 그룹을 생성한다. 로지스틱 회귀 분석은 각 데이터 그룹의 SHAP 값을 계산하는 데 사용되며, SHAP 값 평균은 최종 SHAP 값을 도출하기 위해 계산된다. 제안된 모델은 해석 가능성을 향상시키고 우수한 예측 성능을 달성하는 것을 목표로 한다.

수치지형고도자료의 영상처리 (Digital image processing for digital elevation model data)

  • 이봉주;조민호;강필종
    • 지질공학
    • /
    • 제2권2호
    • /
    • pp.141-146
    • /
    • 1992
  • 미국 DMA사에서 제공되고 있는 수치지형고도자료를 이용하여 Shaded Relief Umage와 Landsat TM자료의 Stereo-pair image를 작성하였다. 이는 지형지세의 3차원적 표현 및 관찰을 통한 위성자료로 부터 지질구조 판독의 정확도 및 객관성 제고에 매우 유용하게 활용될 것으로 기대된다.

  • PDF

Reference 기반 AI 모델의 효과적인 해석에 관한 연구 (A Study on Effective Interpretation of AI Model based on Reference)

  • 이현우;한태현;박영지;이태진
    • 정보보호학회논문지
    • /
    • 제33권3호
    • /
    • pp.411-425
    • /
    • 2023
  • 오늘날 AI(Artificial Intelligence) 기술은 다양한 분야에서 활용 목적에 맞게 분류, 회기 작업을 수행하며 광범위하게 활용되고 있으며, 연구 또한 활발하게 진행 중인 분야이다. 특히 보안 분야에서는 예기치 않는 위협을 탐지해야 하며, 모델 훈련과정에 알려진 위협 정보를 추가하지 않아도 위협을 탐지할 수 있는 비 지도학습 기반의 이상 탐지 기법이 유망한 방법이다. 하지만 AI 판단에 대한 해석 가능성을 제공하는 선행 연구 대부분은 지도학습을 대상으로 설계되었기에 학습 방법이 근본적으로 다른 비 지도학습 모델에 적용하기는 어려우며, Vision 중심의 AI 매커니즘 해석연구들은 이미지로 표현되지 않는 보안 분야에 적용하기에 적합하지 않다. 따라서 본 논문에서는 침해공격의 원본인 최적화 Reference를 탐색하고 이와 비교함으로써 탐지된 이상에 대한 해석 가능성을 제공하는 기법을 활용한다. 본 논문에서는 산출된 Reference를 기반으로 실존 데이터에서 가장 가까운 데이터를 탐색하는 로직을 추가 제안함으로써 실존 데이터를 기반으로 이상 징후에 대한 더욱 직관적인 해석을 제공하고 보안 분야에서의 효과적인 이상 탐지모델 활용을 도모하고자 한다.

Building a Fuzzy Model with Transparent Membership Functions through Constrained Evolutionary Optimization

  • Kim, Min-Soeng;Kim, Chang-Hyun;Lee, Ju-Jang
    • International Journal of Control, Automation, and Systems
    • /
    • 제2권3호
    • /
    • pp.298-309
    • /
    • 2004
  • In this paper, a new evolutionary scheme to design a TSK fuzzy model from relevant data is proposed. The identification of the antecedent rule parameters is performed via the evolutionary algorithm with the unique fitness function and the various evolutionary operators, while the identification of the consequent parameters is done using the least square method. The occurrence of the multiple overlapping membership functions, which is a typical feature of unconstrained optimization, is resolved with the help of the proposed fitness function. The proposed algorithm can generate a fuzzy model with transparent membership functions. Through simulations on various problems, the proposed algorithm found a TSK fuzzy model with better accuracy than those found in previous works with transparent partition of input space.

확산 모델 기반 시퀀스 이상 탐지 (Sequence Anomaly Detection based on Diffusion Model)

  • 장지원;조인휘
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.2-4
    • /
    • 2023
  • Sequence data plays an important role in the field of intelligence, especially for industrial control, traffic control and other aspects. Finding abnormal parts in sequence data has long been an application field of AI technology. In this paper, we propose an anomaly detection method for sequence data using a diffusion model. The diffusion model has two major advantages: interpretability derived from rigorous mathematical derivation and unrestricted selection of backbone models. This method uses the diffusion model to predict and reconstruct the sequence data, and then detects the abnormal part by comparing with the real data. This paper successfully verifies the feasibility of the diffusion model in the field of anomaly detection. We use the combination of MLP and diffusion model to generate data and compare the generated data with real data to detect anomalous points.

A Study on Explainable Artificial Intelligence-based Sentimental Analysis System Model

  • Song, Mi-Hwa
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제14권1호
    • /
    • pp.142-151
    • /
    • 2022
  • In this paper, a model combined with explanatory artificial intelligence (xAI) models was presented to secure the reliability of machine learning-based sentiment analysis and prediction. The applicability of the proposed model was tested and described using the IMDB dataset. This approach has an advantage in that it can explain how the data affects the prediction results of the model from various perspectives. In various applications of sentiment analysis such as recommendation system, emotion analysis through facial expression recognition, and opinion analysis, it is possible to gain trust from users of the system by presenting more specific and evidence-based analysis results to users.

혼파초지에서 모형의 단계적 적용을 통한 수량예측 연구 (A Research on Yield Prediction of Mixed Pastures in Korea via Model Construction in Stages)

  • 오승민;김문주;팽경룬;이배훈;김지융;김병완;조무환;성경일
    • 한국초지조사료학회지
    • /
    • 제37권1호
    • /
    • pp.80-91
    • /
    • 2017
  • 본 연구는 기후요인을 이용한 혼파초지 수량예측모형을 기초로 하여 시비, 파종 및 조성연차 요인을 단계적으로 적용하여 해석력이 높은 모형을 선정하는데 목적이 있다. 혼파초지 수량예측모형 구축 과정은 자료(풀사료 및 기상자료)수집, 가공, 분석 및 모형 구축의 순이었다. 여기서 수량예측모형은 기후, 시비, 파종 및 조성연차 요인을 고려하여 6가지를 구축하였으며, 해석력 및 풀사료 생산 이론 측면의 검토를 통해 최적의 모형을 선택하였다. 그 결과 기후, 시비 및 파종과 조성연차(조성연차의 그룹화) 요인을 고려한 Model VI이 선택되었다(해석력=53.8%). Model VI의 요인 별 해석력은 기후요인이 가장 크고(24.5%) 시비(17.8%), 파종(10.7%) 및 조성연차(0.8%) 요인의 순이었다. 그러나 건물수량과 하고일수 간에 나타난 정(+)의 상관관계는 지역별 및 적산변수 등의 관점에서 검토가 필요하다. 또한 시비량 및 파종량은 특정값에 집중적으로 분포하고 있어 이차항(Quadratic term)을 이용하여 적정 수준에 관한 연구가 요구된다.