• 제목/요약/키워드: 설명모형

검색결과 2,376건 처리시간 0.031초

머신러닝 기반 부도예측모형에서 로컬영역의 도메인 지식 통합 규칙 기반 설명 방법 (Domain Knowledge Incorporated Local Rule-based Explanation for ML-based Bankruptcy Prediction Model)

  • 조수현;신경식
    • 경영정보학연구
    • /
    • 제24권1호
    • /
    • pp.105-123
    • /
    • 2022
  • 신용리스크 관리에 해당하는 부도예측모형은 기업에 대한 신용평가라고도 볼 수 있으며 은행을 비롯한 금융기관의 신용평가모형의 기본 지식기반으로 새로운 인공지능 기술을 접목할 수 있는 유망한 분야로 손꼽히고 있다. 고도화된 모형의 실제 응용은 사용자의 수용도가 중요하나 부도예측모형의 경우, 금융전문가 혹은 고객에게 모형의 결과에 대한 설명이 요구되는 분야로 설명력이 없는 모형은 실제로 도입되고 사용자들에게 수용되기에는 어려움이 있다. 결국 모형의 결과에 대한 설명은 모형의 사용자에게 제공되는 것으로 사용자가 납득할 수 있는 설명을 제공하는 것이 모형에 대한 신뢰와 수용을 증진시킬 수 있다. 본 연구에서는 머신러닝 기반 모형에 설명력을 제고하는 방안으로 설명대상 인스턴스에 대하여 로컬영역에서의 설명을 제공하고자 한다. 이를 위해 설명대상의 로컬영역에 유전알고리즘(GA)을 이용하여 가상의 데이터포인트들을 생성한 후, 로컬 대리모델(surrogate model)로 연관규칙 알고리즘을 이용하여 설명대상에 대한 규칙기반 설명(rule-based explanation)을 생성한다. 해석 가능한 로컬 모델의 활용으로 설명을 제공하는 기존의 방법에서 더 나아가 본 연구는 부도예측모형에 이용된 재무변수의 특성을 반영하여 연관규칙으로 도출된 설명에 도메인 지식을 통합한다. 이를 통해 사용자에게 제공되는 규칙의 현실적 가능성(feasibility)을 확보하고 제공되는 설명의 이해와 수용을 제고하고자 한다. 본 연구에서는 대표적인 블랙박스 모형인 인공신경망 기반 부도예측모형을 기반으로 최신의 규칙기반 설명 방법인 Anchor와 비교하였다. 제안하는 방법은 인공신경망 뿐만 아니라 다른 머신러닝 모형에도 적용 가능한 방법(model-agonistic method)이다.

존 데이터 기반 수단분담모형에 관한 연구 (A Study on the Modal Split Model Using Zonal Data)

  • 류시균;노정현;김지은
    • 대한교통학회지
    • /
    • 제30권1호
    • /
    • pp.113-123
    • /
    • 2012
  • 본 연구에서는 수단별 비용변수를 주요 설명변수로 활용하고 있는 현행 수단분담모형의 문제점으로서 설명변수간 높은 상관관계로 인한 다중공선성 문제와 버스노선의 가변성으로 인한 설명변수의 장래치 추정불가능성 문제를 지적하고 이와 같은 문제점을 극복할 수 있는 방안으로서 존을 설명하는 사회경제적 변수, 토지이용변수, 교통체계변수들을 설명변수로 하는 '존 데이터 기반 수단분담모형'의 활용가능성을 검증하였다. 장래교통수요추정모형으로서 수단분담모형의 설명변수가 갖추어야 할 조건으로서 목표연도별 설명변수의 추정가능성을 설정하고 이러한 조건을 만족하는 존 데이터를 설명변수로 한 수단분담모형을 구축하였으며 수단별 비용변수를 주요 설명변수로 하는 수단분담모형과의 비교를 수행하였다. 추정된 계수에 대한 통계적 유의성 검정에서 비용변수간 높은 상관관계로 인한 다중공선성 문제를 확인할 수 있었으며 적합도 평가(우도비의 비교)를 통해서 존 데이터 기반 수단분담모형이 수단별 비용변수를 설명변수로 한 수단분담모형에 비해서 설명력이 더욱 높다는 사실이 확인되었다.

우리나라 증권시장과 거시경제변수 : ANN와 VECM의 설명력 비교 (Korean Stock Price Index and Macroeconomic Forces)

  • 정성창
    • 재무관리연구
    • /
    • 제19권2호
    • /
    • pp.211-231
    • /
    • 2002
  • 본 연구의 목적은 VECM(Vector Error Correction Model)과 인공지능모형(Artificial Neural Networks)을 이용하여 우리나라 증권시장과 거시경제 변수들과의 장기적 관계에 대한 설명력을 비교해보고자 함에 있다. VECM이 APT(Arbitrage Pricing Theory)에 기초를 둔 선형동학모형이라고 한다면, 인공지능모형은 비모수적 비선형모형이라는 점에서, 두 방법론의 분석결과를 직접 비판하는 것은 의미있는 연구라고 할 수 있다. 인공지능모형을 주로 활용하는 선행연구들에 의하면, 증권시장은 시장의 특이패턴들로 인해 계량경제학적 접근인 선형 모형보다는 인공지능모형을 통해 증권시장의 움직임을 설명하고 예측하는 것이 더 바람직할 수도 있다는 것이다. 따라서, 본 연구에서는 VECM분석에서 자료의 안정성을 검증하고, 공적분 백터를 발견한 이후, 장기적 균형관계의 실증적 분석을 하였다. 그리고, 인공지능모형에서는 delta rule과 Sigmoid 함수를 이용한 GRNN(General Regression Neural Net)과 Back-Propagation등의 방법들을 활용하였다. 이러한 분석결과, Back-Propagation 모형이 다른 모든 모형들보다도 더 우수한 설명력을 보여주고 있었다. 이러한 결과들은 인공지능모형이 동태적인 선형 모형보다도 더 우수한 설명력을 제공할 수 있는 가능성을 보여주고 있었다.

  • PDF

포아송 모형에서의 설명변수 선택문제 - 정규분포 설명변수하에서 - (Subset Selection in the Poisson Models - A Normal Predictors case -)

  • 박종선
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.247-255
    • /
    • 1998
  • 일반선형 모형의 하나인 포아송모형에서 설명변수들을 선택하는 문제를 고려하여 보았다 설명변수들이 정규분포를 따르는 확률변수일 때 반응변수의 조건부 분포를 통하여 모형에 필요한 설명변수의 부분집합을 선택하는 방범을 제시하였다.

  • PDF

부도예측모형에서 도메인 지식을 통합한 반사실적 예시 기반 설명력 증진 방법 (Domain Knowledge Incorporated Counterfactual Example-Based Explanation for Bankruptcy Prediction Model)

  • 조수현;신경식
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.307-332
    • /
    • 2022
  • 부도예측모형은 여러 금융기관의 신용평가모형의 지식기반(knowledge base)로 이용되고 있으며 최근 머신러닝 기법의 발전으로 이를 도입하여 고도화하려는 다양한 시도가 진행 중이다. 그러나 실제 이러한 모형이 도입되기 위해서는 모형을 이용하는 사용자와 설명제공 대상인 고객의 이해와 수용이 전제되어야 한다. 그러나 사용자에게 제공되는 설명이 현실적 타당성(feasibility)이 결여되어 있다면 모형의 신뢰성과 수용도에 부정적인 영향을 미친다. 이에 따라 본 연구는 도메인 지식을 설명 생성 알고리즘에 통합하여 현실적으로 타당한 설명을 사용자에게 제공하고자 한다. 본 연구에서는 머신러닝 기반의 부도예측 모형에 설명력을 더하는 방법으로 반사실적 예시(counterfactual example) 기반의 로컬영역에서의 설명을 제공하는 모델을 제안한다. 제안 모델은 모형에 이용된 재무변수의 특성을 설명력 생성 알고리즘에 통합하여 설명의 현실적 가능성을 확보하고 이를 통해 사용자의 이해와 수용을 도모하고자 한다. 또한 본 연구에서는 반사실적 예시기반 설명을 위해 유전알고리즘(GA)를 이용하며 다목적함수를 목적함수로 설정하여 반사실적 예시의 주요 기준이 되는 항목을 반영하고 있다. 본 연구는 대표적인 머신러닝 기법인 인공신경망을 이용해 부도예측모형을 학습시킨 뒤, 사후적 방법(post-hoc)으로 설명을 위한 알고리즘을 도입하여 기존의 모형 설명 알고리즘인 LIME과 현실적 가능성이 결여된 반사실적 예시 기반 알고리즘과 비교하였다. 더 나아가 제안방법의 금융/회계 분야의 종사자를 대상으로 서베이를 진행하여 제안 방법의 설명의 질을 정성적으로 평가하였다.

로짓모형에 있어서 다중공선성의 영향에 관한 연구 (Effects of Multicollinearity in Logit Model)

  • 류시균
    • 대한교통학회지
    • /
    • 제26권1호
    • /
    • pp.113-126
    • /
    • 2008
  • 비확률변수간 선형관계로 정의되는 다중공선성은 설명변수간 선형방정식으로 표현되는 회귀모형의 신뢰도를 저하시키기 때문에 회귀모형의 구축과정에서는 세심한 검토와 대응이 이루어진다. 본 연구에서는 구조화된 수치실험을 통해서 로짓모형에 대한 다중공선성의 영향을 규명하였다. 효용함수를 구성하는 설명변수들간 상관관계의 정도에 따라서 추정된 모형의 적합도 지표와 계수의 신뢰도 지표가 어떻게 변동하는 지를 추적함으로써 다음과 같은 시사점을 확인할 수 있었다. 첫째, 설명변수의 추가를 통해서 모델의 적합도 개선이 가능한 회귀모형과 달리, 로짓모형에서는 효용함수에 설명변수를 추가하는 경우 로짓모형의 적합도가 개선될 수도, 역으로 저하될 수도 있음이 확인되었다. 둘째, 공통의 계수를 갖도록 모델을 구성하면 제네릭 변수간 상관관계가 높아짐에 따라 모델의 적합도가 저하됨을 확인하였다. 셋째, 설명 변수간 상관관계가 높은 경우 선택행동에 대한 설명변수의 기여도가 과대평가될 가능성을 확인하였다. 넷째, 설명변수간 상관관계가 높으면 추정된 계수의 신뢰도가 저하됨을 확인하였다. 결론적으로 본 연구를 통해서 그동안 로짓모형의 구축과정에서는 주목받지 못했던 다중공선성이 실제로는 세심한 배려와 적절한 대응을 통해서 제어되어야 함이 규명되었다.

벌점함수를 이용한 부분최소제곱 회귀모형에서의 변수선택 (Variable Selection in PLS Regression with Penalty Function)

  • 박종선;문규종
    • Communications for Statistical Applications and Methods
    • /
    • 제15권4호
    • /
    • pp.633-642
    • /
    • 2008
  • 본 논문에서는 반응변수가 하나 이상이고 설명변수들의 수가 관측치에 비하여 상대적으로 많은 경우에 널리 사용되는 부분최소제곱회귀모형에 벌점함수를 적용하여 모형에 필요한 설명변수들을 선택하는 문제를 고려하였다. 모형에 필요한 설명변수들은 각각의 잠재변수들에 대한 최적해 문제에 벌점함수를 추가한 후 모의담금질을 이용하여 선택하였다. 실제 자료에 대한 적용 결과 모형의 설명력 및 예측력을 크게 떨어뜨리지 않으면서 필요없는 변수들을 효과적으로 제거하는 것으로 나타나 부분최소제곱회귀모형에서 최적인 설명변수들의 부분집합을 선택하는데 적용될 수 있을 것이다.

공통요인분석자혼합모형의 요인점수를 이용한 일반화가법모형 기반 신용평가 (A credit classification method based on generalized additive models using factor scores of mixtures of common factor analyzers)

  • 임수열;백장선
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.235-245
    • /
    • 2012
  • 로지스틱판별분석은 금융 분야에서 유용하게 사용되고 있는 통계적 기법으로 신용평가 시 해석이 쉽고 우수한 분별력으로 많이 활용되고 있지만 종속변수에 대한 설명변수들의 비선형적인 관계를 설명하는 부분에는 한계점이 있다. 일반화가법모형은 로지스틱판별모형의 장점과 함께 종속변수와 설명변수 사이의 비선형적인 관계도 설명할 수 있다. 그러나 연속형 설명변수의 수가 대단히 많은 경우이 두 방법은 모형에 유의한 변수를 선택해야하는 문제점이 있다. 따라서 본 연구에서는 다수의 연속형 설명변수들을 공통요인분석자혼합모형에 의한 차원축소를 통해 변환된 소수의 요인점수들을 일반화가법모형의 새로운 연속형 설명변수로 사용하여 신용분류를 하는 방법을 제시한다. 실제 금융자료를 이용하여 로지스틱판별모형과 일반화가법모형, 그리고 본 연구에서 제안한 방법에 의한 정분류율을 비교한 결과 본 연구에서 제안한 방법의 분류 성능이 더 우수하였다.

한국 최대 전력량 예측을 위한 통계모형 (Statistical Modeling for Forecasting Maximum Electricity Demand in Korea)

  • 윤상후;이영생;박정수
    • Communications for Statistical Applications and Methods
    • /
    • 제16권1호
    • /
    • pp.127-135
    • /
    • 2009
  • 한국의 경제규모가 꾸준히 커감에 따라 가정, 건물, 공장 등에서 필요로 하는 전력량이 지속적으로 증가하고 있다. 전력공급의 안정화를 위해서는 최대전력량보다 전력공급능력이 높아야 한다. 월별 최대전력량을 잘 설명할 수 있는 통계모형을 찾기 위해 Winters 모형, 분해 시계열모형, ARMA 모형, 설명 변수를 통해 추세성분과 계절성분을 교정한 모형을 살펴보았다. 모형의 예측력 비교 기준으로 모형적합으로부터 구한 RMSE와 MAPE가 사용되었다. 여름철 최대전력량을 예측하기 위해 평균기온과 열대야 일수를 설명 변수로 갖는 시계열 모형이 가장 우수하였다. 아울러 외부요인을 갖는 극단분포 모형을 이용한 분석을 시도하였다.

깁스표본기법을 이용한 설명변수 선택문제에서 사전분포의 설정-선형회귀모형을 중심으로-

  • 박종선;남궁평;한숙영
    • Communications for Statistical Applications and Methods
    • /
    • 제4권2호
    • /
    • pp.333-343
    • /
    • 1997
  • 선형회귀분석에서 변수의 선택문제는 최적의 모형을 찾는데 아주 중요한 부분을 차지한다. George와 McCulloch(1993)는 계층적 베이즈 모형과 깁스표본법을 이용하여 선형회귀모형에서 변수를 선택하는 문제를 고려하였다. 이 논문에서는 George와 McCulloch의 모형을 바탕으로 각각의 설명변수가 모형에 포함될 사전확률을 객관적인 기준에 의하여 결정하는 문제를 고려하여 보았다.

  • PDF