• 제목/요약/키워드: Predicting borrowers

검색결과 3건 처리시간 0.016초

P2P 대부 우수 대출자 예측을 위한 합성 소수집단 오버샘플링 기법 성과에 관한 탐색적 연구 (Exploring the Performance of Synthetic Minority Over-sampling Technique (SMOTE) to Predict Good Borrowers in P2P Lending)

  • 프란시스 조셉 코스텔로;이건창
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.71-78
    • /
    • 2019
  • 본 연구는 P2P 대부 플랫폼에서 우수 대출자를 예측시 유용한 합성 소수집단 오버샘플링 기법을 제안하고 그 성과를 실증적으로 검증하고자 한다. P2P 대부 관련 우수 대출자를 추정할 때 일어나는 문제점중의 하나는 클래스 간 불균형이 심하여 이를 해결하지 않고서는 우수 대출자 예측이 쉽지 않다는 점이다. 이러한 문제를 해결하기 위하여 본 연구에서는 SMOTE, 즉 합성 소수집단 오버샘플링 기법을 제안하고 LendingClub 데이터셋에 적용하여 성과를 검증하였다. 검증결과 SMOTE 방법은 서포트 벡터머신, k-최근접이웃, 로지스틱 회귀, 랜덤 포레스트, 그리고 딥 뉴럴네트워크 분류기와 비교하여 통계적으로 우수한 성과를 보였다.

TeGCN:씬파일러 신용평가를 위한 트랜스포머 임베딩 기반 그래프 신경망 구조 개발 (TeGCN:Transformer-embedded Graph Neural Network for Thin-filer default prediction)

  • 김성수;배준호;이주현;정희주;김희웅
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.419-437
    • /
    • 2023
  • 국내 씬파일러(Thin Filer)의 수가 1200만명을 넘어서며, 금융 업계에서 씬파일러의 신용을 정확히 평가하여 우량고객을 선별해 대출을 공급하는 시도가 많아지고 있다. 특히, 차주의 신용정보에 존재하는 비선형성을 반영하여 채무불이행을 예측하기 위해서 다양한 머신러닝 알고리즘을 활용한 연구가 진행되고 있다. 그 중 그래프 신경망 구조(Graph Neural Network)는 일반적인 신용정보 외에 대출자 간의 네트워크 정보를 반영할 수 있다는 점에서 데이터가 부족한 씬파일러의 채무 불이행 예측에서 주목할 만하다. 그러나, 그래프 신경망을 활용한 기존의 연구들은 신용정보에 존재하는 다양한 범주형 변수를 적절히 처리하지 못했다는 한계가 있었다. 이에 본 연구는 범주형 변수의 맥락적 정보를 추출할 수 있는 트랜스포머 메커니즘(Transformer mechanism)과 대출자 간 네트워크 정보를 반영할 수 있는 그래프 합성곱 신경망(Graph Convolutional Network)를 결합하여 효과적으로 씬파일러의 채무 불이행 예측이 가능한 TeGCN (Transformer embedded Graph Convolutional Network)를 제안한다. TeGCN는 일반 대출자 데이터셋과 씬파일러 데이터셋에 대하여 모두 베이스 라인 모델 대비 높은 성능을 보였으며, 특히 씬파일러 채무 불이행 예측에 우수한 성능을 달성했다. 본 연구는 범주형 변수가 많은 신용정보와 데이터가 부족한 씬파일러의 특성에 적합한 모델 구조를 결합하여 높은 채무 불이행 예측 성능을 달성했다는 시사점이 있다. 이는 씬파일러의 금융소외문제를 해결하고 금융업계에서 씬파일러를 대상으로 추가적인 수익을 창출하는데 기여할 수 있을 것이다.

랜덤포레스트 모델을 활용한 청년층 차입자의 채무 불이행 위험 연구 (Predicting Default Risk among Young Adults with Random Forest Algorithm)

  • 이종희
    • 가족자원경영과 정책
    • /
    • 제26권3호
    • /
    • pp.19-34
    • /
    • 2022
  • 청년층 및 저소득층을 포함한 취약계층과 제2금융권을 중심으로 한 부채 불이행에 대한 우려가 증가하고 있다. 청년층의 가계부채 건전성은 최근 고용 부진, 학자금대출 부담 증가, 제2금융권에서 고금리 대출 증가 등이 복합적으로 작용하여 더욱 취약해졌다. 본 연구의 목적은 한국의 청년층 차입자를 대상으로 채무 불이행 가능성을 진단하고, 그 가능성에 영향을 주는 요인을 예측하는 것이다. 이러한 목적을 달성하기 위하여 본 연구는 2021년 「가계금융·복지조사」를 활용하고, 청년층의 채무 불이행 가능성과 관련된 요인들을 포괄적으로 분석하기 위하여 머신러닝 알고리즘의 랜덤포레스트 방법을 적용하였다. 청년층 차입자의 채무 불이행 위험을 예측하는 모형을 탐색한 뒤 중요도 지수를 산출하고, 중요도가 높은 설명변수들을 선별한 뒤, 주요 결정요인들의 부분 의존성 도표를 제시하고자 하였다. 최종적으로 자산대비부채비율(DTA), 의료비 비중, 가계부실위험지수(HDRI), 통신비 비중, 주거비 비중이 주요한 변인으로 나타났다.