DOI QR코드

DOI QR Code

The Credit Information Feature Selection Method in Default Rate Prediction Model for Individual Businesses

개인사업자 부도율 예측 모델에서 신용정보 특성 선택 방법

  • Received : 2020.12.26
  • Accepted : 2021.02.15
  • Published : 2021.03.31

Abstract

In this paper, we present a deep neural network-based prediction model that processes and analyzes the corporate credit and personal credit information of individual business owners as a new method to predict the default rate of individual business more accurately. In modeling research in various fields, feature selection techniques have been actively studied as a method for improving performance, especially in predictive models including many features. In this paper, after statistical verification of macroeconomic indicators (macro variables) and credit information (micro variables), which are input variables used in the default rate prediction model, additionally, through the credit information feature selection method, the final feature set that improves prediction performance was identified. The proposed credit information feature selection method as an iterative & hybrid method that combines the filter-based and wrapper-based method builds submodels, constructs subsets by extracting important variables of the maximum performance submodels, and determines the final feature set through prediction performance analysis of the subset and the subset combined set.

본 논문에서는 개인사업자 부도율을 보다 정확하게 예측하기 위한 새로운 방법으로 개인사업자의 기업 신용 및 개인 신용정보를 가공, 분석하여 입력 특성으로 활용하는 심층 신경망기반 예측 모델을 제시한다. 다양한 분야의 모델링 연구에서 특성 선택 기법은 특히 많은 특성을 포함하는 예측 모델에서 성능 개선을 위한 방법으로 활발히 연구되어 왔다. 본 논문에서는 부도율 예측 모델에 이용된 입력 변수인 거시경제지표(거시변수)와 신용정보(미시변수)에 대한 통계적 검증 이후 추가적으로 신용정보 특성 선택 방법을 통해 예측 성능을 개선하는 특성 집합을 확인할 수 있다. 제안하는 신용정보 특성 선택 방법은 통계적 검증을 수행하는 필터방법과 다수 래퍼를 결합 사용하는 반복적·하이브리드 방법으로, 서브 모델들을 구축하고 최대 성능 모델의 중요 변수를 추출하여 부분집합을 구성 한 후 부분집합과 그 결합셋에 대한 예측 성능 분석을 통해 최종 특성 집합을 결정한다.

Keywords

References

  1. 고우석, 윤춘경, 이한필, 황순진, 이상우 (2019), "머신러닝 기반 CFS(Correlation-based Feature Selection)기법과 Random Forest 모델을 활용한 BMI(Benthic Macroinvertebrate Index) 예측에 관한 연구", 한국물환경학회지, 제35권, 제5호, pp.425-431. https://doi.org/10.15681/kswe.2019.35.5.425
  2. 권누리, 김영민, 최광신 (2019), "거시경제 변수를 고려한 한국기업부도 모형 구축 방법 연구", 한국데이터정보과학회지, 제30권, 제5호, pp.1037-1050.
  3. 김경륜, 김재권, 이종식 (2020), "특성집합 IG-MLP 평가기반의 최적화된 특성선택 방법을 이용한 질환 예측머신러닝 모델", 한국시뮬레이션학회논문지, 제29권, 제1호, pp.11-21. https://doi.org/10.9709/JKSS.2020.29.1.011
  4. 김창배, 남주하 (2008), "산업별 신용위험 결정요인 분석: 거시변수와 산업간 부실 전이효과를 중심으로", 국제지역연구, 제12권, 제1호, pp.95-116.
  5. 김한균 (2000), "기업부실예측모델의 산업에의 적용", 산은조사월보, pp.1-24.
  6. 남주하, 김창배 (2008), "산업별 신용위험에 대한 연구", 응용경제, 제10권, 제3호, pp.157-181.
  7. 남기정, 이동명, 진로 (2019), "비재무정보를 이용한 창업기업의 부실요인에 관한 실증연구", 벤처창업연구, 제14권, 제1호, pp.139-149.
  8. 박근영, 한현수 (2013), "자동차부품제조업의 부도 위험수준 예측 연구", 한국데이타베이스학회, 제20권, 제4호, pp.221-234.
  9. 박주완, 송창길, 배진성 (2017), "기계학습 기법을 이용한 소상공인 신용평가모형 구축에 관한 연구", 한국비즈니스리뷰, 제10권, 제3호, pp.1-16.
  10. 박호연, 김경재 (2018), "시뮬레이티드 어니일링 기반의 랜덤 포레스트를 이용한 기업부도예측", 지능정보연구, 제24권, 제4호, pp.155-170. https://doi.org/10.13088/JIIS.2018.24.4.155
  11. 서재현 (2018), "유전 알고리즘 기반의 비정상 행위 탐지를 위한 특성선택", 한국융합학회논문지, 제9권, 제7호, pp.1-7. https://doi.org/10.15207/JKCS.2018.9.7.001
  12. 어균선, 이건창 (2019), "효과적인 오피니언 마이닝을 위한 최적속성선택에 관한 연구", 한국컴퓨터정보학회논문지, 제24권, 제2호, pp.171-177.
  13. 윤경영, 김석진 (2013), "거시경제변수가 소상공인 신용위험에 미치는 영향", 경영학연구, 제42권, 제4호, pp.959-985.
  14. 윤병우, 권태구 (2020), "자영업가구의 채무불이행 결정요인에 관한 실증연구", 한국자료분석학회, 제22권, 제1호, pp.279-292.
  15. 윤상용, 강만수, 이형탁 (2016), "소상공인 신용평가에서 비재무적 정보는 중요한가", 경영컨설팅연구, 제16권, 제2호, pp.37-46.
  16. 원재환, 반주희 (2012), "부도확률 예측에서 미시정보와 거시정보의 역할", 금융안정연구, 제13권, 제2호, pp.25-50.
  17. 이대범, 서재현 (2019), "특성선택 기법에 기반한 UNSWNB15 데이터셋의 분류 성능 개선", 한국융합학회논문지, 제10권, 제5호, pp.35-42. https://doi.org/10.15207/jkcs.2019.10.5.035
  18. 이상근, 장병탁 (2004), "베이지안 신경망을 이용한 유전자 발현 데이터에서의 특성 선택 기법", 한국정보과학회 2004 학술발표논문집, pp.235-237.
  19. 이인로, 김동철 (2015), "회계정보와 시장정보를 이용한 부도예측모형의 평가 연구", 재무연구, 제28권, 제4호, pp.626-666.
  20. 이재식, 정미경 (2008), "단변량 분석과 LVF 알고리즘을 결합한 하이브리드 속성선정 방법", 지능정보연구, 제14권, 제4호, pp.179-200.
  21. 이치송 (2005), "거시경제변수와 산업별 신용위험에 관한 연구", 산업경제연구, 제18권, 제1호, pp.79-99.
  22. 정병우, 박기영, 황선영 (2013), "객체검출을 위한 빠르고 효율적인 Haar-Like 피처선택 알고리즘", 한국통신학회논문지, 제38권, 제6호, pp.486-491.
  23. 한국신용정보원(Korea Credit Information Services), http://www.kcredit.or.kr.
  24. 홍동숙 (2020), "AI기반 개인사업자 업종별 부도율 예측에 관한 연구 : 신용정보 입력변수의 유용성 검증과 AI 기법 성능 평가 중심으로", CIS이슈리포트 2020-6호, pp.1-12.
  25. 홍승현, 신경식 (2003), "유전자 알고리즘을 활용한 인공신경망 모형 최적입력변수의 선정: 부도예측 모형을 중심으로", 한국지능정보시스템학회논문지, 제9권, 제1호, pp.227-249.
  26. Altman, E. I. (1968), Financial Ratios, Discriminant Analysis and the Predication of Corporate Bankruptcy, Journal of Finance, Vol. 23, pp 589-609. https://doi.org/10.1111/j.1540-6261.1968.tb00843.x
  27. Chava, S., Jarrow, R. A. (2004), Bankruptcy Prediction with Industry Effects, Review of Fiance, Vol 8, Issue 4, pp.537-569. https://doi.org/10.1093/rof/8.4.537
  28. Girija, A., Manohara P. M. M., Radhika, M. P. (2019), Feature Selection Using Submodular Approach for Financial Big Data, Journal of Information Processing Systems, Vol 15, Issue 6. pp.1306-1325. https://doi.org/10.3745/JIPS.04.0149
  29. Hong, D. S., Baek, H. J. (2020), Default Rate Prediction Models for Self- employment in Korea using Ridge, Random Forest and Deep Neural Network, Lattice : The Machine Learning Journal, Vol 1, Issue 3. pp.21-26.
  30. Kohavi, R., John, G. H. (1997), Wrappers for Feature Subset Selection, Artificial intelligence, Vol 97, Issue 1-2. pp.273-324. https://doi.org/10.1016/S0004-3702(97)00043-X
  31. Li, J., Cheng, K., Wang, S., Morstatter, F., Trevino, R. P., Tang, J., Liu, H. (2018), Feature selection: a Data Perspective, ACM Computing Surveys, Vol 50, no 6, pp.1-45.
  32. Merton. R. (1974), On the Pricing of Corporate Debt: The Risk Structure of Interest Rates, Journal of Fincance Vol 29, pp.449-470.
  33. Nguyen, H., Franke, K., Petrovic, S. (2010), Improving Effectiveness of Intrusion Detection by Correlation Feature Selection in Availability, Reliability, and Security, ARES'10 International Conference on, pp.17-24.
  34. Ohlson, J. A. (1980), Financial ratios and the probabilistic prediction of bankruptcy, Journal of Accounting Research, Vol 18, Issue 1, pp.109-131. https://doi.org/10.2307/2490395
  35. Tong, X. (2014), Modeling Corporate Default Rates, International Journal of Economics and Finance, Vol 6, No 8, pp.1-14. https://doi.org/10.5539/ijef.v6n8p1