• 제목/요약/키워드: GBM 모형

검색결과 25건 처리시간 0.023초

법인의 전기 사내유보가 당기 배당률에 미치는 영향 부채비율의 조절변수 효과 및 DRF & GBM 모델을 통한 검증 (The Effects of the Previous Corporate Internal Reservation on the Current Dividend Rate - Using LEV as a moderating variable & Verification through DRF & GBM model)

  • 유준수;정재연
    • 한국융합학회논문지
    • /
    • 제8권10호
    • /
    • pp.215-223
    • /
    • 2017
  • 본 논문은 법인의 전기 사내유보가 당기 배당률에 미치는 영향을 분석함으로써 미환류 소득세제가 어느 정도 효과를 거두고 있는지 실증분석 하고자 하였으며 추가로 부채비율을 조절변수로 사용하여 정부정책의 유효성도 알아보고자 하였다. 또한 DRF와 GBM 모델을 이용하여 그 효과를 한 번 더 살펴보았다. 실증분석 결과 모형1, 모형2, 모형3에서 모두 현금흐름비율, 자기자본순이익률, 외국인보유비중 변수가 99% 수준에서 유의미함을 확인할 수 있었던 반면 광고선전비 비율, 대주주지분율 변수는 모든 모형에서 유의미하지 않은 결과를 보여주었다. 융합 차원에서 실시한 DRF와 GBM 모형의 분석 결과를 보면 DRF가 depth와 leaves에서 GBM 보다 더 높게 나타났으나 모형의 설명력에 있어서는 GBM이 DRF보다 더 높았다. 앞으로의 과제는 미환류 소득세제의 시행기간인 3년간(2015~2017)의 시계열 분석을 통하여 정부정책의 효과를 살펴볼 필요가 있다.

LightGBM 알고리즘을 활용한 고속도로 교통사고심각도 예측모델 구축 (Predicting of the Severity of Car Traffic Accidents on a Highway Using Light Gradient Boosting Model)

  • 이현미;전교석;장정아
    • 한국전자통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.1123-1130
    • /
    • 2020
  • 본 연구는 고속도로 교통사고 심각도 예측모델을 구축하기 위해 다섯가지 머신러닝 기반의 분류모형 적용하였다. 2015년~2017년 동안 전국 고속도로에서 발생한 사고 데이터 21,013건을 5가지의 분류 모형을 적용한 결과 LightGBM(Light Gradient Boosting Model)이 가장 좋은 성능을 나타내는 것으로 나타났다. LightGBM에서는 교통사고심각도 추정에 있어 우선순위 요인으로 사고차량 수, 사고유형, 사고지점, 사고차로유형, 사고차량 유형 순으로 나타났다. 이러한 모형의 결과를 기반으로 일관적인 사고심각도 예측 과정을 통하여 교통사고대응관리 전략 수립에 활용할 수 있다. 본 연구는 국내 기계학습을 활용한 사례가 적은 여건에서 향후 빅데이터 기반의 다양한 기계학습 기법을 활용이 가능함을 제시하고 있다.

법인의 전기 사내유보가 당기 연구개발 투자에 미치는 영향 - 교육훈련비의 조절변수 효과 및 GBM 모델을 통한 검증 (The Effects of the Previous Corporation Internal Reservation on the Current R&D Investment -Using EDU as a moderating variable & Verification through GBM model)

  • 유준수;정재연
    • 한국융합학회논문지
    • /
    • 제9권1호
    • /
    • pp.9-20
    • /
    • 2018
  • 본 논문은 법인의 전기 사내유보가 당기 연구개발 투자에 미치는 영향을 분석함으로써 미환류 소득세제가 어느 정도 효과를 거두고 있는지 실증분석 하고자 하였으며 추가로 교육훈련비를 조절변수로 사용하여 정부정책의 유효성도 알아보고자 하였다. 또한 GBM 모델을 이용하여 그 효과를 한 번 더 살펴보았다. 연구 결과 교육훈련비의 조절효과와 매개효과 모두 유의미한 효과가 있는 것으로 판단할 수 있었고 모형1, 모형2, 모형3에서 모두 이자비용과 복리후생비 변수가 99% 수준에서 유의미함을 확인할 수 있었던 반면 전기유보율은 모든 모형에서 유의미하지 않은 결과를 보여주었다. 이를 통해 정부의 미환류 소득세제 도입 취지인 사내 유보금 과세를 추진하면 기업은 그 재원으로 물적 및 인적 투자를 늘릴 것이라는 가정은 아직 그 효과가 미미한 것으로 사료된다. 추가분석으로 실시한 융합 차원에서의 GBM 모형에서도 비슷한 결과가 도출되었다. 앞으로의 과제는 미환류 소득세제의 시행기간인 3년간(2015~2017)의 시계열 분석을 통하여 정부정책의 효과를 살펴볼 필요가 있다.

머신러닝을 이용한 이동통신 데이터 기반 교통량 추정 모형 개발 (A Study on the Development of Traffic Volume Estimation Model Based on Mobile Communication Data Using Machine Learning)

  • 오동섭;윤소식;이철기;조용성
    • 한국ITS학회 논문지
    • /
    • 제22권4호
    • /
    • pp.1-13
    • /
    • 2023
  • 본 연구는 이동통신 로그 데이터를 통해 산출된 교통량 정보를 활용하여 기존 검지기에 준하는 교통량 정보를 추정하기 위해, 머신러닝의 앙상블 기법을 기반으로 하는 최적의 이동통신 기반 교통량 추정 모형을 개발하는 것이다. 이동통신 데이터를 통해 계측된 교통량 등의 정보와 VDS 실측 데이터를 활용하여 머신러닝 모형들을 통해 비교·분석한 결과, LightGBM 모형이 교통량 추정의 최적모형으로 선정되었다. 국도 1, 3, 6호선 검지영역 96개소를 대상으로 교통량 추정 모형의 성능을 평가한 결과, 전체 검지영역의 경우 MAPE 8.49로 교통량 추정 정확도가 91.51%로 분석되었다. VDS가 설치되지 않은 구간의 경우 교통량 추정 정확도는 92.6%로, VDS 설치가 어려운 구간에서도 LightGBM 교통량 추정 모형이 적용 가능하였다.

머신러닝을 이용한 CNC 가공 불량 발생 예측 모델 (Prediction Model of CNC Processing Defects Using Machine Learning)

  • 한용희
    • 한국융합학회논문지
    • /
    • 제13권2호
    • /
    • pp.249-255
    • /
    • 2022
  • 본 연구는 최근 가공 불량 예측 방법으로 주목받고 있는 머신러닝 기반의 모델을 이용하여 CNC 가공 불량 발생의 실시간 예측을 위한 분석 프레임워크를 제안하고, 해당 프레임워크에 기반하여 XGBoost, CatBoost, LightGBM, 랜덤 포레스트, Extra Trees, SVM, k-최근접 이웃, 로지스틱 회귀 모델을 CNC 설비에 기본 내장된 센서들로부터 추출된 데이터에 적용 및 분석하였다. 분석 결과 XGBoost, CatBoost, LightGBM 모델이 동일하게 가장 우수한 정확도, 정밀도, 재현율, F1 점수, AUC 값을 보였으며, 이 중 LightGBM 모델이 소요 실행 시간이 가장 짧은 것으로 나타났다. 이러한 짧은 소요 실행 시간은 실 시스템 구축 비용 절감, 빠른 불량 예측에 따른 CNC 장비 파손 확률 감소, 전체적인 CNC 활용률 증가 등의 실무적 장점을 가지므로 LightGBM 모델이 기본 센서들만 설치된 CNC 설비에 적용 시 가공 불량 예측에 가장 효과적으로 판단된다. 또한 소요 실행 시간 및 컴퓨팅 파워의 제약이 없는 상황에서는 LightGBM, Extra Trees, k-최근접 이웃, 로지스틱 회귀 모형으로 구성된 앙상블 모델을 적용할 경우 분류 성능이 최대화됨을 확인하였다.

머신러닝 기반 KOSDAQ 시장의 관리종목 지정 예측 연구

  • 윤양현;김태경;김수영;박용균
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2021년도 추계학술대회
    • /
    • pp.185-187
    • /
    • 2021
  • 관리종목 지정 제도는 상장 기업 내 기업의 부실화를 경고하여 기업에게는 회생 기회를 주고, 투자자들에게는 투자 위험을 경고하기 위한 시장규제 제도이다. 본 연구는 관리종목과 비관리종목의 기업의 재무 데이터를 표본으로 하여 관리종목 지정 예측에 대한 연구를 진행하였다. 분석에 쓰인 분석 방법은 로지스틱 회귀분석, 의사결정나무, 서포트 벡터 머신, 소프트 보팅, 랜덤 포레스트, LightGBM이며 분류 정확도가 82.73%인 LightGBM이 가장 우수한 예측 모형이었으며 분류 정확도가 가장 낮은 예측 모형은 정확도가 71.94%인 의사결정나무였다. 대체적으로 앙상블을 이용한 학습 모형이 단일 학습 모형보다 예측 성능이 높았다.

  • PDF

단순 확산과정들에 대한 확률효과 모형 (Random effect models for simple diffusions)

  • 이은경;이인석;이윤동
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.801-810
    • /
    • 2018
  • 확산은 금융이나 물리적 현상의 모형화에 이용되는 확률과정이다. 반복적으로 관측된 확산과정에 대하여 통계적인 모형을 구축할 때, 확률효과를 고려할 필요가 있다. 이 연구에서는 Ornstein-Uhlenbeck 확산모형과 geometric Brownian motion 확산모형에 대하여 확률효과를 도입한다. 모형모수에 대한 최도우도추정법을 적용하기 위하여, 확률효과에 대한 적절한 분포를 가정하여 닫힌 형태로 우도함수를 얻는 방법을 탐색하였다. 1991년부터 2017년까지 27년간 일일 단위로 기록된 다우존스 산업지수에 대하여 확률효과 모형을 적용하였다.

일반화가속모형을 이용한 기술신용평가 주요 지표 분석 (Analysis of Important Indicators of TCB Using GBM)

  • 전우정;서영욱
    • 한국전자거래학회지
    • /
    • 제22권4호
    • /
    • pp.159-173
    • /
    • 2017
  • 기술력 기반의 중소벤처기업에 대한 기술금융 지원을 위해 정부는 2014년 7월부터 기술보증기금 및 일정 자격을 갖춘 민간 기술신용평가사에게 일종의 기술력 등급평가인 기술신용평가를 실시하여 은행의 여신에 활용토록 하였다. 본 논문에서는 최근까지의 기술신용평가 현황 및 한국신용정보원에서 축적하고 있는 기술평가 관련 가용 지표들에 대한 선행 연구를 개략적으로 살펴본 후 기술평가등급점수에 유의적인 영향을 미치는 지표(indicator)를 통상적인 다중회귀기법으로 탐색할 것이다. 본 논문의 관심 대상인 지표 별 등급 영향도와 모형의 적합도는 대표적인 기계학습 분류기(classifier)인 일반화가속모형(Generalized Boosting Model; GBM)을 적용하여 분석하였는 바, 주요 지표를 독립변수(feature)로 투입하여 지표의 상대적 중요성 및 분류 정확도를 산출하였다. 분석결과 회귀모형과 기계학습 모형 간 지표별 상대적인 중요도는 크게 차이나지 않는 것으로 분석되었으나, GBM 모형의 경우 회귀모형에 비해서 이노비즈인증, 연구소 및 연구개발전담부서 보유, 특허등록건수, 벤처확인 지표 등 기술개발역량이 상대적으로 기술등급에 더 큰 영향을 미치는 것으로 분석되었다.

머신러닝 기반 KOSDAQ 시장의 관리종목 지정 예측 연구: 재무적 데이터를 중심으로 (Study on Predicting the Designation of Administrative Issue in the KOSDAQ Market Based on Machine Learning Based on Financial Data)

  • 윤양현;김태경;김수영
    • 벤처창업연구
    • /
    • 제17권1호
    • /
    • pp.229-249
    • /
    • 2022
  • 본 연구는 다양한 머신러닝 기법을 통해 코스닥(KOSDAQ) 시장 내 관리종목 지정을 예측할 수 있는 모델에 대해 연구하였다. 증권시장 내 기업이 관리종목으로 지정이 되면 시장에서는 이를 부정적인 정보로 인식하여 해당 기업과 투자자에게 손실을 가져오게 된다. 본 연구를 통해 기업의 재무적 데이터를 바탕으로 조기에 관리종목 지정을 예측하고, 투자자들의 포트폴리오 리스크 관리에 도움을 주기 위한 머신러닝 접근이 타당한지 살펴본다. 본 연구를 위해 활용한 독립변수는 수익성, 안정성, 활동성, 성장성을 나타내는 21개의 재무비율을 활용하였으며, K-IFRS가 적용된 2011년부터 2020년까지 관리종목과 비관리종목의 기업의 재무 데이터를 표본으로 추출하였다. 로지스틱 회귀분석, 의사결정나무, 서포트 벡터 머신, 랜덤 포레스트, LightGBM을 활용하여 관리종목 지정 예측 연구를 수행하였다. 연구결과는 분류 정확도가 82.73%인 LightGBM이 가장 우수한 예측 모형이었으며 분류 정확도가 가장 낮은 예측 모형은 정확도가 71.94%인 의사결정나무였다. 의사결정나무 기반 학습 모형의 변수 중요도의 상위 3개 변수를 확인한 결과 각 모형에서 공통적으로 나온 재무변수는 ROE(당기순이익), 자본금회전율(Capital stock turnover ratio)로 해당 재무변수가 관리종목 지정에 있어 상대적으로 중요한 변수임을 확인하였다. 대체적으로 앙상블을 이용한 학습 모형이 단일 학습 모형보다 예측 성능이 높은 것을 확인하였다. 기존 선행연구가 K-IFRS에 대한 고려를 하지 않았고, 다소 제한된 머신러닝에 의존하였다. 따라서 본 연구의 필요성과 함께 현실적 요구를 충족시키는 결과를 제시하였음을 알 수 있으며, 시장참여자들에게 있어 관리종목 지정에 대한 사전 예측을 확인할 수 있도록 기여했다고 볼 수 있다.

기계학습을 이용한 수출신용보증 사고예측 (The Prediction of Export Credit Guarantee Accident using Machine Learning)

  • 조재영;주지환;한인구
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.83-102
    • /
    • 2021
  • 2020년 8월 정부는 한국판 뉴딜을 뒷받침하기 위한 공공기관의 역할 강화방안으로서 각 공공기관별 역량을 바탕으로 5대 분야에 걸쳐 총 20가지 과제를 선정하였다. 빅데이터(Big Data), 인공지능 등을 활용하여 대국민 서비스를 제고하고 공공기관이 보유한 양질의 데이터를 개방하는 등의 다양한 정책을 통해 한국판 뉴딜(New Deal)의 성과를 조기에 창출하고 이를 극대화하기 위한 다양한 노력을 기울이고 있다. 그중에서 한국무역보험공사(KSURE)는 정책금융 공공기관으로 국내 수출기업들을 지원하기 위해 여러 제도를 운영하고 있는데 아직까지는 본 기관이 가지고 있는 빅데이터를 적극적으로 활용하지 못하고 있는 실정이다. 본 연구는 한국무역보험공사의 수출신용보증 사고 발생을 사전에 예측하고자 공사가 보유한 내부 데이터에 기계학습 모형을 적용하였고 해당 모형 간에 예측성과를 비교하였다. 예측 모형으로는 로지스틱(Logit) 회귀모형, 랜덤 포레스트(Random Forest), XGBoost, LightGBM, 심층신경망을 사용하였고, 평가 기준으로는 전체 표본의 예측 정확도 이외에도 표본별 사고 확률을 구간으로 나누어 높은 확률로 예측된 표본과 낮은 확률로 예측된 경우의 정확도를 서로 비교하였다. 각 모형별 전체 표본의 예측 정확도는 70% 내외로 나타났고 개별 표본을 사고 확률 구간별로 세부 분석한 결과 양 극단의 확률구간(0~20%, 80~100%)에서 90~100%의 예측 정확도를 보여 모형의 현실적 활용 가능성을 보여주었다. 제2종 오류의 중요성 및 전체적 예측 정확도를 종합적으로 고려할 경우, XGBoost와 심층신경망이 가장 우수한 모형으로 평가되었다. 랜덤포레스트와 LightGBM은 그 다음으로 우수하며, 로지스틱 회귀모형은 가장 낮은 성과를 보였다. 본 연구는 한국무역보험공사의 빅데이터를 기계학습모형으로 분석해 업무의 효율성을 높이는 사례로서 향후 기계학습 등을 활용하여 실무 현장에서 빅데이터 분석 및 활용이 활발해지기를 기대한다.