• 제목/요약/키워드: Insurance Claim Prediction

검색결과 9건 처리시간 0.019초

앙상블 러닝 기반 동적 가중치 할당 모델을 통한 보험금 예측 인공지능 연구 (Research on Insurance Claim Prediction Using Ensemble Learning-Based Dynamic Weighted Allocation Model)

  • 최종석
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권4호
    • /
    • pp.221-228
    • /
    • 2024
  • 보험금 예측은 보험사의 리스크 관리와 재무 건전성 유지를 위한 핵심 과제 중 하나이다. 정확한 보험금 예측을 통해 보험사는 적정한 보험료를 책정하고, 예상 외의 손실을 줄이며, 고객 서비스의 질을 향상시킬 수 있다. 본 연구에서는 앙상블 러닝 기법을 적용하여 보험금 예측 모델의 성능을 향상시키고자 한다. 랜덤 포레스트(Random Forest), 그래디언트 부스팅 머신(Gradient Boosting Machine, GBM), XGBoost, Stacking, 그리고 제안한 동적 가중치 할당 모델(Dynamic Weighted Ensemble, DWE) 모델을 사용하여 예측 성능을 비교 분석하였다. 모델의 성능 평가는 평균 절대 오차(MAE), 평균 제곱근 오차(MSE), 결정 계수(R2) 등을 사용하여 수행되었다. 실험 결과, 동적 가중치 할당 모델이 평가 지표에서 가장 우수한 성능을 보였으며, 이는 랜덤 포레스트와 XGBoost, LR, LightGBM의 예측 결과를 결합하여 최적의 예측 성능을 도출한 결과이다. 본 연구는 앙상블 러닝 기법이 보험금 예측의 정확성을 높이는 데 효과적임을 입증하며, 보험업계에서 인공지능 기반 예측 모델의 활용 가능성을 제시한다.

Improving Automobile Insurance Repair Claims Prediction Using Gradient Decent and Location-based Association Rules

  • Seongsu Jeong;Jong Woo Kim
    • Asia pacific journal of information systems
    • /
    • 제34권2호
    • /
    • pp.565-584
    • /
    • 2024
  • More than 1 million automobile insurance repairs occur per year globally, and the related repair costs add up to astronomical amounts. Insurance companies and repair shops are spending a great deal of money on manpower every year to claim reasonable insurance repair costs. For this reason, promptly predicting insurance claims for vehicles in accidents can help reduce social costs related to auto insurance. Several recent studies have been conducted in auto insurance repair prediction using variables such as photos of vehicle damage. We propose a new model that reflects auto insurance repair characteristics to predict auto insurance repair claims through an association rule method that combines gradient descent and location information. This method searches for the appropriate number of rules by applying the gradient descent method to results generated by association rules and eventually extracting main rules with a distance filter that reflects automobile part location information to find items suitable for insurance repair claims. According to our results, predictive performance could be improved by applying the rule set extracted by the proposed method. Therefore, a model combining the gradient descent method and a location-based association rule method is suitable for predicting auto insurance repair claims.

건설공사보험 손실액을 활용한 사고원인 분석연구 (An Analysis of Accident Causes in Construction project by Using Insured Claim Payouts)

  • 유영진;김상호;양성필;김지명;손기영
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2015년도 추계 학술논문 발표대회
    • /
    • pp.60-61
    • /
    • 2015
  • In recent years, the accidents in construction projects are continuously increasing due to their complexity and variety. However, few studies have been conducted regarding the risk prediction model and the database of risk assessment in construction projects. To address of these issues, the objective of this study is to analyze the accident causes by using insured claim payouts of insurance companies. First, the descriptive analysis of accidents causes is conducted according to scheduling rate, season, and total construction costs. Second, the correlation analysis is conducted between accidents causes and total construction costs. In the future, the risk assessment model can be developed to quantify the accident causes in construction projects to estimate claim payouts of insurance companies.

  • PDF

상대오차예측을 이용한 자동차 보험의 손해액 예측: 패널자료를 이용한 연구 (Predicting claim size in the auto insurance with relative error: a panel data approach)

  • 박흥선
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.697-710
    • /
    • 2021
  • 상대오차를 이용한 예측법은 상대오차(혹은 퍼센트오차)가 중요시되는 분야, 특히 계량경제학이나 소프트웨어 엔지니어링, 또는 정부기관 공식통계 부분에서 기존 예측방법 외에 선호되는 예측방법이다. 그 동안 상대오차를 이용한 예측법은 선형 혹은 비선형 회귀분석 뿐 아니라, 커널회귀를 이용한 비모수 회귀모형, 그리고 정상시계열분석에 이르기까지 그 범위가 확장되어 왔다. 그러나, 지금까지의 분석은 고정효과(fixed effect)만을 고려한 것이어서 임의효과(random effect)에 관한 상대오차 예측법에 대한 확장이 필요하였다. 본 논문의 목적은 상대오차예측법을 일반화선형혼합모형(GLMM)에 속한 감마회귀(gamma regression), 로그정규회귀(lognormal regression), 그리고 역가우스회귀(inverse gaussian regression)의 패널자료(panel data)에 적용시키는데 있다. 이를 위해 실제 자동차 보험회사의 손해액 자료를 사용하였고, 최량예측량과 최량상대오차예측량을 각각 적용-비교해 보았다.

Developing of Construction Project Risk Analysis Framework by Claim Payout and its Application

  • Kim, Ji-Myong;Park, Young Jun;Kim, Young-Jae;Yu, YeongJin
    • 국제학술발표논문집
    • /
    • The 6th International Conference on Construction Engineering and Project Management
    • /
    • pp.192-194
    • /
    • 2015
  • The growing size and complex process in construction project recently leads to increase risk and the losses as well. Even though researchers have identified the major risk indicators, there is lack of comprehensive and quantitative research for identifying the relationship between the risk indicators and economic losses associated with construction projects. To address this shortage of research, this study defines risk indicators and create a framework to assess the influence of economic losses from the indicators. An insurance company's claim payout record was accepted as the dependent variable to reflect the real economic losses. Based on the claims, we categorized the causes and results of accidents. To establish framework, built environment vulnerability indicators and geographical vulnerability indicators were employed as the risk indicators. A Pearson correlation analysis was adopted to validate the relationship with loss ratio and risk indicators. Consequently, this framework and its results may offer significant references for under writers of insurance companies and loss prevention activities.

  • PDF

건강보험 청구 데이터를 활용한 머신러닝 기반유방암 환자의 생존 여부 예측 (The Prediction of Survival of Breast Cancer Patients Based on Machine Learning Using Health Insurance Claim Data)

  • 이덕규;변경근;이형동;신선희
    • 한국산업정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.1-9
    • /
    • 2023
  • 유방암 관련 기존 AI 연구는 보조적인 진단 예측이나 임상적 요인에 따른 진료 결과를 예측하는 주제가 많았다. 또한 연구기관의 코호트 자료나 일부 환자 자료를 이용하는 경우가 대부분이었다. 본 논문에서는 건강보험심사평가원이 보유하고 있는 전 국민 유방암 환자의 전수 데이터를 활용하여 유방암 환자의 40~50대와 다른 연령대 간의 생존 여부 예측과 생존 여부에 미치는 요인의 차이점을 분석했다. 그 결과, 환자들의 생존 여부 예측 정밀도는 40~50대가 평균 0.93으로 60~80대 0.86 보다 높았으며, 요인에 있어서도 40~50대는 치료횟수(46%)가, 60~80대는 나이(32%)의 변수 중요도가 제일 높았다. 기존 연구와 성능 비교 결과, 평균 정밀도가 0.90으로 기존 논문의 정밀도 0.81보다 높았다. 적용 알고리즘별 성능 비교 결과, 의사결정나무(Decision Tree), 랜덤포레스트(Random Forest) 및 그래디언트부스팅(Gradient Boosting)의 전체 평균 정밀도는 0.90, 재현율은 1.0으로 연령대 그룹 내에서 동일하였으며, 다층퍼셉트론(Multi-Layer Perceptron)의 정밀도는 0.89, 재현율은 1.0 이었다. 심평원의 전 국민 심사청구 빅데이터 가치 활용을 제고하기 위해 비전문가용 머신러닝 자동화(Auto ML) 도구를 사용한 더 많은 연구가 진행되기를 바란다.

건설공사보험 사례를 활용한 건설현장 인명사고 정량화 모델 개발 (Quantification Model Development of Human Accidents based on the Insurance Claim Payout on Construction Site)

  • 하선근;김태희;손기영;김지명
    • 한국건축시공학회지
    • /
    • 제18권2호
    • /
    • pp.151-159
    • /
    • 2018
  • 한국 건설업의 재해율은 매년 증가하고 있는 추세이며 다른 산업에 비해 월등히 높다. 이는 국가차원에서 재해예방을 위해 수행하는 안전활동들이 건설산업의 재해율 감소에는 효과를 보이지 못한다는 것을 의미한다. 이러한 문제점을 해결하기 위해서는, 인명사고 예측모델에 대한 프레임이 구축되어야 하며, 인명사고 발생형태에 대한 정량화 연구가 필요하다. 이에, 본 연구는 인명사고 발생형태의 불확실성을 정량화하고 몬테카를로 시뮬레이션을 통해 다양한 환경에서 어떻게 변화하는지 예측하고자 한다. 이를 위하여 첫째, 선행연구 고찰을 통해 인명사고 발생형태를 정의한다. 둘째, 14년 간 국내 건설현장에서 발생한 인명사고 및 보상지급액 데이터를 수집한다. 셋째, 발생형태별 특성을 파악하기 위해 수집된 데이터를 토대로 기술통계분석을 실시한다. 넷째, 인명사고 발생형태를 정량적으로 분석하기 위하여 발생형태별 사고 발생 확률과 보상지급액의 모수를 추정한다. 마지막으로 추정된 모집단을 토대로 몬테카를로 시뮬레이션을 실시하여 인명사고 발생형태별 분포 특징을 분석한다. 본 연구의 결과는 향후 건설현장 안전관리 체크리스트 개발 및 인명사고 예측 모델 개발의 참고 자료로 활용될 것으로 기대된다.

우리나라 당뇨병의 역학적 규모와 당뇨병 관리현황 파악을 위한 표본설계의 평가 (An Evaluation of Sampling Design for Estimating an Epidemiologic Volume of Diabetes and for Assessing Present Status of Its Control in Korea)

  • 이지성;김재용;백세현;박이병;이준영
    • Journal of Preventive Medicine and Public Health
    • /
    • 제42권2호
    • /
    • pp.135-142
    • /
    • 2009
  • Objectives : An appropriate sampling strategy for estimating an epidemiologic volume of diabetes has been evaluated through a simulation. Methods : We analyzed about 250 million medical insurance claims data submitted to the Health Insurance Review & Assessment Service with diabetes as principal or subsequent diagnoses, more than or equal to once per year, in 2003. The database was re-constructed to a 'patient-hospital profile' that had 3,676,164 cases, and then to a 'patient profile' that consisted of 2,412,082 observations. The patient profile data was then used to test the validity of a proposed sampling frame and methods of sampling to develop diabetic-related epidemiologic indices. Results : Simulation study showed that a use of a stratified two-stage cluster sampling design with a total sample size of 4,000 will provide an estimate of 57.04%(95% prediction range, 49.83 - 64.24%) for a treatment prescription rate of diabetes. The proposed sampling design consists, at first, stratifying the area of the nation into "metropolitan/city/county" and the types of hospital into "tertiary/secondary/primary/clinic" with a proportion of 5:10:10:75. Hospitals were then randomly selected within the strata as a primary sampling unit, followed by a random selection of patients within the hospitals as a secondly sampling unit. The difference between the estimate and the parameter value was projected to be less than 0.3%. Conclusions : The sampling scheme proposed will be applied to a subsequent nationwide field survey not only for estimating the epidemiologic volume of diabetes but also for assessing the present status of nationwide diabetes control.

건설공사보험 사례를 활용한 건설현장 인명사고 정량화 모델 개발 기초연구 (A Basic Study on Quantification Model Development of Human Accidents based on the Insurance Claim Payout of Construction Site)

  • 하선근;김태희;김지명;장준호;손기영
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2017년도 추계 학술논문 발표대회
    • /
    • pp.195-196
    • /
    • 2017
  • The number of human accidents in the construction industry is increasing every year, and it constitute the highest percentage among industry. This means that activities performed to prevent safety accidents in the country are not efficient to reduce the rate of accidents in the construction industry. In order to solve this issue, research has been conducted from various perspectives. But, research regarding to quantification model of human accidents is insufficient. the objective of this study is to conduct a basic study on quantification model development of human accidents. To achieve the objective, first, Cause of accident is defined the through literature review. Second, a basic statistic analysis is conducted to determine the characteristics of the accident causes. Third, the analysis is conducted after dividing into four categories : accumulate rate, season, total construction cost, and location. In the future, this study can be used as a reference for developing the safety management checklist for safety management in construction site and development of prediction models of human accident.

  • PDF