• Title/Summary/Keyword: Rating prediction

Search Result 198, Processing Time 0.02 seconds

Generating and Validating Synthetic Training Data for Predicting Bankruptcy of Individual Businesses

  • Hong, Dong-Suk;Baik, Cheol
    • Journal of information and communication convergence engineering
    • /
    • 제19권4호
    • /
    • pp.228-233
    • /
    • 2021
  • In this study, we analyze the credit information (loan, delinquency information, etc.) of individual business owners to generate voluminous training data to establish a bankruptcy prediction model through a partial synthetic training technique. Furthermore, we evaluate the prediction performance of the newly generated data compared to the actual data. When using conditional tabular generative adversarial networks (CTGAN)-based training data generated by the experimental results (a logistic regression task), the recall is improved by 1.75 times compared to that obtained using the actual data. The probability that both the actual and generated data are sampled over an identical distribution is verified to be much higher than 80%. Providing artificial intelligence training data through data synthesis in the fields of credit rating and default risk prediction of individual businesses, which have not been relatively active in research, promotes further in-depth research efforts focused on utilizing such methods.

현장관찰법과 자기보고법에 기초한 VTS 관제사의 상황인식 분석 (Analysis of VTS Operators' Situational Awareness Based on In-Field Observation and Subjective Rating Methods)

  • 이재식;김정호;장은규
    • 한국항해항만학회지
    • /
    • 제40권6호
    • /
    • pp.375-384
    • /
    • 2016
  • 본 연구는 해상교통관제사(이하 'VTS 관제사')의 해상교통관제(Vessel Traffic Service: 이하 'VTS') 수행 속성을 상황인식(situation awareness: 이하 'SA')과 관련된 세부 과제들의 수행 빈도와 SA 역량에 대한 주관적 평가의 측면에서 살펴보기 위해 실시되었다. SA 세부 과제들에 대한 수행 빈도 자료는 3개 VTS 센터의 VTS 관제사가 보인 VTS 수행을 직접 관찰하여 수집하였고, SA 역량에 대한 주관적 평가 자료는 18개 VTS 센터에서 근무하는 VTS 관제사를 대상으로 설문조사법을 통해 수집하였다. 수행 빈도 자료는 SA의 세 수준과 각 세부 과제에 따라 비교하였고, 주관적 평가 점수에 대해서는 VTS 관제사의 성별과 근무경력을 추가적으로 고려하여 분석하였다. 본 연구의 결과를 요약하면 다음과 같다. 첫째, VTS 관제사는 SA 수준 중 정보지각에 해당하는 과제를 가장 높은 비율로 수행하였고, 이어서 정보통합과 예측에 해당하는 과제들을 각각 유사한 수준으로 수행하는 것이 관찰되었다. 둘째, VTS 관제사는 정보를 획득하거나 통합하는 역량에 비해 미래 상황을 예측하는 역량을 상대적으로 더 낮게 평가하였다. 셋째, 성별 차이를 비교한 결과, 남성 VTS 관제사는 여성에 비해 더 높은 수준으로 자신의 SA 역량을 평가하였다. 넷째, 성별로 근무경력에 따른 주관적 평가 차이를 비교한 결과, 남성의 경우 근무경력이 15년 이상인 VTS 관제사는 5년 미만의 VTS 관제사에 비해 SA의 모든 수준에 걸쳐 상대적으로 더 높은 주관적 평가를 보였으나, 여성의 경우는 근무경력에 따른 주관적 평가에서의 차이가 관찰되지 않았다. 이러한 결과는 VTS 관제사의 SA 과제 수행 빈도와 SA에 대한 주관적 평가가 SA 수준과 개인차 변인에 따라 달라질 수 있음을 시사한다.

The Method for Generating Recommended Candidates through Prediction of Multi-Criteria Ratings Using CNN-BiLSTM

  • Kim, Jinah;Park, Junhee;Shin, Minchan;Lee, Jihoon;Moon, Nammee
    • Journal of Information Processing Systems
    • /
    • 제17권4호
    • /
    • pp.707-720
    • /
    • 2021
  • To improve the accuracy of the recommendation system, multi-criteria recommendation systems have been widely researched. However, it is highly complicated to extract the preferred features of users and items from the data. To this end, subjective indicators, which indicate a user's priorities for personalized recommendations, should be derived. In this study, we propose a method for generating recommendation candidates by predicting multi-criteria ratings from reviews and using them to derive user priorities. Using a deep learning model based on convolutional neural network (CNN) and bidirectional long short-term memory (BiLSTM), multi-criteria prediction ratings were derived from reviews. These ratings were then aggregated to form a linear regression model to predict the overall rating. This model not only predicts the overall rating but also uses the training weights from the layers of the model as the user's priority. Based on this, a new score matrix for recommendation is derived by calculating the similarity between the user and the item according to the criteria, and an item suitable for the user is proposed. The experiment was conducted by collecting the actual "TripAdvisor" dataset. For performance evaluation, the proposed method was compared with a general recommendation system based on singular value decomposition. The results of the experiments demonstrate the high performance of the proposed method.

Ergonomic Evaluation of Workload in Imbalanced Lower Limbs Postures

  • Kim, Eun-Sik;Yoon, Hoon-Yong
    • 대한인간공학회지
    • /
    • 제30권5호
    • /
    • pp.671-681
    • /
    • 2011
  • Objective: The purpose of this study is to compare the workload level at each lower limbs posture and suggest the ergonomic workstation guideline for working period by evaluating the imbalanced lower limbs postures from the physiological and psychophysical points of view. Background: Many workers like welders are working in various imbalanced lower limbs postures either due to the narrow working conditions or other environmental conditions. Method: Ten male subjects participated in this experiment. Subjects were asked to maintain 3 different lower limbs postures(standing, squatting and bending) with 3 different working conditions(balanced floor with no scaffold, imbalanced floor with 10cm height of scaffold, and imbalanced floor with 20cm height of scaffold). EMG data for the 4 muscle groups(Retus Femoris, Vastus Lateralis, Tibialis Anterior, Gastrocnemius) from each lower limbs posture were collected for 20 seconds every 2 minutes during the 8 minutes sustaining task. Subjects were also asked to report their discomfort ratings of body parts such as waist, upper legs, lower legs, and ankle. Results: The ANOVA results showed that the EMG root mean square(RMS) values and the discomfort ratings(CR-10 Rating Scale) were significantly affected by lower limbs postures and working time(p<0.05). The correlation was analyzed between the EMG data and the discomfort ratings. Also, prediction models for the discomfort rating for each posture were developed using physical condition, working time, and scaffold height. Conclusion: We strongly recommend that one should not work more than 6 minutes in a standing or squatting postures and should not work more than 4 minutes in a bending posture. Application: The results of this study could be used to design and assess working environments and methods. Furthermore, these results could be used to suggest ergonomic guidelines for the lower limbs postures such as squatting and bending in the working fields in order to prevent fatigue and pain in the lower limbs body.

A Study on Predicting Credit Ratings of Korean Companies using TabNet

  • Hyeokjin Choi;Gyeongho Jung;Hyunchul Ahn
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권5호
    • /
    • pp.11-20
    • /
    • 2024
  • 최근 IT 기술의 발전과 더불어 금융 시장에서의 불확실성이 증대되는 상황에서 기업 신용등급 평가의 중요성을 인식하고, 이를 개선하기 위한 새로운 접근 방식으로 딥러닝 모델인 TabNet을 제안한다. 이에 본 연구에서는 TabNet을 활용하여 기업 신용등급을 예측하고, 이의 예측 성능을 기존 머신러닝 방법론과 상세하게 비교한다. 한국의 주요 증권시장에 상장된 기업들의 재무 데이터를 기반으로 TabNet 알고리즘을 적용하여 신용등급 예측 모델을 구축하고, 다양한 머신러닝 모델과의 성능을 비교 분석하였다. 실험 결과, TabNet 모델은 Precision 0.884, F1이 0.895로 기존의 머신러닝 모델들보다 우수한 성능을 보였으며, 고위험 기업을 저위험 기업으로 잘못 분류하는 경우가 다른 머신러닝 모델보다 적어 TabNet의 우수성을 확인하였다. 이는 TabNet이 기업 신용등급 예측에 있어 효과적인 도구로 활용될 수 있으며, 금융기관의 신용 위험 관리 및 의사 결정 과정을 지원할 수 있을 것으로 기대한다.

딥러닝 모형을 이용한 팔당대교 지점에서의 유량 예측 (Flow rate prediction at Paldang Bridge using deep learning models)

  • 성연정;박기두;정영훈
    • 한국수자원학회논문집
    • /
    • 제55권8호
    • /
    • pp.565-575
    • /
    • 2022
  • 최근의 수자원공학 분야는 4차산업혁명과 더불어 비약적으로 발전된 딥러닝 기술을 활용한 시계열 수위 및 유량의 예측에 대한 관심이 높아지고 있다. 또한 시계열 자료의 예측이 가능한 LSTM 모형과 GRU 모형을 활용하여 수위 및 유량 예측을 수행하고 있지만 시간 변동성이 매우 큰 하천에서의 유량 예측 정확도는 수위 예측 정확도에 비해 낮게 예측되는 경향이 있다. 본 연구에서는 유량변동이 크고 하구에서의 조석의 영향이 거의 없는 한강의 팔당대교 관측소를 선택하였다. 또한, LSTM 모형과 GRU 모형의 입력 및 예측 자료로 활용될 유량변동이 큰 시계열 자료를 선택하였고 총 자료의 길이는 비교적 짧은 2년 7개월의 수위 자료 및 유량 자료를 수집하였다. 시간변동성이 큰 시계열 수위를 2개의 모형에서 학습할 경우, 2개의 모형 모두에서 예측되는 수위 결과는 관측 수위와 비교하여 적정한 정확도가 확보되었으나 변동성이 큰 유량 자료를 2개의 모형에서 직접 학습시킬 경우, 예측되는 유량 자료의 정확도는 악화되었다. 따라서, 본 연구에서는 급변하는 유량을 정확히 예측하기 위하여 2개 모형으로 예측된 수위 자료를 수위-유량관계곡선의 입력자료로 활용하여 유량의 예측 정확도를 크게 향상시킬 수 있었다. 마지막으로 본 연구성과는 수문자료의 별도 가공없이 관측 길이가 상대적으로 충분히 길지 않고 유출량이 급변하는 도시하천에서의 홍수예경보 자료로 충분히 활용할 수 있을 것으로 기대된다.

심층신경망을 활용한 데이터 기반 ESG 성과 예측에 관한 연구: 기업 재무 정보를 중심으로 (Predicting Future ESG Performance using Past Corporate Financial Information: Application of Deep Neural Networks)

  • 김민승;문승환;최성원
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.85-100
    • /
    • 2023
  • 최근 기업의 지속가능경영 역량으로 대변되는 기업 ESG 성과(environmental, social, and corporate governance)가 투자의사 결정에 주요 요인 중 하나로 부각되고 있다. 전통적 ESG 성과 평가 프로세스는 평가기관마다의 고유 기준에 따라 질적 정성적 방식으로 수행되어 그 평가 소요 시간 및 비용이 큰 데 비해 투자의사 결정 시 신뢰성과 예측 가능성 및 적시성에 제약이 존재한다. 이에 본 연구에서는 정량화되고 공개된 기업 재무 정보를 활용하여 머신러닝을 통한 자동화된 기업 ESG 평가 예측을 시도하였다. 심층신경망 기법을 활용해 2019년부터 2021년까지 3년간 한국ESG기준원에서 제공한 1,780건의 ESG 평가에 대하여 총 12종(21,360건)의 시장 공개 재무 정보를 기반으로 예측 모형을 구축한 결과, 제안된 심층신경망 모형은 약 86%의 분류성능을 보여 여타 비교모형 대비 크게 높은 정확도를 나타냈다. 본 연구는 정량적이고 공개된 과거 기업 재무 정보만으로도 자동화된 프로세스를 통해 비교적 정확한 미래 ESG 평가 예측을 달성할 수 있었다는 점에 의의가 크다. 특히 기업 ESG 관련 정보 접근이 상대적으로 불리한 일반 투자자들의 입장에서 볼 때 낮은 비용과 적은 시간 투자로도 기업 ESG 성과 평가에 대한 예측 가능성과 적시성을 향상 시킬 수 있다는 점에 실용적 함의가 있다. 또한 본 연구는 향후 추가적인 국내외 데이터 수집 및 모형 고도화를 통해 기업 ESG 성과 예측 분야에서의 확장이 기대된다.

Prediction of total sediment load: A case study of Wadi Arbaat in eastern Sudan

  • Aldrees, Ali;Bakheit, Abubakr Taha;Assilzadeh, Hamid
    • Smart Structures and Systems
    • /
    • 제26권6호
    • /
    • pp.781-796
    • /
    • 2020
  • Prediction of total sediment load is essential in an extensive range of problems such as the design of the dead volume of dams, design of stable channels, sediment transport in the rivers, calculation of bridge piers degradation, prediction of sand and gravel mining effects on river-bed equilibrium, determination of the environmental impacts and dredging necessities. This paper is aimed to investigate and predict the total sediment load of the Wadi Arbaat in Eastern Sudan. The study was estimated the sediment load by separate total sediment load into bedload and Suspended Load (SL), independently. Although the sediment records are not sufficient to construct the discharge-sediment yield relationship and Sediment Rating Curve (SRC), the total sediment loads were predicted based on the discharge and Suspended Sediment Concentration (SSC). The turbidity data NTU in water quality has been used for prediction of the SSC in the estimation of suspended Sediment Yield (SY) transport of Wadi Arbaat. The sediment curves can be used for the estimation of the suspended SYs from the watershed area. The amount of information available for Khor Arbaat case study on sediment is poor data. However, the total sediment load is essential for the optimal control of the sediment transport on Khor Arbaat sediment and the protection of the dams on the upper gate area. The results show that the proposed model is found to be considered adequate to predict the total sediment load.

신경망 이론을 이용한 농업 구조물의 안전도 평가 및 관리계획 (Safety Assessment and Management Planning of Agricultural Facilities using Neural Network)

  • 김민종;이정재;정남수
    • 한국농공학회:학술대회논문집
    • /
    • 한국농공학회 2001년도 학술발표회 발표논문집
    • /
    • pp.156-161
    • /
    • 2001
  • Currently, agricultural facilities are evaluated using either basic inspections or detailed analysis. However, conventional analyses as well as methods based on fuzzy logic and rule of thumb have not been very successful in providing a clear relationship between rating and real state of agricultural facilities, because they can't provide exactly acceptable reliability of degraded structures with manager or supervisor. Therefore, in this stage, we must define probabilistic variables for representing degradation of structures being given damages during a survival time. This paper describes the application of neural network system in developing the relation between subjective ratings and parameters of agricultural reservoir as well as that between subjective and analytical ratings. It is shown that neural networks can be trained and used successfully in estimating a rating based on several parameters. The specific application problem for agricultural reservoir in the rural area of Korea is presented and database is constructed to maintain training data set, the information of inspection and facilities. This study showed that a successful training of a neural network could be useful, especially if the input data set for target problem contains parameters with a diverse combination of inter-correlation coefficients. And the networks had a prediction rating of about $^{\ast}^{\ast}^{\ast}%$. The neural network system is expected to show high performance fairly in estimate than statistical method to use equation that is consisted of very lowly interrelated variables.

  • PDF

유전 알고리듬 기반 집단분류기법의 개발과 성과평가 : 채권등급 평가를 중심으로 (Design and Performance Measurement of a Genetic Algorithm-based Group Classification Method : The Case of Bond Rating)

  • 민재형;정철우
    • 한국경영과학회지
    • /
    • 제32권1호
    • /
    • pp.61-75
    • /
    • 2007
  • The purpose of this paper is to develop a new group classification method based on genetic algorithm and to com-pare its prediction performance with those of existing methods in the area of bond rating. To serve this purpose, we conduct various experiments with pilot and general models. Specifically, we first conduct experiments employing two pilot models : the one searching for the cluster center of each group and the other one searching for both the cluster center and the attribute weights in order to maximize classification accuracy. The results from the pilot experiments show that the performance of the latter in terms of classification accuracy ratio is higher than that of the former which provides the rationale of searching for both the cluster center of each group and the attribute weights to improve classification accuracy. With this lesson in mind, we design two generalized models employing genetic algorithm : the one is to maximize the classification accuracy and the other one is to minimize the total misclassification cost. We compare the performance of these two models with those of existing statistical and artificial intelligent models such as MDA, ANN, and Decision Tree, and conclude that the genetic algorithm-based group classification method that we propose in this paper significantly outperforms the other methods in respect of classification accuracy ratio as well as misclassification cost.