• 제목/요약/키워드: TabNet

검색결과 10건 처리시간 0.029초

A Study on Predicting Credit Ratings of Korean Companies using TabNet

  • Hyeokjin Choi;Gyeongho Jung;Hyunchul Ahn
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권5호
    • /
    • pp.11-20
    • /
    • 2024
  • 최근 IT 기술의 발전과 더불어 금융 시장에서의 불확실성이 증대되는 상황에서 기업 신용등급 평가의 중요성을 인식하고, 이를 개선하기 위한 새로운 접근 방식으로 딥러닝 모델인 TabNet을 제안한다. 이에 본 연구에서는 TabNet을 활용하여 기업 신용등급을 예측하고, 이의 예측 성능을 기존 머신러닝 방법론과 상세하게 비교한다. 한국의 주요 증권시장에 상장된 기업들의 재무 데이터를 기반으로 TabNet 알고리즘을 적용하여 신용등급 예측 모델을 구축하고, 다양한 머신러닝 모델과의 성능을 비교 분석하였다. 실험 결과, TabNet 모델은 Precision 0.884, F1이 0.895로 기존의 머신러닝 모델들보다 우수한 성능을 보였으며, 고위험 기업을 저위험 기업으로 잘못 분류하는 경우가 다른 머신러닝 모델보다 적어 TabNet의 우수성을 확인하였다. 이는 TabNet이 기업 신용등급 예측에 있어 효과적인 도구로 활용될 수 있으며, 금융기관의 신용 위험 관리 및 의사 결정 과정을 지원할 수 있을 것으로 기대한다.

대출 상환 예측을 위한 의사결정나무모델과 TabNet 간 성능 비교 (Performance comparison between Decision tree model and TabNet for loan repayment prediction)

  • 한수진 ;김현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.453-455
    • /
    • 2023
  • 본 연구는 은행에서 리스크 관리 자동화를 위해 고객의 대출 상환 여부 예측 모델을 제안하고자 한다. 예측 모델로 금융 데이터 같은 정형데이터에서 전통적으로 높은 성능을 보인 의사결정나무기반 모델 LightGBM, CatBoost, XGB 와 최근 제안된 정형데이터에서 사용할 수 있는 설명 가능한 딥러닝 기반 모델 TabNet 간의 성능 비교를 진행한다. 다만, 대출 상환 여부 데이터는 불균형 클래스 데이터로 구성되어있어 샘플링을 진행한다. SMOTE, Random Under Sampling, 혼합 방식을 비교해 가장 높은 성능의 샘플링 기법을 제안한다. 대출 상환 여부 예측 결과 TabNet 모델이 의사결정나무모델들보다 좋은 성능을 보여 정형데이터에서 의사결정나무 기반 모델을 딥러닝 모델이 대체 할 수 있는 가능성을 확인했다.

A TabNet - Based System for Water Quality Prediction in Aquaculture

  • Nguyen, Trong–Nghia;Kim, Soo Hyung;Do, Nhu-Tai;Hong, Thai-Thi Ngoc;Yang, Hyung Jeong;Lee, Guee Sang
    • 스마트미디어저널
    • /
    • 제11권2호
    • /
    • pp.39-52
    • /
    • 2022
  • In the context of the evolution of automation and intelligence, deep learning and machine learning algorithms have been widely applied in aquaculture in recent years, providing new opportunities for the digital realization of aquaculture. Especially, water quality management deserves attention thanks to its importance to food organisms. In this study, we proposed an end-to-end deep learning-based TabNet model for water quality prediction. From major indexes of water quality assessment, we applied novel deep learning techniques and machine learning algorithms in innovative fish aquaculture to predict the number of water cells counting. Furthermore, the application of deep learning in aquaculture is outlined, and the obtained results are analyzed. The experiment on in-house data showed an optimistic impact on the application of artificial intelligence in aquaculture, helping to reduce costs and time and increase efficiency in the farming process.

Enhancing Malware Detection with TabNetClassifier: A SMOTE-based Approach

  • Rahimov Faridun;Eul Gyu Im
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.294-297
    • /
    • 2024
  • Malware detection has become increasingly critical with the proliferation of end devices. To improve detection rates and efficiency, the research focus in malware detection has shifted towards leveraging machine learning and deep learning approaches. This shift is particularly relevant in the context of the widespread adoption of end devices, including smartphones, Internet of Things devices, and personal computers. Machine learning techniques are employed to train models on extensive datasets and evaluate various features, while deep learning algorithms have been extensively utilized to achieve these objectives. In this research, we introduce TabNet, a novel architecture designed for deep learning with tabular data, specifically tailored for enhancing malware detection techniques. Furthermore, the Synthetic Minority Over-Sampling Technique is utilized in this work to counteract the challenges posed by imbalanced datasets in machine learning. SMOTE efficiently balances class distributions, thereby improving model performance and classification accuracy. Our study demonstrates that SMOTE can effectively neutralize class imbalance bias, resulting in more dependable and precise machine learning models.

배터리 리드탭 압흔 오류 검출의 딥러닝 기법 적용 (Application of deep learning technique for battery lead tab welding error detection)

  • 김윤호;김병만
    • 한국산업정보학회논문지
    • /
    • 제27권2호
    • /
    • pp.71-82
    • /
    • 2022
  • 자동차용 배터리 제조공정 가운데 하나인 Tab Welding 공정에서 생산된 제품의 샘플링 인장검사를 대체하기 위해 현재 비전검사기를 개발하여 사용하고 있다. 그러나, 비전검사는 검사 위치 오차 문제와 이를 개선하기 위해 발생하는 비용 문제를 가지고 있다. 이러한 문제점들을 해결하기 위해 최근 딥러닝 기술을 적용하는 사례들이 발생하고 있다. 본 논문도 그런 사례 중 하나로 기존 제품 검사에 딥러닝 기술 중 하나인 Faster R-CNN을 적용하여 그 유용성을 파악하고자 하였다. 기존 비전검사기를 통해 획득한 이미지들을 학습 데이터로 사용하여 Faster R-CNN ResNet101 V1 1024x1024 모델을 사용하여 학습하였다. 검사 기준인 미검률 0%, 과검률 10%의 기준으로 기존 비전검사와 Faster R-CNN 검사결과를 비교 분석하였다. 미검출률은 기존 비전검사에서 34.5%, Faster R-CNN 검사에서 0%였다. 과검출률은 기존 비전검사에서 100%, Faster R-CNN에서 6.9%였다. 결론적으로 자동차용 배터리 리드탭 암흔 오류 검출에 딥러닝 기술이 매우 유용함을 확인할 수 있었다.

고차원 매핑기법과 딥러닝 네트워크를 통한 정형데이터의 분류 (Classification of Tabular Data using High-Dimensional Mapping and Deep Learning Network)

  • 김경택;장원두
    • 사물인터넷융복합논문지
    • /
    • 제9권6호
    • /
    • pp.119-124
    • /
    • 2023
  • 최근 딥러닝은 다양한 분야에서 전통적인 기계학습에 비해 월등히 높은 성능을 보이고 있으며, 패턴인식을 위한 보편적인 방법으로 자리 잡아 가고 있다. 하지만, 이에 비해 정형데이터를 사용하는 분류 문제에서는 여전히 머신러닝 기법이 주류를 이루고 있다. 본 논문에서는 정형데이터를 고차원 텐서로 변환하는 네트워크 모듈을 제안하며, 이 모듈을 보편적인 딥러닝 네트워크와 함께 구성하여 정형데이터의 분류 문제에 적용하였다. 제안된 방법은 4종의 데이터셋을 활용하여 학습 및 검증되었으며, 제안된 방법은 90.22%의 평균 정확도를 달성하여, 최신 딥러닝 모델인 TabNet에 비해 2.55%p 높은 정확도를 보였다. 제안된 방법은 컴퓨터 비전 분야에서 높은 성능을 보이는 다양한 네트워크 구조를 정형데이터에 활용할 수 있다는 점에서 의미가 있다.

딥러닝 기반의 표 경계선 히트맵 회귀를 이용한 표의 구조 인식 (Table Structure Recognition using Borderline Heatmap Regression)

  • 이은지;박재우;구형일;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.84-87
    • /
    • 2021
  • 본 논문에서는 딥러닝을 기반으로 문서영상에서 표 안의 셀 경계선을 히트맵 회귀(heatmap regression)로 추정함으로써 표의 구조를 인식하는 방법을 제안한다. 표는 기본적으로 행과 열로 이루어져 있기 때문에, 제안하는 방법에서는 먼저 1 차원 벡터 형태로 세로/가로 방향의 행/열 경계선 위치를 찾고, 이에 병합된 셀을 처리하기 위해 경계선이 그어져야 할 위치를 2 차원으로 추정한 결과를 적용하여 온전한 표의 경계선을 구한다. 이러한 구조를 통해 제안하는 방법은 표의 행과 열에 대한 정보를 효과적으로 이용함과 동시에, 복잡한 후처리 없이 병합된 셀을 처리할 수 있는 이점을 보인다. 실험은 1 차원의 행/열 경계선 위치를 반영하는 두 가지 방식에 대해 PubTabNet[11]에 대해 진행하여 결과를 보였다.

  • PDF

준지도 학습을 활용한 사용자 기반 소형 어선 충돌 경보 분류모델에대한 연구 (A Study on the User-Based Small Fishing Boat Collision Alarm Classification Model Using Semi-supervised Learning)

  • 석호준;심승;우정훈;조준래;정재룡;조득재;백종화
    • 한국항해항만학회지
    • /
    • 제47권6호
    • /
    • pp.358-366
    • /
    • 2023
  • 본 연구는 해양수산부의 '지능형 해상교통정보시스템' 서비스 중 '사고취약선박 모니터링 서비스'의 선박 충돌 경보를 개선하기 위한 것으로, 현재의 선박 충돌 경보는 대형 선박 위주의 데이터와 그 운항자에 기반한 설문조사 레이블을 가지고 지도 학습(SL)한 모델을 사용하고 있다. 이로 인해, 소형선박 데이터 및 운항자의 의견이 현재 충돌 지도학습 모델에 반영되지 않아, 소형선박 운항자가 느끼는 체감보다 먼 거리에서 경보가 제공되기 때문에 그 효과가 미비하다. 또한, 지도학습(SL) 방법은 레이블링 된 다수의 데이터가 필요하지만, 레이블링 과정에서 많은 자원과 시간이 필요하다. 본 논문은 이러한 한계를 극복하기 위해 준지도학습(SSL)의 알고리즘인 Label Propagation과 TabNet을 사용하여 레이블이 결정되지 않은 데이터를 활용하여 소형선박을 위한 충돌 경보의 분류 모델을 연구하였다. 충돌 경보의 분류 모델을 활용하여 소형선박 운항자를 대상으로 실해역 시험을 수행한 결과 운항자의 만족도가 증가하는 결과를 확인하였다.

지렁이 사육상에서 지렁이 유인장치에 의한 줄지렁이(Eisenia fetida) 유인효과 (Earthworm harvesting efficiency of earthworm(Eisenia fetida) attracting trap in the vermicomposting bed)

  • 배윤환;박광일
    • 유기물자원화
    • /
    • 제13권2호
    • /
    • pp.98-106
    • /
    • 2005
  • 지렁이 사육상으로부터 지렁이를 분리, 수확할 수 있는 지렁이 유인장치를 개발하기 위해서 사육상에서의 지렁이 개체군 동태, 유인물질 및 유인틀내 철망의 mesh 크기, 덮개재질 등에 따른 지렁이 유인효율을 조사하였다. 지렁이 사육상에서 줄지렁이의 최고밀도는 약 $5kg/m^2$이었으며 최고밀도 도달한 이후에는 $4.4{\sim}5.0kg/m^2$의 밀도를 유지하였다. 유인틀내 철망의 mesh 크기는 7mm정도가 적정하였으며 유인틀 덮개는 표면은 매끄럽고 수분을 잘 머금을 수 있는 재질이 적당하였다. 유인틀내에 유인제를 사용하는 경우가 사용하지 않는 경우보다 유인효과가 현저히 높았으며, 유인틀내 유인제량이 많을수록, 유인틀 설치 기간이 길어질수록 지렁이 유인량이 많아졌다. 유인제로서는 분쇄된 배껍질이 제지슬러지보다 우수하였는데 이는 유인제내 당도의 차이에 기인하는 것으로 판단된다. 그러나 현장에서 사용할 수 있을 만큼 충분한 량의 배껍질을 공급하기가 어려우므로 그 대용으로서 설탕물(10%)을 유인물질로 이용하는 방안이 제시될 수 있었다.

  • PDF

긴급대응 시스템을 위한 심층 해석 가능 학습 (Deep Interpretable Learning for a Rapid Response System)

  • 우엔 쫑 니아;보탄헝;고보건;이귀상;양형정;김수형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.805-807
    • /
    • 2021
  • In-hospital cardiac arrest is a significant problem for medical systems. Although the traditional early warning systems have been widely applied, they still contain many drawbacks, such as the high false warning rate and low sensitivity. This paper proposed a strategy that involves a deep learning approach based on a novel interpretable deep tabular data learning architecture, named TabNet, for the Rapid Response System. This study has been processed and validated on a dataset collected from two hospitals of Chonnam National University, Korea, in over 10 years. The learning metrics used for the experiment are the area under the receiver operating characteristic curve score (AUROC) and the area under the precision-recall curve score (AUPRC). The experiment on a large real-time dataset shows that our method improves compared to other machine learning-based approaches.