• 제목/요약/키워드: Semi-Supervised Learning(SSL)

검색결과 13건 처리시간 0.018초

딥러닝 기반 분류 모델의 준 지도 학습 기법 분석 (The Analysis of Semi-supervised Learning Technique of Deep Learning-based Classification Model)

  • 박재현;조성인
    • 방송공학회논문지
    • /
    • 제26권1호
    • /
    • pp.79-87
    • /
    • 2021
  • 본 논문에서는 소량의 레이블 데이터로 딥러닝 기반 분류 모델을 훈련할 때 적용되는 준 지도 학습 기법 (semi-supervised learning: SSL)에 대해서 분석한다. 기존의 준 지도 학습 기법은 크게 일관성 정규화 (consistency regularization), 엔트로피 기반 (entropybased), 의사 레이블링 (pseudo labeling)으로 구분할 수 있다. 우선, 각 준 지도 학습 기법의 알고리즘에 대해서 서술한다. 실험에서는 준 지도학습 기법을 레이블 데이터의 수를 변화시키면서 훈련 후 분류 정확도를 평가한다. 최종적으로 실험 결과를 바탕으로 기존 준 지도 학습 기법의 한계에 대해서 서술하고, 분류 성능을 향상하기 위한 연구 방향을 제시한다.

준지도학습 기반의 P2P 대출 부도 위험 예측에 대한 연구 (Semi-Supervised Learning to Predict Default Risk for P2P Lending)

  • 김현정
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.185-192
    • /
    • 2022
  • 본 연구는 P2P(Peer-to-Peer) 대출의 부도위험 예측을 위하여 준지도학습(SSL) 기반의 모델을 개발하고자 한다. 검증된 성능에도 불구하고 지도학습(SL) 방법은 완전 지불 또는 채무불이행과 같이 레이블이 결정된 다수의 데이터가 필요한데 충분한 수의 레이블 데이터를 수집하려면 많은 자원과 시간이 필요하다. P2P 플랫폼이 급성장하면서 대출 건수도 매해 급증하였고, 레이블이 없는 데이터도 지속적으로 증가하고 있다. 본 연구는 P2P 대출 플랫폼인 LendingClub에서 수집한 데이터를 사용하였다. P2P 대출 중 레이블이 결정된 대출에서 추출한 정보뿐만 아니라 레이블이 결정되지 않은 대출에서 추출한 정보도 사용하여 부도 위험을 예측하는 SSL 모델을 개발하여 연구를 수행한 결과, 적은 수의 레이블이 결정된 데이터를 사용함에도 불구하고 SSL 방법으로 구축된 모델이 많은 수의 레이블이 결정된 데이터를 사용하여 학습시킨 SL 방법으로 구축된 모델보다 부도 위험 예측성과가 향상되었다.

EER-ASSL: Combining Rollback Learning and Deep Learning for Rapid Adaptive Object Detection

  • Ahmed, Minhaz Uddin;Kim, Yeong Hyeon;Rhee, Phill Kyu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권12호
    • /
    • pp.4776-4794
    • /
    • 2020
  • We propose a rapid adaptive learning framework for streaming object detection, called EER-ASSL. The method combines the expected error reduction (EER) dependent rollback learning and the active semi-supervised learning (ASSL) for a rapid adaptive CNN detector. Most CNN object detectors are built on the assumption of static data distribution. However, images are often noisy and biased, and the data distribution is imbalanced in a real world environment. The proposed method consists of collaborative sampling and EER-ASSL. The EER-ASSL utilizes the active learning (AL) and rollback based semi-supervised learning (SSL). The AL allows us to select more informative and representative samples measuring uncertainty and diversity. The SSL divides the selected streaming image samples into the bins and each bin repeatedly transfers the discriminative knowledge of the EER and CNN models to the next bin until convergence and incorporation with the EER rollback learning algorithm is achieved. The EER models provide a rapid short-term myopic adaptation and the CNN models an incremental long-term performance improvement. EER-ASSL can overcome noisy and biased labels in varying data distribution. Extensive experiments shows that EER-ASSL obtained 70.9 mAP compared to state-of-the-art technology such as Faster RCNN, SSD300, and YOLOv2.

임계값 학습 모듈을 적용한 준지도 SAR 이미지 분류 (Semi-supervised SAR Image Classification with Threshold Learning Module)

  • 도재준;김선옥
    • 한국빅데이터학회지
    • /
    • 제8권2호
    • /
    • pp.177-187
    • /
    • 2023
  • 준지도 학습(Semi-supervised learning)은 소량의 라벨이 있는 데이터와 다량의 라벨이 없는 데이터를 사용하여 모델을 훈련하는 효과적인 방법이다. 그러나 많은 논문에서 준지도 학습시 하나의 고정된 임계값을 사용하여 각 클래스별 서로 다른 이미지들의 특징별 차이를 고려하지 않고 임의 라벨을 만든다. 본 논문에서는 합성개구 레이더(SAR) 이미지 분류 준지도 학습시 모든 클래스가 하나의 고정된 임계값을 사용하는 대신 각 클래스에 대해 서로 다른 임계값을 적용한다. 모델에 임계값 학습 모듈을 추가하여 임계값을 학습하여 클래스별로 학습되는 차이를 고려하여 클래스별로 서로 다른 임계값을 얻는다. 서로 다른 임계값을 사용한 준지도 학습기반의 SAR 이미지 분류 방법을 적용유무를 비교하여 클래스별 임계값을 사용하는 이점에 대해 고찰하였다.

A Hybrid Selection Method of Helpful Unlabeled Data Applicable for Semi-Supervised Learning Algorithm

  • Le, Thanh-Binh;Kim, Sang-Woon
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제3권4호
    • /
    • pp.234-239
    • /
    • 2014
  • This paper presents an empirical study on selecting a small amount of useful unlabeled data to improve the classification accuracy of semi-supervised learning algorithms. In particular, a hybrid method of unifying the simply recycled selection method and the incrementally-reinforced selection method was considered and evaluated empirically. The experimental results, which were obtained from well-known benchmark data sets using semi-supervised support vector machines, demonstrated that the hybrid method works better than the traditional ones in terms of the classification accuracy.

포트폴리오 최적화와 주가예측을 이용한 투자 모형 (Stock Trading Model using Portfolio Optimization and Forecasting Stock Price Movement)

  • 박강희;신현정
    • 대한산업공학회지
    • /
    • 제39권6호
    • /
    • pp.535-545
    • /
    • 2013
  • The goal of stock investment is earning high rate or return with stability. To accomplish this goal, using a portfolio that distributes stocks with high rate of return with less variability and a stock price prediction model with high accuracy is required. In this paper, three methods are suggested to require these conditions. First of all, in portfolio re-balance part, Max-Return and Min-Risk (MRMR) model is suggested to earn the largest rate of return with stability. Secondly, Entering/Leaving Rule (E/L) is suggested to upgrade portfolio when particular stock's rate of return is low. Finally, to use outstanding stock price prediction model, a model based on Semi-Supervised Learning (SSL) which was suggested in last research was applied. The suggested methods were validated and applied on stocks which are listed in KOSPI200 from January 2007 to August 2008.

Class Specific Autoencoders Enhance Sample Diversity

  • Kumar, Teerath;Park, Jinbae;Ali, Muhammad Salman;Uddin, AFM Shahab;Bae, Sung-Ho
    • 방송공학회논문지
    • /
    • 제26권7호
    • /
    • pp.844-854
    • /
    • 2021
  • Semi-supervised learning (SSL) and few-shot learning (FSL) have shown impressive performance even then the volume of labeled data is very limited. However, SSL and FSL can encounter a significant performance degradation if the diversity gap between the labeled and unlabeled data is high. To reduce this diversity gap, we propose a novel scheme that relies on an autoencoder for generating pseudo examples. Specifically, the autoencoder is trained on a specific class using the available labeled data and the decoder of the trained autoencoder is then used to generate N samples of that specific class based on N random noise, sampled from a standard normal distribution. The above process is repeated for all the classes. Consequently, the generated data reduces the diversity gap and enhances the model performance. Extensive experiments on MNIST and FashionMNIST datasets for SSL and FSL verify the effectiveness of the proposed approach in terms of classification accuracy and robustness against adversarial attacks.

준지도 학습 기반 선박충돌 예측에 대한 연구 (A Study on the Prediction of Ship Collision Based on Semi-Supervised Learning)

  • 석호준;심승;우정훈;조준래;조득재;백종화;정재룡
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2023년도 춘계학술대회
    • /
    • pp.204-205
    • /
    • 2023
  • 본 연구는 준지도학습(SSL)을 기반한 소형 어선의 충돌 경보 송출 예측 모델에 관한 연구이다. 지도학습(SL) 방법은 레이블링된 다수의 데이터가 필요하지만 레이블링 과정에서 많은 자원과 시간이 소요된다. 본 연구는 '지능형 해상교통정보 서비스'와 연계한 데이터 파이프 라인을 통해 수집된 서비스 데이터와 실해역 시험에서 수집한 데이터를 사용하였다. 실제 사용자 만족도 기반으로 레이블이 결정된 실해역 시험 데이터만 아니라 레이블이 결정되지 않은 서비스 데이터를 함께 학습시킨 결과, 모델 정확도가 향상되었다.

  • PDF

Deep learning-based post-disaster building inspection with channel-wise attention and semi-supervised learning

  • Wen Tang;Tarutal Ghosh Mondal;Rih-Teng Wu;Abhishek Subedi;Mohammad R. Jahanshahi
    • Smart Structures and Systems
    • /
    • 제31권4호
    • /
    • pp.365-381
    • /
    • 2023
  • The existing vision-based techniques for inspection and condition assessment of civil infrastructure are mostly manual and consequently time-consuming, expensive, subjective, and risky. As a viable alternative, researchers in the past resorted to deep learning-based autonomous damage detection algorithms for expedited post-disaster reconnaissance of structures. Although a number of automatic damage detection algorithms have been proposed, the scarcity of labeled training data remains a major concern. To address this issue, this study proposed a semi-supervised learning (SSL) framework based on consistency regularization and cross-supervision. Image data from post-earthquake reconnaissance, that contains cracks, spalling, and exposed rebars are used to evaluate the proposed solution. Experiments are carried out under different data partition protocols, and it is shown that the proposed SSL method can make use of unlabeled images to enhance the segmentation performance when limited amount of ground truth labels are provided. This study also proposes DeepLab-AASPP and modified versions of U-Net++ based on channel-wise attention mechanism to better segment the components and damage areas from images of reinforced concrete buildings. The channel-wise attention mechanism can effectively improve the performance of the network by dynamically scaling the feature maps so that the networks can focus on more informative feature maps in the concatenation layer. The proposed DeepLab-AASPP achieves the best performance on component segmentation and damage state segmentation tasks with mIoU scores of 0.9850 and 0.7032, respectively. For crack, spalling, and rebar segmentation tasks, modified U-Net++ obtains the best performance with Igou scores (excluding the background pixels) of 0.5449, 0.9375, and 0.5018, respectively. The proposed architectures win the second place in IC-SHM2021 competition in all five tasks of Project 2.

시계열 토지피복도 제작을 위한 준감독학습 기반의 훈련자료 자동 추출 (Automatic Extraction of Training Data Based on Semi-supervised Learning for Time-series Land-cover Mapping)

  • 곽근호;박노욱
    • 대한원격탐사학회지
    • /
    • 제38권5_1호
    • /
    • pp.461-469
    • /
    • 2022
  • 이 연구에서는 시계열 토지피복도를 제작하기 위해 분석자 개입 없이 준감독학습 기반 분류를 이용하는 새로운 훈련자료 추출 기법을 제안하였다. 준감독학습 기반 훈련자료 추출 기법은 먼저 분류 대상 영상과 유사한 토지피복 특성을 포함하는 과거 영상으로부터 획득한 초기 훈련자료를 이용하여 초기 분류를 수행한다. 이후, 분류의 불확실성 정보와 인접 화소의 분류 항목을 제약 조건으로 이용하는 준감독학습 기반 반복 분류를 이용하여 초기 분류 결과로부터 신뢰할 수 있는 훈련자료를 추출한다. 준감독학습 기반 훈련자료 추출기법의 적용 가능성은 농경지에서 unmanned aerial vehicle 영상을 이용하는 분류 실험을 통해 평가되었다. 제안한 준감독학습 기반 훈련자료 추출 기법에 의해 자동으로 추출된 새로운 훈련자료를 이용하는 것은 초기 분류 결과에서 나타난 오분류를 두드러지게 완화할 수 있었다. 특히, 인접 화소의 공간 문맥 정보를 고려함으로써 고립된 화소가 크게 감소하였다. 결과적으로, 제안 기법의 분류 정확도는 수동으로 추출한 훈련자료를 이용하는 분류 정확도와 유사하였다. 이러한 결과는 이 연구에서 제시한 준감독학습 기반 반복 분류가 시계열 토지피복도를 제작하기 위해 신뢰할 수 있는 훈련자료를 자동으로 추출하는데 효과적으로 적용될 수 있음을 나타낸다.