• Title/Summary/Keyword: learning transfer

Search Result 757, Processing Time 0.022 seconds

Burmese Sentiment Analysis Based on Transfer Learning

  • Mao, Cunli;Man, Zhibo;Yu, Zhengtao;Wu, Xia;Liang, Haoyuan
    • Journal of Information Processing Systems
    • /
    • 제18권4호
    • /
    • pp.535-548
    • /
    • 2022
  • Using a rich resource language to classify sentiments in a language with few resources is a popular subject of research in natural language processing. Burmese is a low-resource language. In light of the scarcity of labeled training data for sentiment classification in Burmese, in this study, we propose a method of transfer learning for sentiment analysis of a language that uses the feature transfer technique on sentiments in English. This method generates a cross-language word-embedding representation of Burmese vocabulary to map Burmese text to the semantic space of English text. A model to classify sentiments in English is then pre-trained using a convolutional neural network and an attention mechanism, where the network shares the model for sentiment analysis of English. The parameters of the network layer are used to learn the cross-language features of the sentiments, which are then transferred to the model to classify sentiments in Burmese. Finally, the model was tuned using the labeled Burmese data. The results of the experiments show that the proposed method can significantly improve the classification of sentiments in Burmese compared to a model trained using only a Burmese corpus.

A label-free high precision automated crack detection method based on unsupervised generative attentional networks and swin-crackformer

  • Shiqiao Meng;Lezhi Gu;Ying Zhou;Abouzar Jafari
    • Smart Structures and Systems
    • /
    • 제33권6호
    • /
    • pp.449-463
    • /
    • 2024
  • Automated crack detection is crucial for structural health monitoring and post-earthquake rapid damage detection. However, realizing high precision automatic crack detection in the absence of corresponding manual labeling presents a formidable challenge. This paper presents a novel crack segmentation transfer learning method and a novel crack segmentation model called Swin-CrackFormer. The proposed method facilitates efficient crack image style transfer through a meticulously designed data preprocessing technique, followed by the utilization of a GAN model for image style transfer. Moreover, the proposed Swin-CrackFormer combines the advantages of Transformer and convolution operations to achieve effective local and global feature extraction. To verify the effectiveness of the proposed method, this study validates the proposed method on three unlabeled crack datasets and evaluates the Swin-CrackFormer model on the METU dataset. Experimental results demonstrate that the crack transfer learning method significantly improves the crack segmentation performance on unlabeled crack datasets. Moreover, the Swin-CrackFormer model achieved the best detection result on the METU dataset, surpassing existing crack segmentation models.

CNN의 깊은 특징과 전이학습을 사용한 보행자 분류 (Pedestrian Classification using CNN's Deep Features and Transfer Learning)

  • 정소영;정민교
    • 인터넷정보학회논문지
    • /
    • 제20권4호
    • /
    • pp.91-102
    • /
    • 2019
  • 자율주행 시스템에서, 카메라에 포착된 영상을 통하여 보행자를 분류하는 기능은 보행자 안전을 위하여 매우 중요하다. 기존에는 HOG(Histogram of Oriented Gradients)나 SIFT(Scale-Invariant Feature Transform) 등으로 보행자의 특징을 추출한 후 SVM(Support Vector Machine)으로 분류하는 기술을 사용했었으나, 보행자 특징을 위와 같이 수동(handcrafted)으로 추출하는 것은 많은 한계점을 가지고 있다. 따라서 본 논문에서는 CNN(Convolutional Neural Network)의 깊은 특징(deep features)과 전이학습(transfer learning)을 사용하여 보행자를 안정적이고 효과적으로 분류하는 방법을 제시한다. 본 논문은 2가지 대표적인 전이학습 기법인 고정특징추출(fixed feature extractor) 기법과 미세조정(fine-tuning) 기법을 모두 사용하여 실험하였고, 특히 미세조정 기법에서는 3가지 다른 크기로 레이어를 전이구간과 비전이구간으로 구분한 후, 비전이구간에 속한 레이어들에 대해서만 가중치를 조정하는 설정(M-Fine: Modified Fine-tuning)을 새롭게 추가하였다. 5가지 CNN모델(VGGNet, DenseNet, Inception V3, Xception, MobileNet)과 INRIA Person데이터 세트로 실험한 결과, HOG나 SIFT 같은 수동적인 특징보다 CNN의 깊은 특징이 더 좋은 성능을 보여주었고, Xception의 정확도(임계치 = 0.5)가 99.61%로 가장 높았다. Xception과 유사한 성능을 내면서도 80% 적은 파라메터를 학습한 MobileNet이 효율성 측면에서는 가장 뛰어났다. 그리고 3가지 전이학습 기법중 미세조정 기법의 성능이 가장 우수하였고, M-Fine 기법의 성능은 미세조정 기법과 대등하거나 조금 낮았지만 고정특징추출 기법보다는 높았다.

깊은 신경망 기반의 전이학습을 이용한 사운드 이벤트 분류 (Sound event classification using deep neural network based transfer learning)

  • 임형준;김명종;김회린
    • 한국음향학회지
    • /
    • 제35권2호
    • /
    • pp.143-148
    • /
    • 2016
  • 깊은 신경망은 데이터의 특성을 효과적으로 나타낼 수 있는 방법으로 최근 많은 응용 분야에서 활용되고 있다. 하지만, 제한적인 양의 데이터베이스는 깊은 신경망을 훈련하는 과정에서 과적합 문제를 야기할 수 있다. 본 논문에서는 풍부한 양의 음성 혹은 음악 데이터를 이용한 전이학습을 통해 제한적인 양의 사운드 이벤트에 대한 깊은 신경망을 효과적으로 훈련하는 방법을 제안한다. 일련의 실험을 통해 제안하는 방법이 적은 양의 사운드 이벤트 데이터만으로 훈련된 깊은 신경망에 비해 현저한 성능 향상이 있음을 확인하였다.

구글 티처블머신을 활용한 정신과적 응급 대상자의 병실 안전 모니터링 프로그램 개발 (Development of Safety Monitoring Program for Psychiatric Emergency Using Google Teachable Machine)

  • 이은민;김태훈
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.613-618
    • /
    • 2023
  • 본 논문에서는 실시간으로 촬영된 화면을 통해 격리실에 입원한 대상자가 안정 상태에서 벗어난 행동을 하는지 자동으로 판단할 수 있는 모니터링 프로그램에 대해 설명한다. 본 프로그램의 동작인식 모델은 전이학습(Transfer Learning)을 통해 학습하여 구축되었다. 3개 동작에 대해 900장의 이미지가 사용되었으며, 본 프로그램은 모든 환경을 지원하기 위하여 웹용으로 개발되었다. 모델은 격리실에 입원한 대상자의 상태에 대해 높은 정확도로 판단하였으며, 기존의 격리실 모니터링 시스템에 응용하여 적용가능하다.

Two-phase flow pattern online monitoring system based on convolutional neural network and transfer learning

  • Hong Xu;Tao Tang
    • Nuclear Engineering and Technology
    • /
    • 제54권12호
    • /
    • pp.4751-4758
    • /
    • 2022
  • Two-phase flow may almost exist in every branch of the energy industry. For the corresponding engineering design, it is very essential and crucial to monitor flow patterns and their transitions accurately. With the high-speed development and success of deep learning based on convolutional neural network (CNN), the study of flow pattern identification recently almost focused on this methodology. Additionally, the photographing technique has attractive implementation features as well, since it is normally considerably less expensive than other techniques. The development of such a two-phase flow pattern online monitoring system is the objective of this work, which seldom studied before. The ongoing preliminary engineering design (including hardware and software) of the system are introduced. The flow pattern identification method based on CNNs and transfer learning was discussed in detail. Several potential CNN candidates such as ALexNet, VggNet16 and ResNets were introduced and compared with each other based on a flow pattern dataset. According to the results, ResNet50 is the most promising CNN network for the system owing to its high precision, fast classification and strong robustness. This work can be a reference for the online monitoring system design in the energy system.

전이 학습과 데이터 증강을 이용한 너구리와 라쿤 분류 (Classification of Raccoon dog and Raccoon with Transfer Learning and Data Augmentation)

  • 박동민;조영석;염석원
    • 융합신호처리학회논문지
    • /
    • 제24권1호
    • /
    • pp.34-41
    • /
    • 2023
  • 최근 인간의 활동 범위가 증가함에 따라 외래종의 유입이 잦아지고 있고 환경에 적응하지 못해 유기된 외래종 중 2020년부터 유해 지정 동물로 지정된 라쿤이 문제가 되고 있다. 라쿤은 국내 토종 너구리와 크기나 생김새가 유사하여 일반적으로 포획하는데 있어서 구분이 필요하다. 이를 해결하기 위해서 이미지 분류에 특화된 CNN 딥러닝 모델인 VGG19, ResNet152V2, InceptionV3, InceptionResNet, NASNet을 사용한다. 학습에 사용할 파라미터는 많은 양의 데이터인 ImageNet으로 미리 학습된 파라미터를 전이 학습하여 이용한다. 너구리와 라쿤 데이터셋에서 동물의 외형적인 특징으로 분류하기 위해서 이미지를 회색조로 변환한 후 밝기를 정규화하였으며, 조정된 데이터셋에 충분한 학습을 위한 데이터를 만들기 위해 좌우 반전, 회전, 확대/축소, 이동을 이용하여 증강 기법을 적용하였다. 증강하지 않은 데이터셋은 FCL을 1층으로, 증강된 데이터셋은 4층으로 구성하여 진행하였다. 여러 가지 증강된 데이터셋의 정확도를 비교한 결과, 증강을 많이 할수록 성능이 증가함을 확인하였다.

WASM을 활용한 디바이스 및 엣지 클라우드 기반 Federated Learning의 최적화 방안 (Optimization Strategies for Federated Learning Using WASM on Device and Edge Cloud)

  • 최종석
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권4호
    • /
    • pp.213-220
    • /
    • 2024
  • 본 논문에서는 WebAssembly(WASM)를 활용하여 디바이스와 엣지 클라우드 간의 Federated Learning을 수행하는 최적화 전략을 제안한다. 제안된 전략은 일부 학습을 디바이스에서 수행하고, 나머지 학습을 엣지 클라우드에서 수행하여 효율성을 극대화하는 것을 목표로 한다. 특히, GPU 메모리 세그먼트 간 데이터 이동과 연산 작업의 중첩을 최적화하여 전체 학습 시간을 줄이고 GPU 사용률을 향상시키는 방법을 수학적으로 설명하고 평가한다. 다양한 실험 시나리오를 통해 비동기 데이터 전송과 연산 중첩이 학습 시간을 단축하고 GPU 사용률을 향상시키며, 모델 정확도를 증가시킴을 확인하였다. 모든 최적화 기법을 적용한 시나리오에서 학습 시간이 47% 단축되었고, GPU 사용률은 91.2%로 향상 되었으며, 모델 정확도는 89.5%로 증가함을 확인하여 비동기 데이터 전송과 연산 중첩이 데이터 전송을 기다리는 GPU 유휴 시간을 줄이고, 병목 현상을 완화할 수 있음을 확인하였다. 본 연구는 향후 Federated Learning 시스템의 성능 최적화에 기여할 수 있을 것으로 사료된다.

심층신경망 모형을 활용한 대중교통 이용자의 환승시간 추정에 관한 연구 (A study on Estimating the Transfer Time of Transit Users Using Deep Neural Network Models)

  • 이경재;김수재;문형택;한재윤;추상호
    • 한국ITS학회 논문지
    • /
    • 제19권1호
    • /
    • pp.32-43
    • /
    • 2020
  • 환승시간은 대중교통계획 및 정책 수립에 있어서 중요한 요소이다. 이에 본 연구에서는 교통카드 이용자료를 활용하여 대중교통 이용자의 환승시간 영향요인을 규명하고, 딥러닝 기법인 심층신경망 모형을 이용한 환승시간을 추정하였으며 이를 전통적인 회귀모형과 비교 분석하였다. 먼저 환승시간 영향요인의 경우, 주변 버스의 배차간격과 버스 정류장까지의 거리가 버스 환승시간에 양의 영향을 주었으며, 버스 노선수는 반대로 음의 영향을 주었다. 또한 지하철역이 속해있는 자치구에 따라서도 환승시간에 영향을 주는 것으로 나타났다. 도출된 환승시간 영향요인을 통해 딥러닝 모형을 구축하고 성능을 비교한 결과, 회귀모형보다 딥러닝 모형의 성능이 보다 우수하였다. 본 연구의 결과는 지역별 환승허용시간의 차등 적용 등 대중교통 환승정책의 기초 자료로 활용될 수 있을 것으로 판단된다.

민간 시큐리티 종사자의 신임 교육에 따른 전이효과 분석 (The analysis of transfer effect through recruit education programs for security personnel)

  • 이영석;방환복;최진혁
    • 시큐리티연구
    • /
    • 제16호
    • /
    • pp.243-264
    • /
    • 2008
  • 우리나라 민간 시큐리티 교육과 관련된 연구들은 지금까지 주로 교육현황과 문제점 파악 및 개선에 집중되어 왔으며, 교육 참여에 따른 전이효과에 대해서는 체계적인 분석이 미흡한 실정이다. 따라서, 본 연구는 현직에 있는 민간 시큐리티 종사자를 대상으로 경비업법 제13조 1항에 의거하여 실시되는 신임 교육이 전이효과에 미치는 영향을 규명하고자 탐색적 연구를 실시하였다. 민간 시큐리티 종사자의 신임 교육이 전이효과에 미치는 영향을 보면 다음과 같다. 첫째, 시큐리티 종사자의 사회인구학적 특성에 따라 개인적 특성 교육훈련특성 업무환경, 전이효과의 차이를 검증한 결과 부분적으로 유의한 차이가 있는 것으로 나타났다. 둘째, 시큐리티 종사자의 개인적 특성이 전이효과에 미치는 영향을 검증한 결과 통계적으로 유의한 차이가 있는 것으로 나타났다. 셋째, 시큐리티 종사자의 교육훈련특성이 전이효과에 미치는 영향을 검증한 결과 통계적으로 유의한 차이가 있는 것으로 나타났다. 넷째, 시큐리티 종사자의 업무환경이 전이효과에 미치는 영향을 검증한 결과 통계적으로 유의한 차이가 있는 것으로 나타났다.

  • PDF