• 제목/요약/키워드: Performance Augment

검색결과 75건 처리시간 0.022초

음성위조 탐지에 있어서 데이터 증강 기법의 성능에 관한 비교 연구 (Comparative study of data augmentation methods for fake audio detection)

  • 박관열;곽일엽
    • 응용통계연구
    • /
    • 제36권2호
    • /
    • pp.101-114
    • /
    • 2023
  • 데이터 증강 기법은 학습용 데이터셋을 다양한 관점에서 볼 수 있게 해주어 모형의 과적합 문제를 해결하는데 효과적으로 사용되고 있다. 이미지 데이터 증강기법으로 회전, 잘라내기, 좌우대칭, 상하대칭등의 증강 기법 외에도 occlusion 기반 데이터 증강 방법인 Cutmix, Cutout 등이 제안되었다. 음성 데이터에 기반한 모형들에 있어서도, 1D 음성 신호를 2D 스펙트로그램으로 변환한 후, occlusion 기반 데이터 기반 증강기법의 사용이 가능하다. 특히, SpecAugment는 음성 스펙트로그램을 위해 제안된 occlusion 기반 증강 기법이다. 본 연구에서는 위조 음성 탐지 문제에 있어서 사용될 수 있는 데이터 증강기법에 대해 비교 연구해보고자 한다. Fake audio를 탐지하기 위해 개최된 ASVspoof2017과 ASVspoof2019 데이터를 사용하여 음성을 2D 스펙트로그램으로 변경시켜 occlusion 기반 데이터 증강 방식인 Cutout, Cutmix, SpecAugment를 적용한 데이터셋을 훈련 데이터로 하여 CNN 모형을 경량화시킨 LCNN 모형을 훈련시켰다. Cutout, Cutmix, SpecAugment 세 증강 기법 모두 대체적으로 모형의 성능을 향상시켰으나 방법에 따라 오히려 성능을 저하시키거나 성능에 변화가 없을 수도 있었다. ASVspoof2017 에서는 Cutmix, ASVspoof2019 LA 에서는 Mixup, ASVspoof2019 PA 에서는 SpecAugment 가 가장 좋은 성능을 보였다. 또, SpecAugment는 mask의 개수를 늘리는 것이 성능 향상에 도움이 된다. 결론적으로, 상황과 데이터에 따라 적합한 augmentation 기법이 다른 것으로 파악된다.

수직축 풍력터빈 성능향상을 위한 풍력타워 최적설계에 관한 연구 (Optimum Design of a Wind Power Tower to Augment Performance of Vertical Axis Wind Turbine)

  • 조수용;임채환;조종현
    • 한국항공우주학회지
    • /
    • 제47권3호
    • /
    • pp.177-186
    • /
    • 2019
  • 풍력 타워는 수직형 풍력터빈의 성능을 향상시키기 위해 사용되어왔다. 하지만 올바르게 설계되지 않은 풍력 타워는 오히려 풍력터빈의 성능을 저하시킬 수 있다. 따라서 본 연구에서는 풍력 타워의 최적화 연구를 수행하였다. 이를 위하여 다음과 같이 6가지의 설계변수가 선택되었다. 즉, 가이드 벽의 외부 및 내부 반경, 스플리터의 적용 여부, 스플리터의 내부 반경, 가이드 벽의 개수 및 원주각도가 선정되었다. 최적화를 위한 목적함수는 풍력타워 내에 설치된 수직형 풍력터빈에서의 주기적인 평균 토크가 사용되었으며, 최적화 과정에서 지엽적인 최적화 결과를 피하기 위하여 실험계획법, 유전자알고리즘 및 인공신경망기법이 사용되었다. 인공신경망은 세대의 증가에 따라 지속적으로 향상하였으며, 수직 풍력터빈의 성능은 독립운전에 비하여 최적화된 풍력 타워 내에서 두 배 이상 향상되었다.

멀티 모달 지도 대조 학습을 이용한 농작물 병해 진단 예측 방법 (Multimodal Supervised Contrastive Learning for Crop Disease Diagnosis)

  • 이현석;여도엽;함규성;오강한
    • 대한임베디드공학회논문지
    • /
    • 제18권6호
    • /
    • pp.285-292
    • /
    • 2023
  • With the wide spread of smart farms and the advancements in IoT technology, it is easy to obtain additional data in addition to crop images. Consequently, deep learning-based crop disease diagnosis research utilizing multimodal data has become important. This study proposes a crop disease diagnosis method using multimodal supervised contrastive learning by expanding upon the multimodal self-supervised learning. RandAugment method was used to augment crop image and time series of environment data. These augmented data passed through encoder and projection head for each modality, yielding low-dimensional features. Subsequently, the proposed multimodal supervised contrastive loss helped features from the same class get closer while pushing apart those from different classes. Following this, the pretrained model was fine-tuned for crop disease diagnosis. The visualization of t-SNE result and comparative assessments of crop disease diagnosis performance substantiate that the proposed method has superior performance than multimodal self-supervised learning.

Applying Token Tagging to Augment Dataset for Automatic Program Repair

  • Hu, Huimin;Lee, Byungjeong
    • Journal of Information Processing Systems
    • /
    • 제18권5호
    • /
    • pp.628-636
    • /
    • 2022
  • Automatic program repair (APR) techniques focus on automatically repairing bugs in programs and providing correct patches for developers, which have been investigated for decades. However, most studies have limitations in repairing complex bugs. To overcome these limitations, we developed an approach that augments datasets by utilizing token tagging and applying machine learning techniques for APR. First, to alleviate the data insufficiency problem, we augmented datasets by extracting all the methods (buggy and non-buggy methods) in the program source code and conducting token tagging on non-buggy methods. Second, we fed the preprocessed code into the model as an input for training. Finally, we evaluated the performance of the proposed approach by comparing it with the baselines. The results show that the proposed approach is efficient for augmenting datasets using token tagging and is promising for APR.

Latent Semantic Analysis Approach for Document Summarization Based on Word Embeddings

  • Al-Sabahi, Kamal;Zuping, Zhang;Kang, Yang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권1호
    • /
    • pp.254-276
    • /
    • 2019
  • Since the amount of information on the internet is growing rapidly, it is not easy for a user to find relevant information for his/her query. To tackle this issue, the researchers are paying much attention to Document Summarization. The key point in any successful document summarizer is a good document representation. The traditional approaches based on word overlapping mostly fail to produce that kind of representation. Word embedding has shown good performance allowing words to match on a semantic level. Naively concatenating word embeddings makes common words dominant which in turn diminish the representation quality. In this paper, we employ word embeddings to improve the weighting schemes for calculating the Latent Semantic Analysis input matrix. Two embedding-based weighting schemes are proposed and then combined to calculate the values of this matrix. They are modified versions of the augment weight and the entropy frequency that combine the strength of traditional weighting schemes and word embedding. The proposed approach is evaluated on three English datasets, DUC 2002, DUC 2004 and Multilingual 2015 Single-document Summarization. Experimental results on the three datasets show that the proposed model achieved competitive performance compared to the state-of-the-art leading to a conclusion that it provides a better document representation and a better document summary as a result.

PCA를 이용한 자동차 주행 환경에서의 화자인식 (Speaker Recognition using PCA in Driving Car Environments)

  • 유하진
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 춘계 학술대회 발표논문집
    • /
    • pp.103-106
    • /
    • 2005
  • The goal of our research is to build a text independent speaker recognition system that can be used in any condition without any additional adaptation process. The performance of speaker recognition systems can be severally degraded in some unknown mismatched microphone and noise conditions. In this paper, we show that PCA(Principal component analysis) without dimension reduction can greatly increase the performance to a level close to matched condition. The error rate is reduced more by the proposed augmented PCA, which augment an axis to the feature vectors of the most confusable pairs of speakers before PCA

  • PDF

풍력타워의 효율적인 설계변수에 대한 실험적 연구 (An Experimental Study for Efficient Design Parameters of a Wind Power Tower)

  • 조수용;최상규;김진균;조종현
    • 한국항공우주학회지
    • /
    • 제46권2호
    • /
    • pp.114-123
    • /
    • 2018
  • 풍력타워는 수직형 풍력터빈의 성능을 향상하기 위하여 사용되어진다. 하지만 풍력타워의 성능은 내부반경, 외부반경, 안내벽의 개수 등의 설계변수에 의하여 좌우된다. 따라서 본 연구에서는 풍력타워의 효율적인 설계변수를 찾기 위하여 실험적인 연구를 수행하였다. 실험에 사용된 풍동의 시험부는 높이 2 m, 폭 2.2 m이며, 7개의 안내벽을 가진 풍력타워의 한 층을 모델로 제작하고, 그 내부에 풍력터빈을 설치하였다. 다양한 설계변수에 대하여 실험을 하기 위하여 세 가지 종류의 안내벽을 사용하였다. 상대적인 성능평가를 위하여 동일한 입구속도에서 풍력타워를 원주방향으로 회전이동하여 출력계수를 측정하였다. 실험의 결과에서 풍력타워의 내부반경과 풍력터빈의 회전반경과의 간격이 풍력터빈의 성능을 향상하는데 가장 큰 영향을 미치는 변수임을 보였다.

여행사의 지식공유 환경요인이 지식공유와 성과에 미치는 영향에 관한 연구 (The Influence of Environmental Factors on Knowledge Sharing and Performance in Travel Agency)

  • 천덕희;박찬욱;강인원
    • 지식경영연구
    • /
    • 제11권3호
    • /
    • pp.47-58
    • /
    • 2010
  • Knowledge is fundamental asset for firms in the contemporary economy. Organizations are attempting to leverage their knowledge resources by employing knowledge management. However, a large number of KM initiatives fail due to the ignoring of human factors. We adopt theoretical framework and augment it with extrinsic variables, individual, organizational, and systematic factors that are believed to influence knowledge sharing and outcome of travel agency.

  • PDF

지식공유의 자발성이 시장성과에 미치는 영향에 관한 연구 : 여행사의 지식경영을 중심으로 (The Effect of Voluntariness of Knowledge Sharing on Market Performance in Travel Industry)

  • 강인원;천덕희;박찬욱
    • 지식경영연구
    • /
    • 제10권4호
    • /
    • pp.151-161
    • /
    • 2009
  • Individuals' knowledge does not transform easily into organizational knowledge even with the implementation of knowledge management system in travel agency. A prior research stream emphasizes voluntariness, as a critical factor in knowledge sharing, but pays little attention to its role. We employ theoretical framework and augment it with extrinsic variables, voluntariness of knowledge sharing that are believed to influence customer orientation and market performance of travel agency. Using data on travel agency employee, the authors find considerable results and conclude by discussing prescriptive recommendations for the travel industry.

  • PDF

푸리에 변환 및 이미지 증강을 통한 분류 성능 최적화에 관한 연구 (A Study on Optimization of Classification Performance through Fourier Transform and Image Augmentation)

  • 김기현;김성목;김용수
    • 품질경영학회지
    • /
    • 제51권1호
    • /
    • pp.119-129
    • /
    • 2023
  • Purpose: This study proposes a classification model for implementing condition-based maintenance (CBM) by monitoring the real-time status of a machine using acceleration sensor data collected from a vehicle. Methods: The classification model's performance was improved by applying Fourier transform to convert the acceleration sensor data from the time domain to the frequency domain. Additionally, the Generative Adversarial Network (GAN) algorithm was used to augment images and further enhance the classification model's performance. Results: Experimental results demonstrate that the GAN algorithm can effectively serve as an image augmentation technique to enhance the performance of the classification model. Consequently, the proposed approach yielded a significant improvement in the classification model's accuracy. Conclusion: While this study focused on the effectiveness of the GAN algorithm as an image augmentation method, further research is necessary to compare its performance with other image augmentation techniques. Additionally, it is essential to consider the potential for performance degradation due to class imbalance and conduct follow-up studies to address this issue.