• Title/Summary/Keyword: Few-Shot

검색결과 74건 처리시간 0.021초

바이너리 코드 취약점 탐지를 위한 딥러닝 기반 동적 오염 탐지 기술 (Deep Learning based Dynamic Taint Detection Technique for Binary Code Vulnerability Detection)

  • 고광만
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권3호
    • /
    • pp.161-166
    • /
    • 2023
  • 최근 바이너리 코드에 대한 신종·변종 해킹이 증가되고 있으며 소스 프로그램에서 악성코드를 탐지하고 공격에 대한 방어 기술의 한계점이 자주 노출되는 상황이다. 바이너리 코드에 대해 머신러닝, 딥러닝 기술을 활용하여 고도화된 소프트웨어 보안 취약점 탐지 기술과 공격에 대한 방어와 대처 능력이 필요하다. 본 논문에서는 바이너리 코드의 실행 경로를 추적(execution trace)하여 동적 오염 정보를 입력한 후 오염 정보를 따른 특징을 기반으로 멀웨어를 그룹핑하는 멀웨어 클러스터링 방법을 제안한다. 멀웨어 취약점 탐지는 3-계층으로 구성한 Few-shot 학습 모델에 적용하여 각 계층의 CPU, GPU에 대해 F1-score를 산출하였다. 학습 과정에서 97~98%의 성능과 테스트 과정에서 80~81% 정도의 탐지 성능을 얻었다.

CKFont2: 한글 구성요소를 이용한 개선된 퓨샷 한글 폰트 생성 모델 (CKFont2: An Improved Few-Shot Hangul Font Generation Model Based on Hangul Composability)

  • 박장경;;최재영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권12호
    • /
    • pp.499-508
    • /
    • 2022
  • 딥러닝을 이용한 한글 생성 모델에 대한 연구가 많이 진행되었으며, 최근에는 한글 1벌을 생성하기 위하여 입력되는 글자 수를 얼마나 최소화할 수 있는지(Few-Shot Learning)에 대하여 연구되고 있다. 본 논문은 28개 글자를 사용하는 CKFont (이하 CKFont1) 모델을 분석하고 개선하여 14개 글자만을 사용하는 CKFont2 모델을 제안한다. CKFont2 모델은 28글자로 51개 한글 구성요소를 추출하여 모든 한글을 생성하는 CKFont1 모델을, 24개의 구성요소(자음 14개와 모음 10개)를 포함한 14개의 글자만을 이용하여 모든 한글을 생성하는 모델로 성능을 개선하였으며, 이는 현재 알려진 모델로서는 최소한의 글자를 사용한다. 한글의 기본 자/모음으로부터 쌍자음(5), 복자음(11)/복모음(11) 등 27개를 딥러닝으로 학습하여 생성하고, 생성된 27개 구성요소를 24개의 기본 자/모음과 합한 51개 구성요소로부터 모든 한글을 자동 생성한다. zi2zi, CKFont1, MX-Font 모델 생성 결과와 비교 분석하여 성능의 우수성을 입증하였으며, 구조가 간결하고 시간과 자원이 절약되는 효율적인 모델로 한자나 태국어, 일본어에도 확장 적용이 가능하다.

HyShot 스크램제트 엔진의 흡입구 유동특성 연구 (Intake Flow Characteristics of HyShot Scramjet Engine)

  • 원수희;최정열;정인석
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 2004년도 제23회 추계학술대회 논문집
    • /
    • pp.47-52
    • /
    • 2004
  • 극초음속 스크램제트 흡입구의 설계는 다양한 공기열역학적인 현상을 수반한다. 이러한 현상은 무딘 앞전효과, 경계층 발달 문제, 천이, 점성/비점성 결합, 충격파 상호작용, 충격파 경계층 상호작용 및 유동 형상 등을 포함한다. 한정된 마하수와 고도 영역 내에서 운용되기 위해 설계되는 흡입구에서는 이러한 현상들 중 몇 가지 현상에 대한 이해가 요구된다. 본 연구에서는 HyShot 비행시험에서 발생할 수 있는 고도와 받음각 극단에서의 흡입구 성능을 연구하기 위해 몇 가지 중요한 유동 현상(점성 현상, 경계층 박리, 연소기 입구 유동 형상)들이 논의 될 것이다.

  • PDF

Weighted Fast Adaptation Prior on Meta-Learning

  • Widhianingsih, Tintrim Dwi Ary;Kang, Dae-Ki
    • International journal of advanced smart convergence
    • /
    • 제8권4호
    • /
    • pp.68-74
    • /
    • 2019
  • Along with the deeper architecture in the deep learning approaches, the need for the data becomes very big. In the real problem, to get huge data in some disciplines is very costly. Therefore, learning on limited data in the recent years turns to be a very appealing area. Meta-learning offers a new perspective to learn a model with this limitation. A state-of-the-art model that is made using a meta-learning framework, Meta-SGD, is proposed with a key idea of learning a hyperparameter or a learning rate of the fast adaptation stage in the outer update. However, this learning rate usually is set to be very small. In consequence, the objective function of SGD will give a little improvement to our weight parameters. In other words, the prior is being a key value of getting a good adaptation. As a goal of meta-learning approaches, learning using a single gradient step in the inner update may lead to a bad performance. Especially if the prior that we use is far from the expected one, or it works in the opposite way that it is very effective to adapt the model. By this reason, we propose to add a weight term to decrease, or increase in some conditions, the effect of this prior. The experiment on few-shot learning shows that emphasizing or weakening the prior can give better performance than using its original value.

Cascade Network Based Bolt Inspection In High-Speed Train

  • Gu, Xiaodong;Ding, Ji
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권10호
    • /
    • pp.3608-3626
    • /
    • 2021
  • The detection of bolts is an important task in high-speed train inspection systems, and it is frequently performed to ensure the safety of trains. The difficulty of the vision-based bolt inspection system lies in small sample defect detection, which makes the end-to-end network ineffective. In this paper, the problem is resolved in two stages, which includes the detection network and cascaded classification networks. For small bolt detection, all bolts including defective bolts and normal bolts are put together for conducting annotation training, a new loss function and a new boundingbox selection based on the smallest axis-aligned convex set are proposed. These allow YOLOv3 network to obtain the accurate position and bounding box of the various bolts. The average precision has been greatly improved on PASCAL VOC, MS COCO and actual data set. After that, the Siamese network is employed for estimating the status of the bolts. Using the convolutional Siamese network, we are able to get strong results on few-shot classification. Extensive experiments and comparisons on actual data set show that the system outperforms state-of-the-art algorithms in bolt inspection.

Class Specific Autoencoders Enhance Sample Diversity

  • Kumar, Teerath;Park, Jinbae;Ali, Muhammad Salman;Uddin, AFM Shahab;Bae, Sung-Ho
    • 방송공학회논문지
    • /
    • 제26권7호
    • /
    • pp.844-854
    • /
    • 2021
  • Semi-supervised learning (SSL) and few-shot learning (FSL) have shown impressive performance even then the volume of labeled data is very limited. However, SSL and FSL can encounter a significant performance degradation if the diversity gap between the labeled and unlabeled data is high. To reduce this diversity gap, we propose a novel scheme that relies on an autoencoder for generating pseudo examples. Specifically, the autoencoder is trained on a specific class using the available labeled data and the decoder of the trained autoencoder is then used to generate N samples of that specific class based on N random noise, sampled from a standard normal distribution. The above process is repeated for all the classes. Consequently, the generated data reduces the diversity gap and enhances the model performance. Extensive experiments on MNIST and FashionMNIST datasets for SSL and FSL verify the effectiveness of the proposed approach in terms of classification accuracy and robustness against adversarial attacks.

퓨샷 개체명 인식을 위한 Maximal Marginal Relevance 기반의 라벨 단어 집합 생성 (Generating Label Word Set based on Maximal Marginal Relevance for Few-shot Name Entity Recognition)

  • 최효림;황현선;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.664-671
    • /
    • 2023
  • 최근 다양한 거대 언어모델(Large Language Model)들이 개발되면서 프롬프트 엔지니어링의 대한 다양한 연구가 진행되고 있다. 본 논문에서는 퓨삿 학습 환경에서 개체명 인식의 성능을 높이기 위해서 제안된 템플릿이 필요 없는 프롬프트 튜닝(Template-free Prompt Tuning) 방법을 이용하고, 이 방법에서 사용된 라벨 단어 집합 생성 방법에 Maximal Marginal Relevance 알고리즘을 적용하여 해당 개체명에 대해 보다 다양하고 구체적인 라벨 단어 집합을 생성하도록 개선하였다. 실험 결과, 'LOC' 타입을 제외한 나머지 개체명 타입에서 'PER' 타입은 0.60%p, 'ORG' 타입은 4.98%p, 'MISC' 타입은 1.38%p 성능이 향상되었고, 전체 개체명 인식 성능은 1.26%p 향상되었다. 이를 통해 본 논문에서 제안한 라벨 단어 집합 생성 기법이 개체명 인식 성능 향상에 도움이 됨을 보였다.

  • PDF

Zero-Shot 기반 기계번역 품질 예측 연구 (Study on Zero-shot based Quality Estimation)

  • 어수경;박찬준;서재형;문현석;임희석
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.35-43
    • /
    • 2021
  • 최근 다언어모델(Cross-lingual language model)을 활용하여 한 번도 보지 못한 특정 언어의 하위 태스크를 수행하는 제로샷 교차언어 전이(Zero-shot cross-lingual transfer)에 대한 관심이 증가하고 있다. 본 논문은 기계번역 품질 예측(Quality Estimation, QE)을 학습하기 위한 데이터 구축적 측면에서의 한계점을 지적하고, 데이터를 구축하기 어려운 상황에서도 QE를 수행할 수 있도록 제로샷 교차언어 전이를 수행한다. QE에서 제로샷을 다룬 연구는 드물며, 본 논문에서는 교차언어모델을 활용하여 영어-독일어 QE 데이터에 대해 미세조정을 실시한 후 다른 언어쌍으로의 제로샷 전이를 진행했고 이 과정에서 다양한 다언어모델을 활용하여 비교 연구를 수행했다. 또한 다양한 자원 크기로 구성된 언어쌍에 대해 제로샷 실험을 진행하고 실험 결과에 대해 언어별 언어학적 특성 관점으로의 분석을 수행하였다. 실험결과 multilingual BART와 multillingual BERT에서 가장 높은 성능을 보였으며, 특정 언어쌍에 대해 QE 학습을 전혀 진행하지 않은 상황에서도 QE를 수행할 수 있도록 유도하였다.

가변 참조 구간에서의 적응적 임계값 설정 방법을 이용한 장면 전환 검출 기술과 PMP에서의 구현 (Shot Change Detection Technique Using Adaptive Threshold Setting Method on Variable Reference Block and Implementation on PMP)

  • 김원희;문광석;김종남
    • 한국멀티미디어학회논문지
    • /
    • 제12권3호
    • /
    • pp.354-361
    • /
    • 2009
  • 장면 전환 검출은 비디오 분할의 주요 기술로서 하드웨어에서 구현하기 위해서는 실시간 및 자동적 처리가 만족되어야 한다. 현재까지 PMP나 핸드폰 같은 낮은 하드웨어 성능의 단말기에서 실시간으로 적용 가능한 장면 전환 검출 기술은 거의 없다. 이와 같은 단말기들에서 장면 전환 검출의 실시간 적용을 위하여, 본 논문에서는 가변 참조 구간의 적응적 임계값 설정 방법을 이용한 장면 전환 검출 기술을 제안한다. 제안하는 방법은 현재 프레임의 특징값과 가변 참조 구간의 평균 특징값을 비교하여 장면 전환 유무를 결정한다. 제안하는 방법은 프레임의 특징값에 독립적으로 사용할 수 있으며, 가변 참조 구간 동안의 평균 특징값을 이용하여 자동적인 임계값 설정이 가능하다. 동일한 영상에 대한 실험을 통하여 기존의 방법들보다 최고 정확도(precision)에서 0.146, 회수도(recall)에서 0.083, F1에서 0.089 이상 결과가 향상된 것을 확인하였다. 제안한 실시간 SCD 모델을 H사의 PMP에 적용하여 실시간 장면 전환 검출이 가능한 것을 검증하였다. 제안한 방법은 PMP나 핸드폰 같은 휴대용 미디어 재생 장치에서 비디오 데이터를 검색할 때 유용하게 사용될 수 있다.

  • PDF

Structural health monitoring response reconstruction based on UAGAN under structural condition variations with few-shot learning

  • Jun, Li;Zhengyan, He;Gao, Fan
    • Smart Structures and Systems
    • /
    • 제30권6호
    • /
    • pp.687-701
    • /
    • 2022
  • Inevitable response loss under complex operational conditions significantly affects the integrity and quality of measured data, leading the structural health monitoring (SHM) ineffective. To remedy the impact of data loss, a common way is to transfer the recorded response of available measure point to where the data loss occurred by establishing the response mapping from measured data. However, the current research has yet addressed the structural condition changes afterward and response mapping learning from a small sample. So, this paper proposes a novel data driven structural response reconstruction method based on a sophisticated designed generating adversarial network (UAGAN). Advanced deep learning techniques including U-shaped dense blocks, self-attention and a customized loss function are specialized and embedded in UAGAN to improve the universal and representative features extraction and generalized responses mapping establishment. In numerical validation, UAGAN efficiently and accurately captures the distinguished features of structural response from only 40 training samples of the intact structure. Besides, the established response mapping is universal, which effectively reconstructs responses of the structure suffered up to 10% random stiffness reduction or structural damage. In the experimental validation, UAGAN is trained with ambient response and applied to reconstruct response measured under earthquake. The reconstruction losses of response in the time and frequency domains reached 16% and 17%, that is better than the previous research, demonstrating the leading performance of the sophisticated designed network. In addition, the identified modal parameters from reconstructed and the corresponding true responses are highly consistent indicates that the proposed UAGAN is very potential to be applied to practical civil engineering.