• 제목/요약/키워드: 퓨샷 러닝

검색결과 8건 처리시간 0.023초

프롬프트 기반 퓨샷 러닝을 통한 한국어 대화형 텍스트 기반 이미지 생성 (Image Generation from Korean Dialogue Text via Prompt-based Few-shot Learning)

  • 이은찬;안상태
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.447-451
    • /
    • 2022
  • 본 논문에서는 사용자가 대화 텍스트 방식의 입력을 주었을 때 이를 키워드 중심으로 변환하여 이미지를 생성해내는 방식을 제안한다. 대화 텍스트란 채팅 등에서 주로 사용하는 형식의 구어체를 말하며 이러한 텍스트 형식은 텍스트 기반 이미지 생성 모델이 적절한 아웃풋 이미지를 생성하기 어렵게 만든다. 이를 해결하기 위해 대화 텍스트를 키워드 중심 텍스트로 바꾸어 텍스트 기반 이미지 생성 모델의 입력으로 변환하는 과정이 이미지 생성의 질을 높이는 좋은 방안이 될 수 있는데 이러한 태스크에 적합한 학습 데이터는 충분하지 않다. 본 논문에서는 이러한 문제를 다루기 위한 하나의 방안으로 사전학습된 초대형 언어모델인 KoGPT 모델을 활용하며, 퓨샷 러닝을 통해 적은 양의 직접 제작한 데이터만을 학습시켜 대화 텍스트 기반의 이미지 생성을 구현하는 방법을 제안한다.

  • PDF

CKFont2: 한글 구성요소를 이용한 개선된 퓨샷 한글 폰트 생성 모델 (CKFont2: An Improved Few-Shot Hangul Font Generation Model Based on Hangul Composability)

  • 박장경;;최재영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권12호
    • /
    • pp.499-508
    • /
    • 2022
  • 딥러닝을 이용한 한글 생성 모델에 대한 연구가 많이 진행되었으며, 최근에는 한글 1벌을 생성하기 위하여 입력되는 글자 수를 얼마나 최소화할 수 있는지(Few-Shot Learning)에 대하여 연구되고 있다. 본 논문은 28개 글자를 사용하는 CKFont (이하 CKFont1) 모델을 분석하고 개선하여 14개 글자만을 사용하는 CKFont2 모델을 제안한다. CKFont2 모델은 28글자로 51개 한글 구성요소를 추출하여 모든 한글을 생성하는 CKFont1 모델을, 24개의 구성요소(자음 14개와 모음 10개)를 포함한 14개의 글자만을 이용하여 모든 한글을 생성하는 모델로 성능을 개선하였으며, 이는 현재 알려진 모델로서는 최소한의 글자를 사용한다. 한글의 기본 자/모음으로부터 쌍자음(5), 복자음(11)/복모음(11) 등 27개를 딥러닝으로 학습하여 생성하고, 생성된 27개 구성요소를 24개의 기본 자/모음과 합한 51개 구성요소로부터 모든 한글을 자동 생성한다. zi2zi, CKFont1, MX-Font 모델 생성 결과와 비교 분석하여 성능의 우수성을 입증하였으며, 구조가 간결하고 시간과 자원이 절약되는 효율적인 모델로 한자나 태국어, 일본어에도 확장 적용이 가능하다.

한국어 자연어 추론을 위한 다양한 프롬프트 방법 (Various Prompt Methods for Korean Natural Language Inference)

  • 최요한;이창기;배경만
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.419-422
    • /
    • 2023
  • 자연어 추론은 전제 문장과 가설 문장의 관계를 함의, 중립, 모순으로 분류하는 자연어 처리 태스크이다. 최근 여러 자연어 처리 태스크에서 딥러닝 모델을 이용하는 방법이 우수한 성능을 보이고 있지만, 이는 미세 조정과정에 드는 비용이 많다는 점과 모델 출력의 근거, 과정을 사람이 이해하기 어려운 한계가 있다. 이러한 이유로 최근에는 소량의 입력, 출력 예시를 포함한 프롬프트를 이용한 방법론과 모델 출력에 대한 근거를 생성, 활용하는 방법에 관한 많은 연구가 진행되고 있다. 본 논문에서는 퓨샷 학습 환경의 한국어 자연어 추론 태스크를 위한 세 가지 프롬프트 방법과 이들을 조합하여 적용하는 방법을 제안한다. 이를 통해 '해석 가능성'과 자연어 추론 성능을 모두 향상시킬 수 있음을 보인다.

  • PDF

개인정보 특화 개체명 주석 대화 데이터셋 기반 생성AI 활용 개체명 탐지 (Named Entity Detection Using Generative Al for Personal Information-Specific Named Entity Annotation Conversation Dataset)

  • 강예지;비립;장연지;박서윤;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.499-504
    • /
    • 2023
  • 본 연구에서는 민감한 개인정보의 유출과 남용 위험이 높아지고 있는 상황에서 정확한 개인정보 탐지 및 비식별화의 효율을 높이기 위해 개인정보 항목에 특화된 개체명 체계를 개발하였다. 개인정보 태그셋이 주석된 대화 데이터 4,981세트를 구축하고, 생성 AI 모델을 활용하여 개인정보 개체명 탐지 실험을 수행하였다. 실험을 위해 최적의 프롬프트를 설계하여 퓨샷러닝(few-shot learning)을 통해 탐지 결과를 평가하였다. 구축한 데이터셋과 영어 기반의 개인정보 주석 데이터셋을 비교 분석한 결과 고유식별번호 항목에 대해 본 연구에서 구축한 데이터셋에서 더 높은 탐지 성능이 나타났으며, 이를 통해 데이터셋의 필요성과 우수성을 입증하였다.

  • PDF

한국 전통회화 내 도상 검출에 관한 연구 (A Study on Icon Detection in Korean Traditional Paintings)

  • 이지원;이정수;문성원;남도원;유원영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.446-448
    • /
    • 2023
  • 최근 문화유산 해설 분야에도 AI를 도입하기 위해 여러 노력을 기울이고 있으나, 관람객의 특성이나 관심사를 고려하지 않고 사전에 수동으로 입력한 동일한 문화해설 콘텐츠를 다수의 관람객에게 반복 전달하는 형태로만 제공되는데 그치고 있다. 본 논문에서는 관람객이 관람 중인 문화유산을 관람객의 다양한 관심사에 맞추어 문화유산을 다양하게 해설해주기 위한 기초 연구로 영상을 통해 입력된 한국 전통회화에서 도상을 검출하는 연구를 진행하였다. 아직 가능성 타진 연구로 진행되어 현재 제시된 실험 결과에서는 우수한 도상 검출 성능을 내지 못하였지만, 다양한 증강기법과 퓨샷 러닝기법을 통하여 성능 향상을 도모할 경우 충분히 관람객 맞춤형 문화유산 해설 분야에 활용 가능할 것으로 기대된다.

Few-shot Learning을 이용한 격점상세도 분류 시스템 구현 (Implementation of Point detail Classification System using Few-shot Learning)

  • 박진혁;김용현;이국범;이종서;김유두
    • 한국정보통신학회논문지
    • /
    • 제26권12호
    • /
    • pp.1809-1815
    • /
    • 2022
  • 디지털 트윈이란 현실세계와 동일한 가상세계를 만드는 기술이다. 다양한 시물레이션을 통해 현실 세계의 문제를 파악할 수 있어 여러 산업 분야에서 적용하는 추세이다. 디지털 트윈을 적용하기 위해서는 동일하게 만드려는 현실세계의 구조가 설계된 도면을 분석해야 한다. 도면을 분석하는 기술이 연구되고 있지만 도면을 작성하는 규칙이나 기준이 작성자마다 다르기 때문에 적용하기 어려운 추세다. 따라서 본 논문에서는 인공지능을 이용하여 도면 중 하나인 격점상세도를 분석하여 분류하는 시스템을 구현한다. 이를 통해 인공지능을 이용하여 도면을 분석하고 분류할 수 있는 가능성을 확인하고 추후 연구 방향에 대해 소개하고자 한다.

히스토그램의 최적폭에 기반한 3차원 필름 영상의 분류 (3D Film Image Classification Based on Optimized Range of Histogram)

  • 이재은;김영봉;김종남
    • 융합신호처리학회논문지
    • /
    • 제22권2호
    • /
    • pp.71-78
    • /
    • 2021
  • 영상의 군집 속에서 특정 영상을 분류하기 위해서는 주로 목표 영상과 배경의 명암 차이를 구하는데 만약 특정 영상의 윤곽선이 흐리고 선명도가 낮다면 이를 분류하기가 쉽지 않다. 하지만 이러한 영상을 분류하기 위한 연구들이 많지 않으며, 지금까지 발표된 방법들을 적용하더라도 제대로 구분하지 못한다는 어려움이 있다. 본 논문에서는 각 3차원 필름 영상들의 히스토그램을 구한 후, 히스토그램의 최고 빈도를 기준으로 특정 빈도에서의 폭을 구하여 윤곽선이 흐린 불량패턴의 영상을 분류하는 방법을 제안한다. 실험을 통하여 정품 패턴과 불량 패턴 영상의 히스토그램 분포의 차이가 뚜렷하다는 것을 확인할 수 있었으며, 이러한 히스토그램의 특성을 반영한 제안 알고리즘을 통하여 모든 영상들을 정확하게 분류할 수 있다는 것을 보였다. 제안한 알고리즘의 성능을 평가하기 위하여 이진화, 히스토그램, 가장자리 검출을 이용한 각각의 유사도 검정들과 퓨샷 러닝의 분석 결과를 비교분석 하였으며, 실험을 통하여 제안한 알고리즘은 앞선 네 가지 방법들보다 복잡한 계산 없이 높은 성능을 낼 수 있다는 것을 검증하였다.

Few-Shot Learning을 사용한 호스트 기반 침입 탐지 모델 (Host-Based Intrusion Detection Model Using Few-Shot Learning)

  • 박대경;신동일;신동규;김상수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권7호
    • /
    • pp.271-278
    • /
    • 2021
  • 현재 사이버 공격이 더욱 지능화됨에 따라 기존의 침입 탐지 시스템(Intrusion Detection System)은 저장된 패턴에서 벗어난 지능형 공격을 탐지하기 어렵다. 이를 해결하려는 방법으로, 데이터 학습을 통해 지능형 공격의 패턴을 분석하는 딥러닝(Deep Learning) 기반의 침입 탐지 시스템 모델이 등장했다. 침입 탐지 시스템은 설치 위치에 따라 호스트 기반과 네트워크 기반으로 구분된다. 호스트 기반 침입 탐지 시스템은 네트워크 기반 침입 탐지 시스템과 달리 시스템 내부와 외부를 전체적으로 관찰해야 하는 단점이 있다. 하지만 네트워크 기반 침입 탐지 시스템에서 탐지할 수 없는 침입을 탐지할 수 있는 장점이 있다. 따라서, 본 연구에서는 호스트 기반의 침입 탐지 시스템에 관한 연구를 수행했다. 호스트 기반의 침입 탐지 시스템 모델의 성능을 평가하고 개선하기 위해서 2018년에 공개된 호스트 기반 LID-DS(Leipzig Intrusion Detection-Data Set)를 사용했다. 해당 데이터 세트를 통한 모델의 성능 평가에 있어서 각 데이터에 대한 유사성을 확인하여 정상 데이터인지 비정상 데이터인지 식별하기 위해 1차원 벡터 데이터를 3차원 이미지 데이터로 변환하여 재구성했다. 또한, 딥러닝 모델은 새로운 사이버 공격 방법이 발견될 때마다 학습을 다시 해야 한다는 단점이 있다. 즉, 데이터의 양이 많을수록 학습하는 시간이 오래 걸리기 때문에 효율적이지 못하다. 이를 해결하기 위해 본 논문에서는 적은 양의 데이터를 학습하여 우수한 성능을 보이는 Few-Shot Learning 기법을 사용하기 위해 Siamese-CNN(Siamese Convolutional Neural Network)을 제안한다. Siamese-CNN은 이미지로 변환한 각 사이버 공격의 샘플에 대한 유사성 점수에 의해 같은 유형의 공격인지 아닌지 판단한다. 정확성은 Few-Shot Learning 기법을 사용하여 정확성을 계산했으며, Siamese-CNN의 성능을 확인하기 위해 Vanilla-CNN(Vanilla Convolutional Neural Network)과 Siamese-CNN의 성능을 비교했다. Accuracy, Precision, Recall 및 F1-Score 지표를 측정한 결과, Vanilla-CNN 모델보다 본 연구에서 제안한 Siamese-CNN 모델의 Recall이 약 6% 증가한 것을 확인했다.