• 제목/요약/키워드: AI 모델

검색결과 1,117건 처리시간 0.028초

자율주행 영상데이터의 신뢰도 향상을 위한 AI모델 기반 데이터 자동 정제 (AI Model-Based Automated Data Cleaning for Reliable Autonomous Driving Image Datasets)

  • 김가나;김학일
    • 방송공학회논문지
    • /
    • 제28권3호
    • /
    • pp.302-313
    • /
    • 2023
  • 본 연구는 과학기술정보통신부가 2017년부터 1조원 이상을 투자한 'AI Hub 댐' 사업에서 구축된 인공지능 모델 학습데이터의 품질관리를 자동화할 수 있는 프레임워크의 개발을 목표로 한다. 자율주행 개발에 사용되는 AI 모델 학습에는 다량의 고품질의 데이터가 필요하며, 가공된 데이터를 검수자가 데이터 자체의 이상을 검수하고 유효함을 증명하는 데는 여전히 어려움이 있으며 오류가 있는 데이터로 학습된 모델은 실제 상황에서 큰 문제를 야기할 수 있다. 본 논문에서는 이상 데이터를 제거하는 신뢰할 수 있는 데이터셋 정제 프레임워크를 통해 모델의 인식 성능을 향상시키는 전략을 소개한다. 제안하는 방법은 인공지능 학습용 데이터 품질관리 가이드라인의 지표를 기반으로 설계되었다. 한국정보화진흥원의 AI Hub을 통해 공개된 자율주행 데이터셋에 대한 실험을 통해 프레임워크의 유효성을 증명하였고, 이상 데이터가 제거된 신뢰할 수 있는 데이터셋으로 재구축될 수 있음을 확인하였다.

오픈 도메인 대화를 위한 노이징된 가이드 기반 생성 모델 (Noised Guide-based Generative Model for Open-domain Conversation)

  • 금빛나;김홍진;박상민;김재은;황금하;권오욱;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.82-87
    • /
    • 2022
  • 대화 모델은 대표적으로 검색 모델 또는 생성 모델을 기반으로 구현된다. 최근에는 두 모델의 장점은 융합하고 단점은 보완하기 위해 검색 기법과 생성 기법을 결합하는 연구가 활발히 이루어지고 있다. 그러나 생성 모델이 검색된 응답을 전혀 반영하지 않고 응답을 생성하여 검색 모델을 간과하는 문제 또는 검색된 응답을 그대로 복사해 생성하여 검색 모델에 과의존하는 문제가 발생한다. 본 논문에서는 이러한 문제들을 완화하며 검색 모델과 생성 모델을 모두 조화롭게 활용할 수 있는 대화 모델을 제안한다. 생성 모델이 검색 모델을 간과하는 문제를 완화하기 위해 학습 시 골드 응답을 검색된 응답과 함께 사용한다. 또한, 검색 모델에 과의존하는 문제를 완화하기 위해 검색된 응답들의 내용어 일부를 마스킹하고 순서를 무작위로 섞어 노이징한다. 검색된 응답은 대화 컨텍스트와의 관련성이 높은 것만을 선별하여 생성에 활용한다. 정량 평가 및 정성 평가를 통해 제안한 방법의 성능 향상 효과를 확인하였다.

  • PDF

AI 기법을 활용한 제주도 남서부 해역의 입자추적 예측 연구 (AI-Based Particle Position Prediction Near Southwestern Area of Jeju Island)

  • 하승윤;김희준;곽경일;김영택;윤한삼
    • 한국해안·해양공학회논문집
    • /
    • 제34권3호
    • /
    • pp.72-81
    • /
    • 2022
  • 본 연구는 제주도 남서부 해역의 표류체 이동 예측을 위해 2020년 8월 제주도 남서부 5개 지점에서 투하된 표층 뜰개 위치자료와 수치모델 예측자료를 학습자료로 이용한 인공지능 기반 입자추적 모델 5개를 구축하였다. 구축된 AI 기법은 기계학습 3종(Extra Trees, LightGBM, Support Vector Machine)과 딥러닝 2종(DNN, RBFN)이다. 또한 해수유동 수치모델 입자추적 예측자료 1종 및 AI 기법 입자추적 예측자료 5종을 표층 뜰개 관측자료와 비교하여 각 예측모델별 예측 정확도를 평가하였다. 6종 모델의 예측 정확도를 평가하기 위해, 5개 정점에 대한 3개 스킬량(MAE, RMSE, NCLS)의 평균값을 비교 검토하였다. 최종적인 결과로서 딥러닝 DNN 모델이 MAE, RMSE, NCLS에서 다른 모델보다 가장 우수하게 나타났다.

전문 지식 및 대화 정책 예측이 결합된 프롬프트를 활용한 지식 기반 대화 생성 (Knowledge-Grounded Dialogue Generation Using Prompts Combined with Expertise and Dialog Policy Prediction)

  • 주어진;임채균;이도경;윤준영;성주원;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.409-414
    • /
    • 2023
  • 최근 지식 기반 대화 생성에 많은 연구자가 초점을 맞추고 있다. 특히, 특정 도메인에서의 작업 지향형 대화 시스템을 구축하는 것은 다양한 도전 과제가 있으며, 이 중 하나는 거대 언어 모델이 입력과 관련된 지식을 활용하여 응답을 생성하는 데 있다. 하지만 현재 거대 언어 모델은 작업 지향형 대화에서 단순히 정보를 열거하는 방식으로 응답을 생성하는 경향이 있다. 이 논문에서는 전문 지식과 대화 정책 예측 모델을 결합한 프롬프트를 제시하고 작업 지향형 대화에서 사용자의 최근 입력에 대한 정보 제공 및 일상 대화를 지원하는 가능성을 탐구한다. 이러한 새로운 접근법은 모델 파인튜닝에 비해 비용 측면에서 효율적이며, 향후 대화 생성 분야에서 발전 가능성을 제시한다.

  • PDF

엣지 기반 미디어 서비스 구성을 위한 AI모델 정보 관리구조의 제안 (Proposed of AI-Model Information Management Structure for Media Service Construction based on Edge)

  • 염정철;금승우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.84-86
    • /
    • 2022
  • 최근 미디어, 금융 등 다양한 분야의 기업들이 AI를 활용해 제공하는 서비스가 늘어남에 따라 학습된 모델을 엣지 자원에 배포하여 기능을 제공하는 서비스형태 또한 늘어나고 있다. AI-Application이 동작하기 위해서는 AI-Model 파일뿐 아니라 동작을 위한 설정 파일들이 필요하여 AI-Application이 사용 중인 AI-Model의 정보를 수집, 관리하는 것은 중요한 이슈라고 할 수 있다. 하지만 단일 서비스서버에서 동작하는 형태가 아닌 각 자원이 산재되어 다양한 형태로 서비스를 제공하는 엣지컴퓨팅의 구조적인 특성상 AI-Application의 기존 서비스구조, 기능을 수정하지 않고 정보를 수집하는 과정은 다양한 문제에 부딪치게 된다. 이에 따라 본 논문에서는 기존 서비스구조를 변경하지 않고 독립적으로 AI-Application에서 사용중인 AI-Model의 정보를 파악하고, 사용자 요청에 대응할 수 있는 관리구조를 제안한다.

  • PDF

KB-BERT: 금융 특화 한국어 사전학습 언어모델과 그 응용 (KB-BERT: Training and Application of Korean Pre-trained Language Model in Financial Domain)

  • 김동규;이동욱;박장원;오성우;권성준;이인용;최동원
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.191-206
    • /
    • 2022
  • 대량의 말뭉치를 비지도 방식으로 학습하여 자연어 지식을 획득할 수 있는 사전학습 언어모델(Pre-trained Language Model)은 최근 자연어 처리 모델 개발에 있어 매우 일반적인 요소이다. 하지만, 여타 기계학습 방식의 성격과 동일하게 사전학습 언어모델 또한 학습 단계에 사용된 자연어 말뭉치의 특성으로부터 영향을 받으며, 이후 사전학습 언어모델이 실제 활용되는 응용단계 태스크(Downstream task)가 적용되는 도메인에 따라 최종 모델 성능에서 큰 차이를 보인다. 이와 같은 이유로, 법률, 의료 등 다양한 분야에서 사전학습 언어모델을 최적화된 방식으로 활용하기 위해 각 도메인에 특화된 사전학습 언어모델을 학습시킬 수 있는 방법론에 관한 연구가 매우 중요한 방향으로 대두되고 있다. 본 연구에서는 금융(Finance) 도메인에서 다양한 자연어 처리 기반 서비스 개발에 활용될 수 있는 금융 특화 사전학습 언어모델의 학습 과정 및 그 응용 방식에 대해 논한다. 금융 도메인 지식을 보유한 언어모델의 사전학습을 위해 경제 뉴스, 금융 상품 설명서 등으로 구성된 금융 특화 말뭉치가 사용되었으며, 학습된 언어 모델의 금융 지식을 정량적으로 평가하기 위해 토픽 분류, 감성 분류, 질의 응답의 세 종류 자연어 처리 데이터셋에서의 모델 성능을 측정하였다. 금융 도메인 말뭉치를 기반으로 사전 학습된 KB-BERT는 KoELECTRA, KLUE-RoBERTa 등 State-of-the-art 한국어 사전학습 언어 모델과 비교하여 일반적인 언어 지식을 요구하는 범용 벤치마크 데이터셋에서 견줄 만한 성능을 보였으며, 문제 해결에 있어 금융 관련 지식을 요구하는 금융 특화 데이터셋에서는 비교대상 모델을 뛰어넘는 성능을 보였다.

원격탐사활용을 위한 딥러닝기술 (Deep Learning for Remote Sensing Applications)

  • 이명진;이원진;이승국;정형섭
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1581-1587
    • /
    • 2022
  • 이제는 딥러닝 없는 원격탐사 데이터 처리는 상상하기도 어려운 시대가 되었다. 원격탐사의 활용기술 개발을 위해서는 먼저 인공지능(artificial intelligence, AI)을 위한 데이터를 설계 및 구축하고, AI모델을 학습시키는 과정을 거친다. AI모델은 빠르게 발전하여 모델 정확도가 나날이 높아지고 있지만, 모델을 훈련시키는 사람에 따라 정확도의 편차가 발생하고 있다. 결국 AI모델을 훈련시킬 수 있는 숙련도 높은 전문가가 더욱 더 필요한 시대가 되어가고 있다. 특히, 딥러닝기술은 원격탐사활용에 있어 자동화라는 키워드를 제공하고 있다. 예전에는 60% 이하의 정확도만 있었던 기술도 이제는 90%를 넘어 100%의 시대로 가고 있다. 이 특별호에서는 딥러닝기술이 원격탐사에 어떻게 활용되고 있는지에 관한 13편의 논문을 소개한다.

AI 컴포넌트 추상화 모델 기반 자율형 IoT 통합개발환경 구현 (Implementation of Autonomous IoT Integrated Development Environment based on AI Component Abstract Model)

  • 김서연;윤영선;은성배;차신;정진만
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.71-77
    • /
    • 2021
  • 최근 이질적인 하드웨어 특성을 고려한 IoT 응용 지원 프레임워크의 효율적인 프로그램 개발이 요구되고 있다. 또한, 인간의 뇌를 모사하여 스스로 학습 및 자율적 컴퓨팅이 가능한 뉴로모픽 아키텍처의 발전으로 하드웨어 지원의 범위가 넓어지고 있다. 하지만 기존 대부분의 IoT 통합개발환경에서는 AI(Artificial Intelligence) 기능을 지원하거나 뉴로모픽 아키텍처와 같은 다양한 하드웨어와 결합된 서비스 지원이 어렵다. 본 논문에서는 2세대 인공 신경망 및 3세대 스파이킹 신경망 모델을 모두 지원하는 AI 컴포넌트 추상화 모델을 설계하고 제안 모델 기반의 자율형 IoT 통합개발환경을 구현하였다. IoT 개발자는 AI 및 스파이킹 신경망에 대한 지식이 없어도 제안 기법을 통해 자동으로 AI 컴포넌트를 생성할 수 있으며 런타임에 따라 코드 변환이 유연하여 개발 생산성이 높다. 제안 기법의 실험을 진행하여 가상 컴포넌트 계층으로 인한 변환 지연시간이 발생할 수 있으나 차이가 크지 않음을 확인하였다.

농작물 병해충 진단을 위한 인공지능 앱, Dr. Vegetable (Dr. Vegetable: an AI-based Mobile Application for Diagnosis of Plant Diseases and Insect Pests)

  • 김수환;정대기;이승준;정성엽;양동재;정근영;황석형;황세웅
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.457-460
    • /
    • 2023
  • 본 연구는 시설작물의 병충해 진단을 위해 딥러닝 모델을 응용한 인공지능 서비스 앱, Dr. Vegetable을 제안하고자 한다. 농업 현장에서 숙련된 농부는 한눈에 농작물의 병충해를 판단할 수 있지만 미숙련된 농부는 병충해 피해를 발견하더라도 그 종류와 해결 방법을 찾아내기가 매우 어렵다. 또한 아무리 숙련된 농부라고 할지라도 육안검사만으로 병충해를 조기에 발견하는 것은 쉽지 않다. 한편 시설작물의 경우 병충해에 의한 연쇄피해가 발생할 우려가 있으므로 병충해의 조기 발견 및 방제가 매우 중요하다. 즉, 농부의 경험에 따른 농작물 병해충 진단은 정확성을 장담할 수 없으며 비용과 시간적인 측면에서 위험성이 높다고 할 수 있다. 본 논문에서는 YOLOv5를 활용하여 상추, 고추, 토마토 등 농작물의 병충해를 진단하는 인공지능 서비스를 제안한다. 특히 한국지능정보사회진흥원이 운영하고 있는 AI 통합 플랫폼인 AI 허브에서 제공하는 노지 작물 질병 및 해충 진단 이미지를 사용하여 딥러닝 모델을 학습하였다. 본 연구를 통해 개발된 모바일 어플리케이션을 이용하여 실제 시설농장에서 병충해 진단 서비스를 적용한 결과 약 86%의 정확도, F1 Score 0.84, 그리고 0.98의 mAP 값을 얻을 수 있었다. 본 연구에서 개발한 병충해 진단 딥러닝 모델을 다양한 조도에서 강인하게 동작하도록 개선한다면 농업 현장에서 널리 활용될 수 있을 것으로 기대한다.

  • PDF

YOLO 기반 실종자 수색 AI 응용 시스템 구현 (Implementation of YOLO based Missing Person Search Al Application System)

  • 김하연;김종훈;정세훈;심춘보
    • 스마트미디어저널
    • /
    • 제12권9호
    • /
    • pp.159-170
    • /
    • 2023
  • 실종자 수색은 많은 시간과 인력이 필요하다. 그 해결책의 일환으로 YOLO 기반 모델을 활용하여 실종자 수색 AI 시스템을 구현하였다. 객 객체 탐지 모델을 훈련하기 위해 AI-Hub에서 드론 이동체 인지 영상(도로 고정)을 수집하고 모델을 학습하였다. 또한, 훈련 데이터 세트와 상이한 환경에서의 성능을 평가하기 위해 산악 환경 데이터 세트를 추가 수집하였다. 실종자 수색 AI 시스템의 최적화를 위해 모델 크기 및 하이퍼파라미터에 따른 성능평가, 과대적합 우려에 대한 추가 성능평가를 시행하였다. 성능평가 결과 YOLOv5-L 모델이 우수한 성능을 보이는 것을 확인할 수 있었으며 데이터 증강 기법을 적용함에 따라 모델의 성능이 보다 향상되었다. 이후 웹 서비스에는 데이터 증강 기법을 적용한 YOLOv5-L 모델을 적용하여 실종자 수색의 효율성을 높였다.