• 제목/요약/키워드: 학습용 데이터

검색결과 475건 처리시간 0.026초

교육용 게임에서의 학습 데이터 동기화 처리 (Synchronizing Learning Data in Educational Games)

  • 전성식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.100-104
    • /
    • 2008
  • 교육용 소프트웨어 산업이 급속히 발전하면서 온라인 게임을 플랫폼으로 하는 다양한 교육용 게임이 개발되고 있다. 현재 대부분 교육용 게임 시스템은 온라인 게임의 학습도구와 웹을 기반으로 하는 부가적 교육 학습도구로 이중화 되어 개발되고 있다. 하지만 온라인 게임의 학습 데이터 결과와 웹의 학습 데이터 결과가 일치화 되지 않아 학습자에게 올바른 학습 결과를 줄 수 없을 뿐만 아니라 게임 시스템의 학습과정에 따른 레벨 시스템을 적용하기가 어렵다. 본 논문에서는 이러한 비동기적 데이터 처리방식을 온라인 게임 시스템과 웹의 학습과정의 분기 조건에 필요한 학습결과 데이터만을 동기화 처리하는 학습 데이터 동기화 처리 방식을 구현하였다. 이러한 학습결과 데이터 동기화 처리는 위와 같은 문제점으로 다양한 학습 콘텐츠들이 온라인화 하지 못했던 문제점을 해결하고, 향후 통합 교육용 시스템과 다중 교육용 게임 시스템으로 개발 될 때 좀 더 효과적인 학습 시스템으로 개발될 수 있는 학습 데이터 처리 방식이 될 것이다.

  • PDF

블록체인을 활용한 양질의 기계학습용 데이터 수집 방안 연구 (High-quality data collection for machine learning using block chain)

  • 김영랑;우정훈;이재환;신지선
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.13-19
    • /
    • 2019
  • 기계학습의 정확도는 학습용 데이터의 양과 데이터의 품질에 많은 영향을 받는다. 기존의 웹을 기반으로 학습용 데이터를 수집하는 것은 실제 학습과 무관한 데이터가 수집 될 수 있는 위험성이 있으며 데이터의 투명성을 보장할 수가 없다. 본 논문에서는 블록체인구조에서 블록들이 직접 병렬적으로 데이터를 수집하게 하고 각 블록들이 수집한 데이터를 타 블록의 데이터와 비교하여 양질의 데이터만을 선별하는 방안을 제안한다. 제안하는 시스템은 각 블록들은 데이터를 서로 블록체인을 통해 공유하며 All-reduce 구조의 Parallel-SGD를 활용하여 다른 블록들의 데이터와 비교를 통해 양질의 데이터만을 선별하여 학습용 데이터셋을 구성할 수가 있다. 또한 본 논문에서는 제안한 구조의 성능을 확인하기 위해 실험을 통해 기존의 벤치마크용 데이터셋의 이미지를 활용하여 변조된 이미지 사이에서 원본 이미지만을 양질의 데이터로 판별함을 확인하였다.

랜드마크 이미지 AI 학습용 데이터 구축을 위한 메타데이터 표준 설계 방안 연구 (A Study on Designing Metadata Standard for Building AI Training Dataset of Landmark Images)

  • 김진묵
    • 한국문헌정보학회지
    • /
    • 제54권2호
    • /
    • pp.419-434
    • /
    • 2020
  • 본 연구의 목적은 랜드마크 이미지의 AI 학습용 데이터 구축을 위한 메타데이터 표준 설계 방안을 제시하기 위함이다. 이를 위해, 이미지 검색시스템의 종류와 각각의 색인 방식에 관한 최신 기술 현황을 포괄적으로 조사하여 분석하고, AI 머신러닝을 적용한 랜드마크 인식에 필수적인 학습용 공개 데이터셋과 이미지 객체 인식에 관한 기계학습 도구를 조사하였다. 이를 통해, 랜드마크 이미지 AI 학습용 데이터에 최적화된 메타데이터 요소를 선정하고 각각의 요소에 대한 입력 데이터를 정의하였다. 결론 및 제언에서는 랜드마크 인식을 활용한 추천시스템을 포함한 응용서비스 개발 방안을 논의하였다.

비정형데이터의 AI학습을 위한 영상/이미지 데이터 품질 향상 방법 (Method for improving video/image data quality for AI learning of unstructured data)

  • 김승희;류동주
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.55-66
    • /
    • 2023
  • 최근 전세계적으로 사회 모든 분야에서 인공지능 학습용 데이터에 관한 선행연구를 기반으로, 인공지능 학습용 데이터의 가치를 높이고 고품질 데이터를 확보하고자 하는 움직임이 늘고 있다. 따라서, 고품질 데이터를 확보하기 위한 구축사업에서는 품질관리가 매우 중요하다. 이에, 본 논문에서는 인공지능 학습용 데이터를 구축할 시 고품질데이터 확보를 위한 품질관리와 그에 따른 구축공정별 개선방안을 제시하였다. 특히, 인공지능 학습을 위해 구축되는 비정형데이터는 데이터 품질의 80% 이상이 구축과정에서 결정된다. 본 논문에서는 비정형데이터 이미지/영상데이터에 대한 품질검사를 통해 구축단계에서의 획득, data cleaning, labeling 모델에서 발생된 검사절차 및 문제 요소를 해결함으로써 고품질 데이터 확보 방안을 제시하였으며, 제시한 방안을 토대로 인공지능 학습용 데이터 구축에 참여하는 연구단체와 사업자들에게 데이터의 품질편차를 극복하기 위한 대안이 될 것으로 기대된다.

교육용 프로그래밍 언어 기반 Deep aI Yourself 실습 플랫폼을 위한 데이터 전처리 블록 (Data Preprocessing block for Education Programming Language based Deep aI Yourself Hands-on Platform)

  • 이세훈;김기태;백민주;유채원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.297-298
    • /
    • 2020
  • 본 논문에서는 머신러닝 학습에 있어 데이터 전처리의 중요성과 기존 데이터 전처리 기능을 가진 교육용 실습 플랫폼 서비스의 단점은 개선할 수 있는 데이터 전처리 학습을 위한 교육용 블록코딩 기반 실습 플랫폼을 제안한다. 머신러닝 모델의 학습데이터는 데이터 전처리에 따라 모델의 정확도에 큰 영향을 미치므로 데이터를 다양하게 활용하기 위해서는 전처리의 필요성을 깨닫고 과정을 정확하게 이해해야 한다. 따라서 데이터를 처리하는 과정을 이해하고 전처리를 직접 실행해 볼 수 있는 교육용 프로그래밍 언어 기반 D.I.Y 실습 플랫폼을 구현한다.

  • PDF

HMM을 이용한 연속음성인식 시스템의 화자적응화에 관한 연구 (A Study on Speaker Adaptation of HMM in a Continous Speech Recognition System)

  • 김상범
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.100-104
    • /
    • 1995
  • 일반적으로 화자적응화는 이미 학습되어 있는 불특정 화자 모델을 표준모델로 하고 소량의 적응화용 발화로 추가적인 학습을 실시하여 특정화자 모델의 성능에 가깝게 하는 기술로서 연속음성 인식에 있어서 매우 중요하다. ML 추정법을 이용한 화자적응화는 카테고리마다 모델의 학습패턴들을 다수개 준비한 후 학습시에 일괄적으로 적용시켜 모델 파라메터를 추정 갱신하므로 추가되는 화자데이터에 대해 데이터를 모두 공급하여야 한다. 본 연구에서는 문발화 데이터의 음절단위를 자동추출한 후 추가되는 화자데이터가 주어질 때 마다 적응화할 수 있는 화자적응화 방법을 검토하였다. 이 방법은 문발화 데이터를 잘라내지 않고 음절 단위를 자동추출시켜 추가 데이터마다 최대 사후확률 추정법을 이용하여 적응화 시키는 것으로 수소의 데이터로서도 적응화를 가능하게 하는 것이다. 본 연구에서 사용되는 음성데이터는 신문사설에서 발췌한 연속음성 10문장을 사용하고, 이 음성 데이터중 6명분은 HMM 학습용으로 하고 나머지 3명분은 적응화용 및 평가용 데이터로 사용하였다. 6명의 화자를 DDCHMM으로 학습하고 나머지 3명분을 MAP법으로 적응화시켰다. 그 결과 적응전과 비교해 볼 때 약 32%의 인식율 향상을 얻을 수 있었다.

  • PDF

멀티미디어 학습물 탐색을 위한 애플리케이션 프로화일 작성에 관한 연구 (Making an Application Profile for Multimedia Instructional Resources)

  • 김태문
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.185-190
    • /
    • 2002
  • 웹상의 교육용 학습물에 대한 탐색과 기술을 위한 다수의 표준적 메타데이터들이 개발되어왔다. 그러나 이러한 메타데이터들은 학습물이 지닌 고유한 자료적 특성 및 멀티미디어와 관련한 기술에 있어서 여러 가지 문제들을 지녀왔다. 애플리케이션 프로화일은 기존의 표준적 메타데이터 시스템들이 지닌 경직성에서 벗어나 다양한 응용환경을 지원하기 위한 방편으로 점차 그 이용이 확대되어 가고 있다. 이 연구에서는 교육용 학습물의 기술을 위한 애플리케이션 프로화일 작성을 위하여 웹상에서 이용 가능한 멀티미디어 형식의 학습물에 대한 기술과 탐색에 필수적인 엘리먼트들을 선별하고 이에 상응하는 XML스키마작성를 모색하였다.

  • PDF

딥러닝 학습용 집적화된 데이터 증강 자동화 도구 개발 (Development of integrated data augmentation automation tools for deep learning)

  • 장찬호;이서영;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.283-286
    • /
    • 2021
  • 4차 산업혁명을 맞이해 최근 산업 및 기술 영역에서는 인공지능을 이용한 생산력 향상, 자동화 등 딥러닝의 보편화가 빠르게 진행되고 있다. 또한, 딥러닝의 성능을 도출하기 위해서는 수많은 양의 학습용 데이터가 필요하며 그 데이터의 양은 딥러닝 모델의 성능과 정비례한다. 이에 본 작품은 최신형 영상처리 Library인 Albumentations를 이용하여 영상처리 알고리즘을 이용하여 이미지를 증강하고, 이미지 데이터 크롤링 기능을 통해 Web에서 영상 데이터를 수집을 자동화하며, Label Pix를 연동하여 수집한 데이터를 라벨링 한다. 더 나아가 라벨링 된 데이터의 증강까지 포함하여 다양한 증강 자동화를 한 인터페이스에 집적시켜 딥러닝 모델을 생성할 때 데이터 수집과 전처리를 수월하게 한다. 또한, Neural Net 기반의 AdaIN Transfer를 이용하여 이미지를 개별적으로 학습하지 않고 Real time으로 이미지의 스타일을 옮겨올 수 있도록 하여 그림 데이터의 부족 현상을 해결한다.

  • PDF

교육용 게임을 위한 메타데이터 프로토타입 개발 (The development of Metadata Prototype for Educational Game)

  • 윤선정;윤태수
    • 한국게임학회 논문지
    • /
    • 제8권1호
    • /
    • pp.3-13
    • /
    • 2008
  • 교육용 게임의 메타데이터 개발은 게임 콘텐츠로서, 독립적인 학습 자원으로서, 또 게임 기반 LCMS에서 학습 컴포넌트로 활용되기 위해서는 매우 중요한 작업이다. 그러나 에듀테인먼트와 교육용 게임 시장은 신생산업 분야인 관계로 체계적인 메타데이터 개발이 진행되지 못했다. 따라서 본 논문은 먼저 교육용 게임 메타데이터 설계의 방법을 수립하고 이에 따라 메타데이터 프로토타입을 개발하였다. 그리고 추출된 메타데이터 요소를 전문가 집단의 검증을 거쳐 교육용 게임의 메타데이터로 정의하였다. 본 연구에 의해 개발된 교육용 게임의 메타데이터 프로토타입이 표준화 단계를 거쳐 공영 기관에 의해 운영된다면 학습자와 교수자, 개발 기관에게 검색과 관리, 재사용의 편리함을 제공하고 중복 투자 방지 등의 효과를 기대할 수 있다.

  • PDF

회화문화재 객체검출을 위한 학습용 이미지 데이터셋 구축 방안 연구 (A Study on the Construction of Image Datasets for Object Detection of Painting Cultural Heritage)

  • 권도형;유정민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.853-855
    • /
    • 2021
  • 본 연구는 회화문화재 속에 표현된 다양한 종류의 객체를 검출할 수 있는 딥러닝 모델생성을 위해 필요한 학습용 이미지 데이터셋 구축방안을 제안한다. 먼저 기존 동양화 기반의 회화문화재 이미지 데이터 및 객체 특징 분석을 진행하였고, 이를 바탕으로 Natural image에 Pose transfer 및 Style transfer를 적용한 새로운 방식의 회화문화재 이미지 데이터 생성 방법을 제안한다. 제안한 프레임워크를 통해 기존 문화재 분야에서 가지고 있던 제한된 데이터 구축문제를 극복하고, 검출모델 생성을 위한 대용량의 학습데이터 구축 가능성을 제시하였다.