• 제목/요약/키워드: 학습 데이터

검색결과 6,405건 처리시간 0.038초

능동 학습을 이용한 학습 데이터 반자동 구축 (Semi-automatic Construction of Training Data using Active Learning)

  • 이창기;허정;왕지현;이충희;오효정;장명길;이영직
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1252-1255
    • /
    • 2006
  • 본 논문은 정보검색, 정보추출, 번역, 자연어처리 등의 작업을 위한 통계적 방법론에서 필요한 학습 데이터 구축을 효율적으로 하기 위한 학습 데이터 반자동 구축 장치 및 그 방법에 대하여 기술한다. 본 논문에서는 학습 데이터 구축양을 줄이기 위해서 능동 학습을 이용한다. 또한 최근 각광 받고 있는 Conditional Random Fields(CRF)를 능동학습에 이용하기 위해서 CRF를 이용한 Confidence measure를 정의한다.

  • PDF

지역 기반 분류기의 앙상블 학습 (Ensemble Learning of Region Based Classifiers)

  • 최성하;이병우;양지훈;김선호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.267-270
    • /
    • 2007
  • 기계학습에서 분류기들의 집합으로 구성된 앙상블 분류기는 단일 분류기에 비해 정확도가 높다는 것이 입증되었다. 본 논문에서는 새로운 앙상블 학습으로서 데이터의 지역 기반 분류기들의 앙상블 학습을 제시하여 기존의 앙상블 학습과의 비교를 통해 성능을 검증하고자 한다. 지역 기반 분류기의 앙상블 학습은 데이터의 분포가 지역에 따라 다르다는 점에 착안하여 학습 데이터를 분할하고 해당하는 지역에 기반을 둔 분류기들을 만들어 나간다. 이렇게 만들어진 분류기들로부터 지역에 따라 가중치를 둔 투표를 하여 앙상블 방법을 이끌어낸다. 본 논문에서 제시한 앙상블 분류기의 성능평가를 위해 UCI Machine Learning Repository에 있는 11개의 데이터 셋을 이용하여 단일 분류기와 기존의 앙상블 분류기인 배깅과 부스팅등의 정확도를 비교하였다. 그 결과 기본 분류기로 나이브 베이즈와 SVM을 사용했을 때 새로운 앙상블 방법이 다른 방법보다 좋은 성능을 보이는 것을 알 수 있었다.

  • PDF

빅데이터 마이닝을 위한 점진적 학습 기반 콘텐츠 큐레이션 시스템 설계 (Design of Contents Curation System Based on Incremental Learning Technology for Big Data Mining)

  • 민병원
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.421-422
    • /
    • 2017
  • 콘텐츠 큐레이션 서비스를 위해서 대용량 데이터를 학습하는 과정에서 발생하는 메모리부족 문제, 학습소요시간 문제 등을 해결하기 위한 "대용량 문서학습을 위한 동적학습 파이프라인 생성기술 중 빅데이터 마이닝을 위한 점진적 학습 모델" 기술이 필요하며, 본 논문에서 제안한 콘텐츠 큐레이션 서비스는 온라인상의 수많은 콘텐츠들 중 개인의 주관이나 관점에 따라 관련 콘텐츠들을 수집, 정리하고 편집하여 이용자와 관련이 있거나 좋아할 만한 콘텐츠를 제공하는 서비스이다. 큐레이션 서비스에서는 개인비서, 금융 분야의 투자, 자율주행, 저널리즘, 효율적인 업무 지시/감독, 제조업의 자동화 공정, 교육, 콘텐츠 유통, 학술정보 등에서 컴퓨터가 방대한 양의 데이터로 부터 학습하여 사람의 일을 대신 처리하거나 의사결정에 도움을 줌으로써 업무의 효율을 높여주는 서비스 산업에 활용이 가능하다.

  • PDF

불완전한 데이터로부터 베이지안 네트워크 파라메터의 온라인 학습 (Online Learning for Bayesian Network Parameters from Incomplete Data)

  • 임성수;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.652-654
    • /
    • 2005
  • 베이지안 네트워크의 파라메터 학습은 주어진 평가 척도에 따라 데이터의 훈련집합에 가장 잘 부합되는 네트워크 파라메터를 구하는 것으로, 베이지안 네트워크 설계에 드는 시간과 노력을 줄이기 위해 연구되어 왔다. 본 논문에서는 불완전한 데이터로부터 온라인으로 베이지안 네트워크의 파라메터를 학습하는 방법을 제안한다. 제안하는 방법은 불완전한 데이터로부터 학습이 가능하도록 하여 학습의 유연성을 높이고, 온라인 학습을 통해 사용자 또는 환경의 변화를 잘 모델링한다. Choen 등이 제안한 온라인 파라메터 학습 방법인 Voting EM 알고리즘과 비교 실험 결과, 제안하는 방법의 유용성을 확인할 수 있었다.

  • PDF

EPUB기반의 스마트러닝 학습객체 설계 및 개발 (Design and Development of Learning Object based on EPUB for Smart Learning)

  • 변재희;문남미
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.337-339
    • /
    • 2011
  • 본 연구에서는 EPUB기반의e-Book 콘텐츠를 스마트러닝환경에서학습객체로 활용하고자한다. 이를 위해e-Book의 표준인 EPUB을 분석하여 SCORM의 콘텐츠 모델을 적용하여 확장 설계하였으며, 더블린코어와 LOM 메타데이터를 Collection Map을 이용하여 EPUB 기반의 학습객체메타데이터인ELOM을 설계하였다. EPUB기반의 학습객체가 LMS에서 추적관리가 가능하도록 SCORM2004의 CMI 데이터 모델을 바탕으로 학습객체 특성에 맞는 기본 데이터 모델을 정의하였다. 설계된 학습객체의 운용 가능성을 평가하기 위해 EPUP기반 오픈소스 콘텐츠인 모비딕의 bodymatter를 학습객체로 재구현한 후 ADL의 SCORM2004 $4^{th}$ Test Suite1.1.1을 이용하여 검증하였다. 본 연구에서 설계된 ELOM은 스마트 스크린으로 확장하여 적용할 수 있다.

  • PDF

비디오에서의 다양한 회전 각도와 회전 속도를 사용한 시 공간 자기 지도학습 (Self-Supervised Spatiotemporal Learning For Video Using Variable Rotate Angle And Speed Prediction)

  • 김태훈;황원준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.732-735
    • /
    • 2020
  • 기존에 지도학습 방법은 성능은 좋지만, 학습할 때 비디오 데이터와 정답 라벨이 있어야 한다. 그러나 이러한 데이터의 라벨을 수동으로 붙여줘야 하는 문제점과 그에 필요한 시간과 돈이 크다는 것이다. 이러한 문제점을 해결하기 위한 다양한 방법 중 자기지도학습(Self-Supervised Learning) 중 하나인 회전 방법을 비디오 데이터에 적용하여 학습하는 연구를 진행하였다. 본 연구에서는 두가지 방법을 제안한다. 먼저 기존의 비디오 데이터를 입력으로 받으면 단순히 비디오 자체를 회전시키는 것이 아닌 입력으로 들어온 비디오의 각각 프레임이 시간이 지나면서 일정한 속도로 회전을 시킨다. 이때의 회전은 총 네 가지 각도[0, 90, 180, 270]를 분류하도록 하는 방법론이다. 두 번째로 비디오의 프레임이 시간이 지나면서 변할 때 프레임 별로 고정된 각도로 회전시키는데 이때 회전하는 속도 네 가지 [1x, 0.5x, 0.25x, 0.125]를 분류하도록 하는 방법론이다. 이와 같은 제안하는 pretext task들을 통해 네트워크를 학습한 뒤, 학습된 모델을 fine tune 시켜 비디오 분류에 대한 실험을 수행 및 결과를 도출하였다.

  • PDF

3차원 메쉬의 효율적인 학습을 위한 삼각형의 면적과 변화를 이용한 로컬 특징맵 (Local Feature Map Using Triangle Area and Variation for Efficient Learning of 3D Mesh)

  • 나홍은;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.573-576
    • /
    • 2022
  • 본 논문에서는 삼각형 구조로 구성된 3차원 메쉬(Mesh)에서 합성곱 신경망(Convolutional Neural Network, CNN)의 정확도를 개선시킬 수 있는 새로운 학습 표현 기법을 제시한다. 우리는 메쉬를 구성하고 있는 삼각형의 넓이와 그 로컬 특징을 기반으로 학습을 진행한다. 일반적으로 딥러닝은 인공신경망을 수많은 계층 형태로 연결한 기법을 말하며, 주요 처리 대상은 오디오 파일과 이미지이었다. 인공지능에 대한 연구가 지속되면서 3차원 딥러닝이 도입되었지만, 기존의 학습과는 달리 3차원 학습은 데이터의 확보가 쉽지 않다. 혼합현실과 메타버스 시장으로 인해 3차원 모델링 시장이 증가가 하면서 기술의 발전으로 데이터를 획득할 수 있는 방법이 생겼지만, 3차원 데이터를 직접적으로 학습 표현하는 방식으로 적용하는 것은 쉽지 않다. 그렇기 때문에 본 논문에서는 산업 현장에서 사용되는 데이터인 삼각형 메쉬 구조를 바탕으로 기존 방법보다 정확도가 높은 학습 기법을 제안한다.

  • PDF

교사학습 알고리즘을 이용한 텍스트 분류 시스템 (A Text Classification System based on a Supervised Learning Algorithm)

  • 김진상;성정호;김성주
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1998년도 국제 컨퍼런스: 국가경쟁력 향상을 위한 디지틀도서관 구축방안
    • /
    • pp.421-430
    • /
    • 1998
  • 지식경영을 위한 다양한 대상 업무중에서 텍스트 데이터의 마이닝은 특히 중요하다. 그 이유는 텍스트 데이터가 양적인 면에서 가장 풍부하고, 또 발견할 수 있는 지식을 가장 많이 포함하고 있기 때문이다. 본 논문에서는 텍스트 데이터베이스에서 지식발견을 위한 한 과정으로 텍스트 데이터베이스 내의 텍스트들을 분류하는 기법을 기술한다. 특히 문서 분류 방법은 데이터베이스의 일부 데이터를 훈련, 예제로 간주하여 교사 학습 알고리즘을 통해 학습한 후 나머지 데이터를 이용해 분류 정확성을 검증 및 향상시킨다. 시험 데이터로는 인터넷의 뉴스그룹의 기사를 이용하였고, 시험 결과 분류의 정확성은 한글 및 영문 모두 최소 70% 이상으로 나타났다.

  • PDF

멀티미디어 학습물 탐색을 위한 애플리케이션 프로화일 작성에 관한 연구 (Making an Application Profile for Multimedia Instructional Resources)

  • 김태문
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.185-190
    • /
    • 2002
  • 웹상의 교육용 학습물에 대한 탐색과 기술을 위한 다수의 표준적 메타데이터들이 개발되어왔다. 그러나 이러한 메타데이터들은 학습물이 지닌 고유한 자료적 특성 및 멀티미디어와 관련한 기술에 있어서 여러 가지 문제들을 지녀왔다. 애플리케이션 프로화일은 기존의 표준적 메타데이터 시스템들이 지닌 경직성에서 벗어나 다양한 응용환경을 지원하기 위한 방편으로 점차 그 이용이 확대되어 가고 있다. 이 연구에서는 교육용 학습물의 기술을 위한 애플리케이션 프로화일 작성을 위하여 웹상에서 이용 가능한 멀티미디어 형식의 학습물에 대한 기술과 탐색에 필수적인 엘리먼트들을 선별하고 이에 상응하는 XML스키마작성를 모색하였다.

  • PDF

학습 분석 기술 활용 가능성 및 전망 -유즈케이스와 서비스 모델

  • 조용상
    • 정보와 통신
    • /
    • 제31권12호
    • /
    • pp.73-80
    • /
    • 2014
  • 본고에서는 교육 분야에서 다양한 데이터를 수집 및 분석하여 개인화된 학습 서비스를 제공하려는 학습 분석(Learning Analytics) 서비스의 개념과 앞으로 기대되는 유즈케이스를 소개한다. 국제적으로 주목 받고 있는 학습 분석 기술은 현재 개념화 수준에 머물러 있지만, 글로벌 기업들이 주축이 된 민간단체에서는 데이터 수집체계와 같은 구체적인 구현 방법에 대한 논의도 추진되고 있어서 관련 현황에 대한 진단도 해본다. 특히 국제 표준화 기구와 단체를 통해 추진되고 있는 내용을 중심으로 소개한다. 다양한 데이터 응용 기술을 융합해서 기대할 수 있는 학습 분석 서비스 모형을 제시하면서 관련 정책과 제품개발에 기여할 수 있을 것으로 기대한다.