• 제목/요약/키워드: 잠재학습

검색결과 306건 처리시간 0.023초

질의 응답 시스템을 위한 반교사 기반의 정답 유형 분류 (Semi-Supervised Answer Type Classification For Question-Answering System)

  • 박선영;이동현;김용희;류성한;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.45-49
    • /
    • 2013
  • 기존 연구에서는 질의 응답 시스템에서 정답 유형을 분류하기 위해 패턴 매칭 방식이나 교사 학습(Supervised Learning)을 이용했다. 패턴 매칭 방식은 질의 분석을 통해 수동으로 패턴을 구축해야 한다. 교사 학습에서는 훈련 데이터 전체에 정답 유형이 태깅(Tagging)되어야 하며, 이를 위해서는 사용자의 질의에 정답 유형을 수동으로 태깅하는 작업이 많이 필요하다. 웹을 통해 정답 유형이 태깅되지 않은 대용량의 사용자 질의 말뭉치를 구할 수 있지만, 이 데이터에는 정답 유형이 태깅되어 있지 않다. 따라서, 대용량의 사용자 질의에 비례하여, 정답 유형을 수동으로 태깅하는 작업량이 증가한다. 앞서 언급한 두 가지 방법론에서, 정답 유형 분류를 위해 수작업이 많이 필요하다는 문제점을 해결하고자 본 논문에서는 일부 태깅된 훈련 데이터를 필요로 하는 반교사 학습(Semi-supervised Learning)에 기반한 정답 유형 분류를 제안한다. 이는 정답 유형 분류 작업에 필요한 노동력을 최소화함으로 대용량의 데이터를 통한 효율적 질의 응답 시스템 구축을 가능하게 한다.

  • PDF

블록체인 기반 배지서비스 플랫폼 설계 (Design of Badge Service Platform Based on Blockchain)

  • 김민영;유인식;임걸
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권11호
    • /
    • pp.332-338
    • /
    • 2020
  • 블록체인은 데이터를 투명하고 안정적으로 또한 신뢰성 있게 다룰 수 있는 기반 기술을 제공하고 있기 때문에, 특성상 교육 및 교수학습 발전에 기여할 수 있는 잠재적 가능성을 폭넓게 내포하고 있다. 특히나 종단적 교육데이터의 관리에 있어서 블록체인의 기술의 적용은 데이터의 투명성과 안정성, 신뢰성을 보장할 수 있다. 본 연구는 배지와 블록체인을 결합한 배지체인 서비스 플랫폼을 설계하였다. 본 서비스는 배지체인(Badgechain) 솔루션, 배지체인(Badgechain) 서비스를 학습 활동으로 추가하여 설정한 배지체인(Badgechain)과 연동된 Moodle LMS, 여러 기관에서 발급된 배지를 조회 및 관리 할 수 있는 배지체인(Badgechain) Wallet 사이트로 구성된다. 본 연구는 블록체인의 교육적 활용을 위한 기초 연구로써 진행하였다.

ResNet-Variational AutoEncoder기반 변종 악성코드 패밀리 분류 연구 (A Study on Classification of Variant Malware Family Based on ResNet-Variational AutoEncoder)

  • 이영전;한명묵
    • 인터넷정보학회논문지
    • /
    • 제22권2호
    • /
    • pp.1-9
    • /
    • 2021
  • 전통적으로 대부분의 악성코드는 도메인 전문가에 의해 추출된 특징 정보를 활용하여 분석되었다. 하지만 이러한 특징 기반의 분석방식은 분석가의 역량에 의존적이며 기존의 악성코드를 변형한 변종 악성코드를 탐지하는 데 한계를 가지고 있다. 본 연구에서는 도메인 전문가의 개입 없이도 변종 악성코드의 패밀리를 분류할 수 있는 ResNet-Variational AutoEncder 기반 변종 악성코드 분류 방법을 제안한다. Variational AutoEncoder 네트워크는 입력값으로 제공되는 훈련 데이터의 학습 과정에서 데이터의 특징을 잘 이해하며 정규 분포 내에서 새로운 데이터를 생성하는 특징을 가지고 있다. 본 연구에서는 Variational AutoEncoder의 학습 과정에서 잠재 변수를 추출을 통해 악성코드의 중요 특징을 추출할 수 있었다. 또한 훈련 데이터의 특징을 더욱 잘 학습하고 학습의 효율성을 높이기 위해 전이 학습을 수행했다. ImageNet Dataset으로 사전학습된 ResNet-152 모델의 학습 파라미터를 Encoder Network의 학습 파라미터로 전이했다. 전이학습을 수행한 ResNet-Variational AutoEncoder의 경우 기존 Variational AutoEncoder에 비해 높은 성능을 보였으며 학습의 효율성을 제공하였다. 한편 변종 악성코드 분류를 위한 방법으로는 앙상블 모델인 Stacking Classifier가 사용되었다. ResNet-VAE 모델의 Encoder Network로 추출한 변종 악성코드 특징 데이터를 바탕으로 Stacking Classifier를 학습한 결과 98.66%의 Accuracy와 98.68의 F1-Score를 얻을 수 있었다.

스마트교육 수용의도에 영향을 미치는 요인 간의 관계 분석 (The Relationship of Factors that Effects on Acceptance Intention in Smart Eduction)

  • 강혜영;이장익;김성완
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제46차 하계학술발표논문집 20권2호
    • /
    • pp.141-144
    • /
    • 2012
  • 이 연구는 스마트교육 수용의도에 영향을 미치는 요인들의 관계를 분석하는데 목적이 있다. 기존 정보기술수용모형(technology acceptance model) 관련 선행연구를 토대로, 스마트교육 수용의도에 영향을 미치는 잠재모형을 개발하였다. 잠재모형의 예비타당성 검증절차를 거친 후, 이를 통해 수정된 모형을 검증하기 위해 경기도 A 연구소의 스마트교육 체험학습프로그램을 이수한 초 중 고등학생 132명을 대상으로 설문조사를 실시하고 그 자료를 수집 및 분석하였다. 연구결과, 다음과 같은 가설들이 채택되었다. 상호작용성은 지각된 유용성에 영향을 미친다(가설 I). 상호작용성은 지각된 사용용이성에 영향을 미친다(가설 II). 상호작용성은 지각된 수용의도에 영향을 미친다(가설 III). 사회적 영향은 지각된 유용성에 영향을 미친다(가설 IV). 사회적 영향과 상호작용성은 서로 영향을 미친다(가설 V). 지각된 유용성은 수용의도에 영향을 미친다(가설 VI). 지각된 사용용이성은 수용의도에 영향을 미친다(가설 VII). 또한 연구모형의 적합도 검증 결과, $x^2$값은 6.600, 유의확률은 .086으로서 유의수준 .05에서 모형과 자료가 일치한다는 영가설이 채택되었으며, GFI, CFI, TLI 값은 각각 .98, .99, .99로 높은 적합도 수준을 보였다. 다만, RMSEA 값은 .09로서 다소 높은 값을 보이지만, 수정된 연구모형의 적합성을 해하는 수준은 아닌 것으로 판단되었다.

  • PDF

토픽 모델링을 이용한 건설현장 추락재해 분석 (Falling Accidents Analysis in Construction Sites by Using Topic Modeling)

  • 류한국
    • 한국융합학회논문지
    • /
    • 제10권7호
    • /
    • pp.175-182
    • /
    • 2019
  • 본 연구는 기계학습 기법 중 토픽 모델링을 활용하여 건설현장에서 발생하는 추락재해에 대한 토픽을 분류하고 각 토픽에 따른 재해요인을 분석하였다. 잠재 디리클레 할당 기반의 토픽 모델링을 적용하기 위해 텍스트 데이터의 전처리를 하였고 Perplexity 점수로 평가하여 모형의 신뢰성을 높였다. 각 토픽에서 공통으로 도출된 추락재해의 대부분은 소규모 사업장에 속한 일용직 작업자들에게 발생하였다. 추락재해의 대부분의 원인은 안전장비 미착용, 현장 정리 정돈 미흡, 안전장비의 성능 및 착용 상태로 인해 제대로 작동하지 않은 것으로 판단되었다. 추락재해를 예방하고 절감하기 위해서는 소규모 사업장에 맞는 안전교육과 작업장의 정리 정돈과 개인 안전장비의 적절한 착용 상태 및 성능을 확인하는 것이 중요한 것으로 도출되었다.

A Multi-domain Style Transfer by Modified Generator of GAN

  • Lee, Geum-Boon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권7호
    • /
    • pp.27-33
    • /
    • 2022
  • 본 논문은 콘텐츠 이미지에 스타일 이미지를 입혀 스타일이 적용된 이미지를 생성하고자 기존의 이미지 대 이미지 방법이 아닌 다중 도메인 스타일 트랜스퍼(style transfer) 방법을 적용한다. 도메인별로 데이터 분포에 대한 다양한 특성을 고려하고, 콘텐츠 데이터의 특징을 잘 보존하면서 높은 품질의 이미지가 생성되도록 잠재 벡터(latent vector)와 가우시안 노이즈를 추가하는 새로운 GAN의 생성자(generator) 아키텍처를 제안한다. 콘텐츠 이미지가 도메인별 스타일을 잘 학습할 수 있도록 네트워크를 구성하고 사계절 이미지로 구성된 도메인에 적용하여 고해상도의 스타일 트랜스퍼 결과를 보여준다.

종단자료 분석을 통한 청소년 미디어 교육 활용 특성 분석 연구 (A Study on the Feature of Using Media for Education through Longitudinal Data Analysis)

  • 허균
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.77-85
    • /
    • 2020
  • 본 연구는 학생들의 성장에 따른 미디어 교육 활용 특성 종단적 변화를 알아보고자 하였다. 이를 위해 미디어의 교육적 활용 특성을 학습이용, 정보이용, 그리고 게임이용으로 구분하였다. 잠재성장모형을 적용하여 학습이용, 정보이용, 게임이용의 종단적 변화를 탐색하였다. 이후 3가지 미디어 교육적 활용 특성의 종단적 변화에서 성별 차이를 검증하였다. 한국청소년패널조사(KYPS)의 중등2패널을 활용하여 4년간 반복 추적 조사한 3,499명의 데이터를 분석하였다. 연구결과 (a) 학년이 증감함으로써 미디어의 학습이용과 정보이용의 변화율은 증가하는 경향을 나타내었다. (b) 여학생의 미디어 학습이용과 정보이용의 초기치와 변화율이 높은 것으로 나타났다. (c) 학년이 증가함으로써 미디어의 게임이용은 변화율이 감소하는 것으로 나타났다. (d) 미디어 게임이용에서는 초기치에는 남학생이 여학생보다 높은 것으로 나타났으나, 변화율에는 유의한 차이가 없는 것으로 나타났다.

토픽 모형을 이용한 텍스트 데이터의 단어 선택 (Feature selection for text data via topic modeling)

  • 장우솔;김예은;손원
    • 응용통계연구
    • /
    • 제35권6호
    • /
    • pp.739-754
    • /
    • 2022
  • 텍스트 데이터는 일반적으로 많은 변수를 포함하고 있으며 변수들 사이의 연관성도 높아 통계 분석의 정확성, 효율성 등에서 문제가 생길 수 있다. 이러한 문제점에 대처하기 위해 목표 변수가 주어진 지도 학습에서는 목표 변수를 잘 설명할 수 있는 단어들을 선택하여 이 단어들만 통계 분석에 이용하기도 한다. 반면, 비지도 학습에서는 목표 변수가 주어지지 않으므로 지도 학습에서와 같은 단어 선택 절차를 활용하기 어렵다. 이 연구에서는 토픽 모형을 이용하여 지도 학습에서의 목표 변수를 대신할 수 있는 토픽을 생성하고 각 토픽별로 연관성이 높은 단어들을 선택하는 단어 선택 절차를 제안한다. 제안된 절차를 실제 텍스트 데이터에 적용한 결과, 단어 선택 절차를 이용하면 많은 토픽에서 공통적으로 자주 등장하는 단어들을 제거함으로써 토픽을 더 명확하게 식별할 수 있었다. 또한, 군집 분석에 적용한 결과, 군집과 범주 사이에 높은 연관성을 가지는 군집 분석 결과를 얻을 수 있는 것으로 나타났다. 목표 변수에 대한 정보없이 토픽 모형을 이용하여 선택한 단어들을 분류 분석에 적용하였을 때 목표 변수를 이용하여 단어들을 선택한 경우와 비슷한 분류 정확성을 얻을 수 있음도 확인하였다.

컴퓨터 시각화 자료가 고등학생들의 수열 개념 이해에 미치는 영향 (A Study of the Effect of Computer's Visual Data about Understanding Concept of Sequence with High School Student)

  • 정인철;황운구;김택수
    • 한국학교수학회논문집
    • /
    • 제10권1호
    • /
    • pp.91-111
    • /
    • 2007
  • 본 연구는 컴퓨터를 활용하여 동적이며 직관적인 시각화 자료를 활용하여 실험에 참가한 고등학교 학생들의 수열 개념에 대해서 수열의 합 공식에 대해 귀납 추론으로 공식을 학생 스스로가 추론할 수 있는지를 알아보고자 했다. 학생들은 스스로가 수열의 합 공식을 사용하지 않고 귀납 추론으로 공식을 유도할 수 있음을 보았다. 또한 무한급수에서의 무한의 오개념인 잠재적 무한의 개념을 가진 학생들이 본 실험 자료로 학습을 하였을 때에 무한의 올바른 개념인 실 무한의 개념을 이해하는데 도움을 주는지에 대하여 연구를 하였는데 실험에 참가한 실험 학생들은 잠재적 무한 개념을 가지고 있었고 동적이고 직관적인 시각화 자료를 가지고 수업 후 실 무한의 개념으로의 변화가 있었다. 이들 학생들은 또한 컴퓨터를 활용하여 동적이고 직관적인 시각화 자료에 대해서 매우 흥미를 느꼈고, 수학에 대한 태도에도 영향을 주었다.

  • PDF

단어 유사도를 이용한 뉴스 토픽 추출 (News Topic Extraction based on Word Similarity)

  • 김동욱;이수원
    • 정보과학회 논문지
    • /
    • 제44권11호
    • /
    • pp.1138-1148
    • /
    • 2017
  • 토픽 추출은 문서 집합으로부터 그 문서 집합을 대표하는 토픽을 자동 추출하는 기술이며 자연어 처리의 중요한 연구 분야이다. 대표적인 토픽 추출 방법으로는 잠재 디리클레 할당과 단어 군집화 기반 토픽 추출방법이 있다. 그러나 이러한 방법의 문제점으로는 토픽 중복 문제와 토픽 혼재 문제가 있다. 토픽 중복 문제는 특정 토픽이 여러 개의 토픽으로 추출되는 문제이며, 토픽 혼재 문제는 추출된 하나의 토픽 내에 여러 토픽이 혼재되어 있는 문제이다. 이러한 문제를 해결하기 위하여 본 연구에서는 토픽 중복 문제에 대해 강건한 잠재 디리클레 할당으로 토픽을 추출하고 단어 간 유사도를 이용하여 토픽 분리 및 토픽 병합의 단계를 거쳐 최종적으로 토픽을 보정하는 방법을 제안한다. 실험 결과 제안 방법이 잠재 디리클레 할당 방법에 비해 좋은 성능을 보였다.