• 제목/요약/키워드: 질문생성훈련

검색결과 4건 처리시간 0.018초

강건한 질의응답 모델을 위한 데이터셋 증강 기법 (Adversarial Examples for Robust Reading Comprehension)

  • 장한솔;전창욱;최주영;심묘섭;김현;민경구
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-46
    • /
    • 2021
  • 기계 독해는 문단과 질문이 주어질 때에 정답을 맞추는 자연어처리의 연구분야다. 최근 기계 독해 모델이 사람보다 높은 성능을 보여주고 있지만, 문단과 질의가 크게 변하지 않더라도 예상과 다른 결과를 만들어 성능에 영향을 주기도 한다. 본 논문에서는 문단과 질문 두 가지 관점에서 적대적 예시 데이터를 사용하여 보다 강건한 질의응답 모델을 훈련하는 방식을 제안한다. 트랜스포머 인코더 모델을 활용하였으며, 데이터를 생성하기 위해서 KorQuAD 1.0 데이터셋에 적대적 예시를 추가하여 실험을 진행하였다. 적대적 예시를 이용한 데이터로 실험한 결과, 기존 모델보다 1% 가량 높은 성능을 보였다. 또한 질의의 적대적 예시 데이터를 활용하였을 때, 기존 KorQuAD 1.0 데이터에 대한 성능 향상을 확인하였다.

  • PDF

문제생성훈련 수업이 중학생의 메타인지와 자기효능감 및 문제 수준에 미치는 영향 (The Effects of Question-Creation Training on Metacognition, Self-efficacy and Question Levels)

  • 류수진;김윤석;이지화;문성배
    • 한국과학교육학회지
    • /
    • 제31권2호
    • /
    • pp.225-238
    • /
    • 2011
  • 이 연구는 과학 수업 내용에 대한 이해와 질문을 바탕으로 학생들에게 문제를 만들어보게 하는 훈련을 실시한 수업이 전통적인 수업과 비교해 학업성취도, 메타인지, 자기 효능감에 미치는 영향을 알아보고, 이들 요소들과 함께 만들어낸 문제의 수준이 학업성취수준에 따라 어떻게 변하는지에 대해서도 알아보고자 하였다. 연구 대상은 부산시에 소재한 남자 중학교 2학년 65명을 두 개의 집단으로 나누어 실시하였으며 비교 집단은 전통적인 수업을 실시하였으며, 실험집단은 수업이 끝나기 전 15분 정도 1인당 3개의 문제를 스스로 만들어보고 동료 간에 문제를 풀어보도록 하는 문제생성훈련을 통한 수업을 실시하였다. 사전에 실시된 형성평가를 바탕으로 학생들의 성취수준을 상위 중위 하위의 3개 집단으로 나누고 사전 메타인지 검사와 자기 효능감 검사를 실시하였다. 수업 처치가 끝난 후에는 학업성취도 검사, 메타인지 검사, 자기 효능감 검사를 실시하고 이를 분석하기 위해 t-검정을 실시하였으며. 문제수준의 차이를 분석하기 위해서 일원공변량분석(One-way ANCOVA)을 실시하였다. 연구 결과를 보면 문제생성훈련은 메타인지나 자기 효능감 및 학업 성취도에 긍정적인 효과가 있음을 알 수 있었다. 좀 더 상위수준의 문제를 만드는 학생들의 수가 점차 많아짐을 통해 학생들은 성취수준에 상관없이 보다 많은 사고를 필요로 하는 좋은 문제를 만들어 내는 능력을 획득하고 있음을 알 수 있었다.

CNN 알고리즘을 통한 수학 문제 답지 추론 (INFERENCE OF MATHEMATIC PROBLEM BY CNN ALGORITH)

  • 안채령;백재순;김성진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.185-186
    • /
    • 2024
  • 본 논문에서는 CNN 알고리즘을 사용한 수학 문제 답지 추론 모델에 대한 소개를 다룬다. 현재의 학습 보조 서비스 중에서도 질문에 답하는 서비스들이 흔하지만, 수학 문제에 특화된 이미지 기반 답지 추론 서비스는 부족한 상황이다. 본 논문에서는 MathDataset 클래스를 활용하여 수학 문제 이미지와 정답을 연결하는 데이터셋을 생성하고, CNN 알고리즘을 사용하여 모델을 훈련하는 방법을 제시한다.

  • PDF

유사도 기반 이미지 캡션을 이용한 시각질의응답 연구 (Using similarity based image caption to aid visual question answering)

  • 강준서;임창원
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.191-204
    • /
    • 2021
  • 시각질의응답과 이미지 캡셔닝은 이미지의 특징과 문장의 언어적인 특징을 이해하는 것을 요구하는 작업이다. 따라서 두 가지 작업 모두 이미지와 텍스트를 연결해 줄 수 있는 공동 어텐션이 핵심이라고 할 수 있다. 본 논문에서는 MSCOCO 데이터 셋에 대하여 사전 훈련된 transformer 모델을 이용 하여 캡션을 생성한 후 이를 활용해 시각질의응답의 성능을 높이는 모델을 제안하고자 한다. 이때 질 문과 관계없는 캡션은 오히려 시각질의응답에서 답을 맞히는데 방해가 될 수 있기 때문에 질문과의 유사도를 기반으로 질문과 유사한 일부의 캡션을 활용하도록 하였다. 또한 캡션에서 불용어는 답을 맞히는데 영향을 주지 못하거나 방해가 될 수 있기 때문에 제거한 후에 실험을 진행하였다. 기존 시 각질의응답에서 이미지와 텍스트간의 공동 어텐션을 활용하여 좋은 성능을 보였던 deep modular co-attention network (MCAN)과 유사도 기반의 선별된 캡션을 사용하여 VQA-v2 데이터에 대하여 실험을 진행하였다. 그 결과 기존의 MCAN모델과 비교하여 유사도 기반으로 선별된 캡션을 활용했을 때 성능 향상을 확인하였다.