Korean Machine Reading Comprehension using Continual Learning

Continual Learning을 이용한 한국어 기계독해

  • Shin, JoongMin (Dept. of Information Convergence Engineering Pusan National University) ;
  • Cho, Sanghyun (Dept. of Information Convergence Engineering Pusan National University) ;
  • Choi, Jaehoon (Dept. of Information Convergence Engineering Pusan National University) ;
  • Kwon, Hyuk-Chul (Dept. of Information Convergence Engineering Pusan National University)
  • 신중민 (부산대학교 정보융합공학과) ;
  • 조상현 (부산대학교 정보융합공학과) ;
  • ;
  • 권혁철 (부산대학교 정보융합공학과)
  • Published : 2021.10.14

Abstract

기계 독해는 주어진 지문 내에서 질문에 대한 답을 기계가 찾아 답하는 문제이다. 딥러닝에서는 여러 데이터셋을 학습시킬 때에 이전에 학습했던 데이터의 weight값이 점차 사라지고 사라진 데이터에 대해 테스트 하였을때 성능이 떨어진 결과를 보인다. 이를 과거에 학습시킨 데이터의 정보를 계속 가진 채로 새로운 데이터를 학습할 수 있는 Continual learning을 통해 해결할 수 있고, 본 논문에서는 이 방법을 MRC에 적용시켜 학습시킨 후 한국어 자연어처리 Task인 Korquad 1.0의 MRC dev set을 통해 성능을 측정하였다. 세 개의 데이터셋중에서 랜덤하게 5만개를 추출하여 10stage를 학습시킨 50K 모델에서 추가로 Continual Learning의 Learning without Forgetting를 사용하여 학습시킨 50K-LWF 모델이 F1 92.57, EM 80.14의 성능을 보였고, BERT 베이스라인 모델의 성능 F1 91.68, EM 79.92에 비교하였을 때 F1, EM 각 0.89, 0.22의 향상이 있었다.

Keywords