DOI QR코드

DOI QR Code

MOO: A Study on Data Augmentation Method for Korean Math Word Problem Solving

MOO(Mathematical Operation Organizer): 한국어 서술형 수학 문제 자동 풀이를 위한 데이터 증강 기법 연구

  • An, Jisu (Graduate School of Convergence Science and Technology, Seoul National University) ;
  • Ki, Kyung Seo (Graduate School of Convergence Science and Technology, Seoul National University) ;
  • Kim, Jiwon (Graduate School of Convergence Science and Technology, Seoul National University) ;
  • Gweon, Gahgene (Graduate School of Convergence Science and Technology, Seoul National University)
  • 안지수 (서울대학교 융합과학기술대학원) ;
  • 기경서 (서울대학교 융합과학기술대학원) ;
  • 김지원 (서울대학교 융합과학기술대학원) ;
  • 권가진 (서울대학교 융합과학기술대학원)
  • Published : 2022.05.17

Abstract

본 논문에서는 서술형 수학 문제의 자동 풀이 기술 개발을 위한 데이터 증강 기법인 MOO 를 제안한다. 서술형 수학 문제는 일상에서의 상황을 수학적으로 기술한 자연어 문제로, 인공지능 모델로 이 문제를 풀이하는 기술은 활용 가능성이 높아 국내외에서 다양하게 연구되고 있으나 데이터의 부족으로 인해 성능 향상에서의 한계가 늘 존재해 왔다. 본 논문은 이를 해결하기 위해 시중의 수학 문제들을 수집하여 템플릿을 구축하고, 템플릿에 적합한 풀이계획을 생성할 수 있는 중간 언어인 MOOLang 을 통해 생성된 문제에 대응하는 Python 코드 형태의 풀이와 정답을 생성할 수 있는 데이터 증강 방법을 고안하였다. 이 기법을 통해 생성된 데이터로 기존의 최고 성능 모델인 KoEPT를 통해 학습을 시도해본 결과, 생성된 데이터셋을 통해 모델이 원활하게 데이터셋의 분포를 학습할 수 있다는 것을 확인하였다.

Keywords

Acknowledgement

이 성과는 2021년도 정부(과학기술정보통신부)의 재원으로 한국연구재단 및 정보통신기획평가원의 지원을 받아 수행된 연구임(No. 2020R1C1C1010162, No. 2021-0-02146)