DOI QR코드

DOI QR Code

KoEPT: Transformer 기반 생성 모델을 사용한 한국어 수학 문장제 문제 자동 풀이

KoEPT: Automatically Solving Korean Math Word Problems using Generative Transformer

  • 임상규 (서울대학교 융합과학기술대학원) ;
  • 기경서 (서울대학교 융합과학기술대학원) ;
  • 김부근 (서울대학교 융합과학기술대학원) ;
  • 권가진 (서울대학교 융합과학기술대학원)
  • Rhim, Sang-kyu (Graduate School of Convergence Science and Technology, Seoul National University) ;
  • Ki, Kyung Seo (Graduate School of Convergence Science and Technology, Seoul National University) ;
  • Kim, Bugeun (Graduate School of Convergence Science and Technology, Seoul National University) ;
  • Gweon, Gahgene (Graduate School of Convergence Science and Technology, Seoul National University)
  • 발행 : 2021.05.12

초록

이 논문에서는 자연어로 구성된 수학 문장제 문제를 자동으로 풀이하기 위한 Transformer 기반의 생성 모델인 KoEPT를 제안한다. 수학 문장제 문제는 일상 상황을 수학적 형식으로 표현한 자연어 문제로, 문장제 문제 풀이 기술은 실생활에 응용 가능성이 많아 국내외에서 다양하게 연구된 바 있다. 한국어의 경우 지금까지의 연구는 문제를 유형으로 분류하여 풀이하는 기법들이 주로 시도되었으나, 이러한 기법은 다양한 수식을 포괄하여 분류 난도가 높은 데이터셋에 적용하기 어렵다는 한계가 있다. 본 논문은 이를 해결하기 위해 우선 현존하는 한국어 수학 문장제 문제 데이터셋인 CC, IL, ALG514의 분류 난도를 측정한 후 5겹 교차 검증 기법을 사용하여 KoEPT의 성능을 평가하였다. 평가에 사용된 한국어 데이터셋들에 대하여, KoEPT는 CC에서는 기존 최고 성능과 대등한 99.1%, IL과 ALG514에서 각각 89.3%, 80.5%로 새로운 최고 성능을 얻었다. 뿐만 아니라 평가 결과 KoEPT는 분류 난도가 높은 데이터셋에 대해 상대적으로 개선된 성능을 보였다.

키워드

과제정보

이 성과는 2020년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(No. 2020R1C1C1010162).