DOI QR코드

DOI QR Code

Comparison of Automatic Score Range Prediction of Korean Essays Using KoBERT, Naive Bayes & Logistic Regression

KoBERT, 나이브 베이즈, 로지스틱 회귀의 한국어 쓰기 답안지 점수 구간 예측 성능 비교

  • Cho, Heeryon (Humanities Research Institute, Chung-Ang University) ;
  • Im, Hyeonyeol (Da Vinci College of General Education, Chung-Ang University) ;
  • Cha, Junwoo (Humanities Research Institute, Chung-Ang University) ;
  • Yi, Yumi (Humanities Research Institute, Chung-Ang University)
  • 조희련 (중앙대학교 인문콘텐츠연구소) ;
  • 임현열 (중앙대학교 다빈치교양대학) ;
  • 차준우 (중앙대학교 인문콘텐츠연구소) ;
  • 이유미 (중앙대학교 인문콘텐츠연구소)
  • Published : 2021.05.12

Abstract

한국어 심층학습 언어모델인 KoBERT와, 확률적 기계학습 분류기인 나이브 베이즈와 로지스틱 회귀를 이용하여 유학생이 작성한 한국어 쓰기 답안지의 점수 구간을 예측하는 실험을 진행하였다. 네가지 주제('직업', '행복', '경제', '성공')를 다룬 답안지와 점수 레이블(A, B, C, D)로 쌍을 이룬 학습데이터 총 304건으로 다양한 자동분류 모델을 구축하여 7-겹 교차검증을 시행한 결과 KoBERT가 나이브 베이즈나 로지스틱 회귀보다 약간 우세한 성능을 보였다.

Keywords

Acknowledgement

이 논문은 2017년 대한민국 교육부와 한국연구재단의 지원을 받아 수행된 연구임(NRF-2017S1A6A3A01078538).