OpenNMT를 활용한 한글 존댓말 변환기의 구현

Implementation of Korean Honorific Converter Using OpenNMT

  • 정준녕 (금오공과대학교 컴퓨터공학과) ;
  • 김상영 (금오공과대학교 컴퓨터공학과) ;
  • 김성태 (금오공과대학교 컴퓨터공학과) ;
  • 이정재 (금오공과대학교 컴퓨터공학과) ;
  • 정유철 (금오공과대학교 컴퓨터공학과)
  • Jeong, Jun-Nyeong (Dept. of Computer Engineering, Kumoh National Institute of Technology) ;
  • Kim, Sang-Yeong (Dept. of Computer Engineering, Kumoh National Institute of Technology) ;
  • Kim, Seong-Tae (Dept. of Computer Engineering, Kumoh National Institute of Technology) ;
  • Lee, Jeong-Jae (Dept. of Computer Engineering, Kumoh National Institute of Technology) ;
  • Jung, Yuchul (Dept. of Computer Engineering, Kumoh National Institute of Technology)
  • 발행 : 2021.01.20

초록

최근 발전한 인공신경망 기반 기계 번역은 번역 시 더 자연스러운 번역을 제공한다. 본 논문에서는 기계번역기법을 이용하여 반말 표현을 존댓말 표현으로 변환하는 기법을 제안한다. 특히, 이를 위해 DCInside의 게시판을 크롤링하고 AI-HUB 데이터와 합쳐 약 20,000개의 자체 데이터 셋을 구축하였으며, 한글 전처리를 위한 4가지 기법 및 OpenNMT 프레임웍의 LSTM 및 Transformer 모듈을 활용하여 실험을 진행하였다. 이를 통해, 반말 표현을 높임 표현으로 변환하는 최적조합을 확인하였으며, 검증시 BLUE점수로 최대 66.53를 획득하였다.

키워드