Generative Chatting Model based on Index-Term Encoding and Syllable Decoding

색인어 인코딩과 음절 디코딩에 기반한 생성 채팅 모델

  • Kim, JinTae (Kangwon National University Computer and Communication Engineering) ;
  • Kim, Sihyung (Kangwon National University Computer and Communication Engineering) ;
  • Kim, HarkSoo (Kangwon National University Computer and Communication Engineering) ;
  • Lee, Yeonsoo (NCSOFT Corp.) ;
  • Choi, Maengsic (NCSOFT Corp.)
  • 김진태 (강원대학교 컴퓨터정보통신공학과) ;
  • 김시형 (강원대학교 컴퓨터정보통신공학과) ;
  • 김학수 (강원대학교 컴퓨터정보통신공학과) ;
  • 이연수 ((주)엔씨소프트) ;
  • 최맹식 ((주)엔씨소프트)
  • Published : 2017.10.13

Abstract

채팅 시스템은 사람이 사용하는 자연어를 이용해 컴퓨터와 대화를 하는 시스템이다. 한국어 특성상 대화체에서 동일한 의미를 가졌지만 다른 형태를 가진 경우가 많다. 본 논문에서는 Attention mechanism Encoder-Decoder Model을 사용해 한국어 특성에 맞는 효과적인 생성 모델을 만들 수 있는 입력, 출력 단위를 제안한다. 실험에서 정성 평가와 ROUSE, BLEU 평가를 진행한 결과 형태소 단위의 입력 보다 본 논문에서 제안한 색인어 입력 단위의 성능이 높고, 의사 형태소 단위 출력 보다 음절 단위 출력을 사용한 시스템이 더 문법적 오류가 적고 적합한 응답을 생성하는 것을 보였다.

Keywords