Concept and Application of Deep learning-based Automatic Spacing

문장 정보를 고려한 딥 러닝 기반 자동 띄어쓰기의 개념 및 활용

  • Cho, Won Ik (Seoul National University, Department of Electrical and Computer Engineering and INMC) ;
  • Cheon, Sung Jun (Seoul National University, Department of Electrical and Computer Engineering and INMC) ;
  • Kim, Ji Won (Seoul National University, Department of Linguistics) ;
  • Kim, Nam Soo (Seoul National University, Department of Electrical and Computer Engineering and INMC)
  • 조원익 (서울대학교, 전기정보공학부 뉴미디어통신공동연구소) ;
  • 천성준 (서울대학교, 전기정보공학부 뉴미디어통신공동연구소) ;
  • 김지원 (서울대학교 언어학과) ;
  • 김남수 (서울대학교, 전기정보공학부 뉴미디어통신공동연구소)
  • Published : 2018.10.12

Abstract

본 논문에서는, 한국어 활용에 있어 중의성을 해소해 주고 심미적 효과를 줄 수 있는 개념인 띄어쓰기를, 교정이 아닌 입력 보조의 관점에서 접근한다. 사람들에게 자판을 통한 텍스트 입력이 언어활동의 보편적인 수단이 되면서 가독성을 포기하고서라도 편의를 택하는 경우가 증가하게 되었는데, 본 연구에서는 그러한 문장들의 전달력을 높여 줄 수 있는 자동 띄어쓰기 및 그 활용 방안을 제시한다. 전체 시스템은 dense word embedding과 딥 러닝 아키텍쳐를 활용하여 훈련되었으며, 사용된 코퍼스는 비표준어 및 비정형을 포함하는 대화체 문장으로 구성되어 user-generate된 대화형 문장 입력의 처리에 적합하다.

Keywords