Exploiting Features of Writer's Intent in Automatic Spacing

자동 띄어쓰기에서 글쓴이 의도를 반영한 자질의 활용

  • Lee, Jeong-wook (Dept. of Computer Engineering and Interdisciplinary Major of Maritime AI Convergence, Korea Maritime & Ocean University) ;
  • Kim, Jae-Hoon (Dept. of Computer Engineering and Interdisciplinary Major of Maritime AI Convergence, Korea Maritime & Ocean University)
  • 이정욱 (한국해양대학교, 컴퓨터공학과 및 해양인공지능융합전공) ;
  • 김재훈 (한국해양대학교, 컴퓨터공학과 및 해양인공지능융합전공)
  • Published : 2021.10.14

Abstract

띄어쓰기에 대한 오류는 한국어 처리 전반에 영향을 주므로 자동 띄어쓰기는 필수적인 요소이다. 글쓴이의 대부분은 띄어쓰기 오류를 범하지 않으므로 글쓴이의 의도가 띄어쓰기 시스템에 반영되어야 한다. 그러나 대부분의 자동 띄어쓰기 시스템은 모든 띄어쓰기 정보를 제거하고 새로이 공백문자를 추가하는 방법으로 띄어쓰기를 수행한다. 이런 문제를 완화하기 위해서 본 논문에서는 기계학습에서 글쓴이의 의도가 반영된 자질을 추가하는 방법을 제안한다. 실험을 위해서 CRFs(Conditional Random Fields)를 사용하여 기존 시스템과 사용자의 의도를 반영한 띄어쓰기 시스템과의 성능을 비교하고 분석한다.

Keywords