A Study of Disfluency Processing for Dependency Parsing of Spoken

구어 의존 구문 분석을 위한 비유창성 처리 연구

  • Park, Seokwon (Institute of Language and Information Studies, Yonsei University) ;
  • Choe, Hyonsu (Institute of Language and Information Studies, Yonsei University) ;
  • Han, Jiyoon (Institute of Language and Information Studies, Yonsei University) ;
  • Oh, Taehwan (Institute of Language and Information Studies, Yonsei University) ;
  • Ahn, Euijeong (Institute of Language and Information Studies, Yonsei University) ;
  • Kim, Hansaem (Institute of Language and Information Studies, Yonsei University)
  • 박석원 (연세대학교 언어정보학협동과정) ;
  • 최현수 (연세대학교 언어정보학협동과정) ;
  • 한지윤 (연세대학교 언어정보학협동과정) ;
  • 오태환 (연세대학교 국어국문학과) ;
  • 안의정 (연세대학교 언어정보연구원) ;
  • 김한샘 (연세대학교 언어정보학협동과정)
  • Published : 2019.10.10

Abstract

비유창성(disfluency)은 문어와 같이 정연한 구조로 말하지 못하는 현상 전반을 지칭한다. 이는 구어에서 보편적으로 발생하는 현상으로 구어 의존 구문 분석의 난이도를 상향시키는 요인이다. 본 연구에서는 비유창성 요소 유형을 담화 표지, 수정 표현, 반복 표현, 삽입 표현으로 분류하였다. 또한 유형별 비유창성 요소를 실제 말뭉치에서 어떻게 구문 주석할 것인지를 제안한다. 이와 같은 구어 데이터 처리 방식은 대화시스템 등 구어를 처리해야 하는 도메인에서의 자연언어이해 성능 향상에 기여할 것이다.

Keywords