A Case Study on Universal Dependency Tagsets of Japanes

일본어의 Universal Dependency 태그셋 적용 사례 연구 - 한국어와의 비교를 중심으로

  • Lee, Jin (Interdisciplinary Graduate Program of Linguistics and Informatics, Yonsei University) ;
  • Han, Jiyoon (Interdisciplinary Graduate Program of Linguistics and Informatics, Yonsei University) ;
  • Kim, Hansaem (Institution of Language & Information Studies, Yonsei University)
  • 이진 (연세대학교 언어정보학 협동과정) ;
  • 한지윤 (연세대학교 언어정보학 협동과정) ;
  • 김한샘 (연세대학교 언어정보연구원)
  • Published : 2018.10.12

Abstract

한국어는 교착어적 특성으로 인하여 어미와 조사가 매우 발달되어 있다. 그러므로 영어와 같은 굴절어를 중심으로 설계된 UD를 한국어에 적용하는 것에는 많은 어려움이 있다. 이를 해결하기 위해서 형태통사적 특성이 유사한 일본의 UD 적용 사례를 살펴보고 한국어의 UD 적용 양상과의 비교 분석을 통해서 한국어의 UD 적용 및 개선 방안을 고찰해 보고자 한다. 한국어와 일본어는 동일한 교착어로서 비슷한 특성을 지니고 있으나, 주석의 기본 단위 설정에서 차이를 보이면서 UD를 적용하는 양상이 달라졌음을 확인하였다. 일본어의 UD 주석에서 형태 분석 기본 단위인 단단위(Short unit word, 長單位)를 기본 구문 주석 단위로 하되 장단위(Long unit word, 短單位)와 문절 정보를 이용하는 것처럼, 한국어에서도 형태 분석 단위를 기준으로 의존 관계를 주석하는 방안에 대해서도 고려할 필요가 있다.

Keywords