한국어 의미역 결정을 위한 Korean PropBank 확장 및 도메인 적응 기술 적용

Extending Korean PropBank for Korean Semantic Role Labeling and Applying Domain Adaptation Technique

  • 배장성 (강원대학교 컴퓨터과학과) ;
  • 오준호 (강원대학교 컴퓨터과학과) ;
  • 황현선 (강원대학교 컴퓨터과학과) ;
  • 이창기 (강원대학교 컴퓨터과학과)
  • Bae, JangSeong (Dept. of computer science, Kangwon National University) ;
  • Oh, JunHo (Dept. of computer science, Kangwon National University) ;
  • Hwang, HyunSun (Dept. of computer science, Kangwon National University) ;
  • Lee, Changki (Dept. of computer science, Kangwon National University)
  • 발행 : 2014.10.07

초록

한국어 의미역 결정(Semantic Role Labeling)은 주로 기계 학습에 의해 이루어지며 많은 말뭉치 자원을 필요로 한다. 그러나 한국어 의미역 결정 시스템에서 사용되는 Korean PropBank는 의미역 부착 말뭉치와 동사 격틀이 영어 PropBank의 1/8 수준에 불과하다. 따라서 본 논문에서는 한국어 의미역 결정 시스템을 위해 의미역 부착 말뭉치와 동사 격틀을 확장하여 Korean PropBank를 확장 시키고자 한다. 의미역 부착 말뭉치를 만드는 일은 많은 자원과 시간이 소비되는 작업이다. 본 논문에서는 도메인 적응 기술을 적용해보고 기존의 학습 데이터를 활용하여, 적은 양의 새로운 학습 말뭉치만을 가지고 성능 하락을 최소화 할 수 있는지 실험을 통해 알아보고자 한다.

키워드