Korean Parsing using Machine Learning Techniques

기계학습 기법을 이용한 한국어 구문분석

  • Lee, Yong-Hun (Department of Computer Science and Engineering Division of Electrical and Computer Engineering Pohang University of Science and Technology) ;
  • Lee, Jong-Hyeok (Department of Computer Science and Engineering Division of Electrical and Computer Engineering Pohang University of Science and Technology)
  • 이용훈 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과) ;
  • 이종혁 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과)
  • Published : 2008.06.30

Abstract

최근의 구문분석 연구는 컴퓨터 성능 향상과 사용 가능한 대량의 구문분석 말뭉치 증가, 견고한 기계학습 기법 개발 등에 힘입어 통계적인 모델 연구가 꾸준히 증가하고 있다. 본 논문에서는 기존에 개발된 다양한 기계학습 기법 중 ME(Maximum Entropy) 모델과 SVM(Support vector machine) 모델을 이용한 한국어 구문분석 방법을 제안한다. 국어정보베이스(KIBS) 구문분석 말뭉치를 가지고 실험한 결과 SVM 모델을 이용한 한국어 구문분석기가 기존의 확률 기반 통계적 한국어 구문분석기의 성능보다도 최대 1.84% 높은 87.46%의 의존관계 결정 정확률을 보였다. 추후 언어지식을 반영한 다양한 자질들을 이용할 경우 성능 향상이 기대된다.

Keywords