Identification of Chinese Maximal Noun Phrase on Different Context Size Settings Using SVMs

SVMs을 이용한 중국어 최장 명사구 자동 식별

  • 윤창호 (포항공대 정보통신대학원 정보처리학과) ;
  • 이금희 (포항공대 컴퓨터공학) ;
  • 정유진 (포항공대 컴퓨터공학) ;
  • 김동일 (중국연변과학기술대학 언어공학연구) ;
  • 이종혁 (포항공대 컴퓨터공학과)
  • Published : 2004.04.01

Abstract

중국어의 명사구는 기본 명사구, 최단 명사구, 최장 명사구 등으로 분류할 수 있다. 최장 명사구를 잘 식별해 낼 수 있다면 구문 분석의 복잡도를 크게 낮추고 구문분석의 성능을 향상시킬 수 있다. 각 단어는 시작 태그(O), 종결 태그(C), 한 단어로 이루어진 구 태그(S), 그 외의 태그(N) 등 4가지로 태깅된다. 본 논문은 서로 다른 윈도우 크기(window size)에 기반한 5가지 SVMs 학습 모델을 구축하고 시스템 합성 방법을 이용하여 중국어 최장 명사구 식별에서 85.17%의 정확률을 보여줬다.

Keywords