An Effective Approach Using Sentence Symbols to Identify Maximal-Length Noun Phrase in Chinese

문장부호를 사용한 효과적인 중국어 최장명사구 식별기법

  • Bai Xue-Mei (Dept. of Graduate school of for information technology, Pohang University of Science and Technology) ;
  • Li Jin-Ji (Dept of Computer Science and Engineering, Pohang University of Science and Technology) ;
  • Jin Mei-Xun (Dept of Computer Science and Engineering, Pohang University of Science and Technology) ;
  • Cheng You-Jin (Dept of Computer Science and Engineering, Pohang University of Science and Technology) ;
  • Lee Jong-Hyeok (Dept of Computer Science and Engineering, Pohang University of Science and Technology)
  • 백설매 (포항공과대학교 정보통신대학원 정보처리학과) ;
  • 이금희 (포항공과대학교 컴퓨터공학과) ;
  • 김미훈 (포항공과대학교 컴퓨터공학과) ;
  • 정유진 (포항공과대학교 컴퓨터공학과) ;
  • 이종혁 (포항공과대학교 컴퓨터공학과)
  • Published : 2005.07.01

Abstract

일반적으로 중국어의 명사구는 최단명사구, 기본명사구 최장명사구로 분류된다. 최장명사구에 대한 정확한 식별은 문장의 전체적인 구조를 파악하고 문장의 정확한 지배용언을 찾아내는데 중요한 역할을 한다. 본 논문에서는 특성에 따라 5개의 클래스로 세분화된 문장부호를 학습자질로 사용하여 최장명사구 자동식별을 진행한다. 제안된 기법은 평균길이가 4인 최장명사구의 식별실험에서 기본모델(baseline)보다 $4.5\%$ 향상된 평균 $85.1\%$의 우수한 F-measure 성능을 보인다.

Keywords