Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)
- 2004.04b
- /
- Pages.889-891
- /
- 2004
- /
- 1598-5164(pISSN)
Identification of Chinese Maximal Noun Phrase on Different Context Size Settings Using SVMs
SVMs을 이용한 중국어 최장 명사구 자동 식별
Abstract
중국어의 명사구는 기본 명사구, 최단 명사구, 최장 명사구 등으로 분류할 수 있다. 최장 명사구를 잘 식별해 낼 수 있다면 구문 분석의 복잡도를 크게 낮추고 구문분석의 성능을 향상시킬 수 있다. 각 단어는 시작 태그(O), 종결 태그(C), 한 단어로 이루어진 구 태그(S), 그 외의 태그(N) 등 4가지로 태깅된다. 본 논문은 서로 다른 윈도우 크기(window size)에 기반한 5가지 SVMs 학습 모델을 구축하고 시스템 합성 방법을 이용하여 중국어 최장 명사구 식별에서 85.17%의 정확률을 보여줬다.
Keywords