한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)
- 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
- /
- Pages.16-18
- /
- 2006
- /
- 1598-5164(pISSN)
품사별 자질을 이용한 한국어 품사부착의 성능 향상
Improving Korean Part-of-speech tagging by Part-of-Speech specific features
- Choi Won-Jong (Natural Language Processing Lab. Korea University) ;
- Lee Do-Gil (Natural Language Processing Lab. Korea University) ;
- Rim Hae-Chang (Natural Language Processing Lab. Korea University)
- 발행 : 2006.06.01
초록
한국어 형태소분석 및 품사부착에서 일부 품사는 높은 중의성으로 인하여 오류가 많으며, 일부 품사가 전체 오류의 대부분을 차지한다. 본 연구에서는 높은 중의성으로 인하여 오류가 많은 품사를 대상으로, 각 품사에 적합한 자질을 이용하여 학습한, 정확률이 높은 분류기를 통계적 방식의 태거와 순차 결합하여 형태소분석/품사부착 성능을 향상하였다. 2003년 세종계획 품사 부착 말뭉치 200만 어절에서 학습하여 평가를 한 결과 기존 통계적 품사 부착기에 비해 정확도는 0.62% 향상되었으며, 오류는 13.12% 감소하였다.
키워드