Parts-Of-Speech Tagging System Using Grammar Rule and Eojeol Relativity

문법 규칙과 어절 상관도를 이용한 품사 태깅 시스템

  • Do, Mi-Sook (Dept. of Computer Engineering and Information Technology, University of Ulsan) ;
  • Choe, Ho-Seop (Dept. of Computer Engineering and Information Technology, University of Ulsan) ;
  • Ock, Cheol-Young (Dept. of Computer Engineering and Information Technology, University of Ulsan)
  • 도미숙 (울산대학교 컴퓨터정보통신공학과) ;
  • 최호섭 (울산대학교 컴퓨터정보통신공학과) ;
  • 옥철영 (울산대학교 컴퓨터정보통신공학과)
  • Published : 2003.11.14

Abstract

본 논문에서는 문법 규칙과 어절 상관도를 이용한 품사 태깅 시스템을 제안한다. 원시 말뭉치와 품사태그 부착 말뭉치에서 중의 어절(ambiguity eojeol)의 앞뒤 어휘와 품사 정보를 파악하여 문법 규칙을 마련하였으며, 한국어의 품사와 문장성분적 요소를 고려한 7개의 어절 태그를 설정하여 이 어절 태그간의 확률값을 이용해 어절간의 상관도를 구하였다. 이러한 방법들을 이용하여 품사 태깅을 실험한 결과, 150 만 어절의 학습 말뭉치와 3 만 어절의 실험 말뭉치에서 각각 평균 92%와 91%의 정확률을 보였다.

Keywords