Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 1999.10d
- /
- Pages.13-22
- /
- 1999
- /
- 2005-3053(pISSN)
Morphological Analyzer and Tagger Evaluation Contest(MATEC 99) Overview
형태소분석기 및 품사 태거 평가대회(MATEC99) 개요
- Lee, Jae-Sung (Knowledge Information Department, Computer and Software Technology Laboratories, ETRI) ;
- Park, Jay-Duke (Knowledge Information Department, Computer and Software Technology Laboratories, ETRI) ;
- Cha, Keon-Hoe (Knowledge Information Department, Computer and Software Technology Laboratories, ETRI) ;
- Park, Se-Young (Knowledge Information Department, Computer and Software Technology Laboratories, ETRI)
- 이재성 (ETRI 컴퓨터소프트웨어연구소 지식정보연구부) ;
- 박재득 (ETRI 컴퓨터소프트웨어연구소 지식정보연구부) ;
- 차건회 (ETRI 컴퓨터소프트웨어연구소 지식정보연구부) ;
- 박세영 (ETRI 컴퓨터소프트웨어연구소 지식정보연구부)
- Published : 1999.10.08
Abstract
한국어 정보처리에서 기본 모듈로 많이 사용되는 형태소분석기, 태거 및 명사추출기에 대한 객관적인 평가를 위해서는 실제 사용되는 언어에 대한 평가기준과 방대한 양의 평가자료 구축이 필수적이다. 전자통신연구원(ETRI)에서는 표준적인 평가기준과 평가자료(말뭉치)를 구축하여 "제 1회 형태소분석기 및 품사 태거 평가대회" 을 개최하였으며, 이 대회는 학습기간을 포함하여 1999년 6월 7일부터 10월 1일까지 진행되었다. 평가에는 총 15개팀이 참가하였고, 명사추출, 태거, 형태소분석기의 각 분야에 대해 약 25만 4천어절의 학습 말뭉치를 제공한 후, 시험말뭉치 약3만 3천어절에 대해 평가가 이루어졌다. 이 글에서는 이 대회의 취지, 진행과정, 평가 방식, 평가결과 등에 대해 소개한다.
Keywords