Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2000.10d
- /
- Pages.331-336
- /
- 2000
- /
- 2005-3053(pISSN)
A Morph Analyzer For MATES/CK
중한 기계 번역 시스템을 위한 형태소 분석기
- Kang, Won-Seok (AITrc, KAIST) ;
- Kim, Ji-Hyoun (KORTERM, KAIST) ;
- Song, Young-Mi (KORTERM, KAIST) ;
- Song, Hee-Jung (KORTERM, KAIST) ;
- Huang, Jin-Xia (KORTERM, KAIST) ;
- Chae, Young-Soog (KORTERM, KAIST) ;
- Choi, Key-Sun (KORTERM, KAIST)
- 강원석 (한국과학기술원, 첨단정보기술연구센터) ;
- 김지현 (한국과학기술원, 전문용어언어공학연구센터) ;
- 송영미 (한국과학기술원, 전문용어언어공학연구센터) ;
- 송희정 (한국과학기술원, 전문용어언어공학연구센터) ;
- 황금하 (한국과학기술원, 전문용어언어공학연구센터) ;
- 채영숙 (한국과학기술원, 전문용어언어공학연구센터) ;
- 최기선 (한국과학기술원, 전문용어언어공학연구센터)
- Published : 2000.10.13
Abstract
MATES/CK는 기계번역 시스템에서 전통적으로 사용하고 있는 세 단계(분석/변환/생성)에 의해서 중한 번역을 수행하는 시스템이다. MATES/CK는 시스템 성능을 높이기 위해 패턴 기반과 통계적 정보를 이용한다. 태거(Tagger)는 중국어 단어 분리를 최장일치법으로 수행하기 때문에 일부 단어에 대해 오류를 범하게 되고 품사(POS : Part Of Speech) 태깅 시 확률적 정보만 이용하여 특정 단어가 다 품사인 경우 그 단어에 대해 특정 품사만 태깅되는 문제점이 발생한다. 또한 중국어 및 외국어 인명 및 지명에 대한 미등록들에 대해서도 올바른 결과를 도출하지 못한다. 사전에 있어서 텍스트 기반으로 존재하여 이를 관리하기에 힘이 든다. 본 논문에서는 단어 분리 오류 및 품사 태깅 오류를 해결하기 위해 중국어 태깅 제약 규칙을 적용하는 방법을 제시하고 중국어 및 외국어 인명/지명에 대한 미등록어 처리방법을 제시한다. 또한 중국어 사전 관리에 대해 알아본다.
Keywords