A Morph Analyzer For MATES/CK

중한 기계 번역 시스템을 위한 형태소 분석기

  • 강원석 (한국과학기술원 첨단정보기술연구센터(AITrc)) ;
  • 김지현 (한국과학기술원 전문용어언어공학연구센터(KORTERM)) ;
  • 송영미 (한국과학기술원 전문용어언어공학연구센터(KORTERM)) ;
  • 송희정 (한국과학기술원 전문용어언어공학연구센터(KORTERM)) ;
  • 황금하 (한국과학기술원 전문용어언어공학연구센터(KORTERM)) ;
  • 채영숙 (한국과학기술원 전문용어언어공학연구센터(KORTERM)) ;
  • 최기선 (한국과학기술원 전문용어언어공학연구센터(KORTERM))
  • Published : 2000.06.01

Abstract

MATES/CK는 기계번역 시스템에서 전통적으로 사용하고 있는 세 단계(분석/변환/생성)에 의해서 중한 번역을 수행하는 시스템이다. MATES/CK는 시스템 성능을 높히기 위해 패턴 기반과 통계적 정보를 이용한다. 태거(Tagger)는 중국어 단어 분리를 최장일치법으로 수행하기 때문에 일부 단어에 대해 오류를 범하게 되고 품사(POS : Part Of Speech) 태킹 시 확률적 정보만 이용하여 특정 단어가 다 품사인 경우 그 단어에 대해 특정 품사만 태깅되는 문제점이 발생한다. 또한 중국어 및 외국어 인명 및 지명에 대한 미등록들에 대해서도 올바른 결과를 도출하지 못한다. 사전에 있어서 텍스트 기반으로 존재하여 이를 관리하기에 힘이 든다. 본 논문에서는 단어 분리 오류 및 품사 태깅 오류를 해결하기 위해 중국어 태킹 제약 규칙을 적용하는 방법을 제시하고 중국어 및 외국어 인명/지명에 대한 미등록어 처리방법을 제시한다. 또한 중국어 사전 관리에 대해 알아본다.

Keywords