Design of Verb-Phrase Patterns for Korean-to-English MT

한영 자동 번역을 위한 동사구 번역패턴의 활용

  • 양성일 (한국전자통신연구원 언어공학연구부 지식처리팀) ;
  • 김영길 (한국전자통신연구원 언어공학연구부 지식처리팀) ;
  • 서영애 (한국전자통신연구원 언어공학연구부 지식처리팀) ;
  • 김창현 (한국전자통신연구원 언어공학연구부 지식처리팀) ;
  • 홍문표 (한국전자통신연구원 언어공학연구부 지식처리팀) ;
  • 최승권 (한국전자통신연구원 언어공학연구부 지식처리팀)
  • Published : 2001.10.01

Abstract

원시언어 문장의 구조 분석을 기반으로 하는 기계번역 시스템에서 원시언어의 최소 의미 단위는 동사를 중심으로 한 단문으로 생각할 수 있다. 단문 단위 대역어를 지정하기 위해서는 동사구 번역패턴의 사용이 요구된다. 본 논문에서는 한국어 단문 내 격 정보와 번역을 위한 의미 제약조건을 기술하여 한영 기계번역 시스템에서 사용하는 동사구 번역패턴을 정의하고, 문장 정규화를 통한 동사구 번역패턴의 활용방법을 제안한다. 동사구 번역패턴은 단문 구조 파악을 위한 제약 조건부와 대역어 선정부로 나뉜다. 제약 조건부는 단문 구조 번역을 위한 최소한의 의미 제약만으로 기술되며, 격조사로 구분되는 격 정보를 갖는다. 이러한 격 정보는 원시언어인 한국어의 단문 분석을 위해 사용되며 분석결과에 대해 단문 단위 대역어를 지정한다. 동사구 번역 패턴은 실제 말뭉치에서의 사용을 반영하기 위해 병렬 말뭉치로부터 구축되며 실험을 통해 예측되는 패턴의 규모를 알아볼 수 있다.

Keywords