Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 1999.10e
- /
- Pages.209-214
- /
- 1999
- /
- 2005-3053(pISSN)
Phrase-Pattern-based Korean-to-English Machine Translation System using Two Level Word Selection
두단계 대역어선택 방식을 이용한 구단위 패턴기반 한영 기계번역 시스템
- Kim, Jung-Jae (Department of Computer Science, KORTERM, Korea Advanced Institute of Science and Technology) ;
- Park, Jun-Sik (Department of Computer Science, KORTERM, Korea Advanced Institute of Science and Technology) ;
- Choi, Key-Sun (Department of Computer Science, KORTERM, Korea Advanced Institute of Science and Technology)
- Published : 1999.10.08
Abstract
패턴기반기계번역방식은 원시언어패턴과 그에 대한 대역언어패턴들의 쌍을 이용하여 구문분석과 변환을 수행하는 기계번역방식이다. 패턴기반 기계번역방식은 번역할 때 발생하는 애매성을 해소하기 위해 패턴의 길이를 문장단위까지 늘이기 때문에, 패턴의 수가 급증하는 문제점을 가진다. 본 논문에서는 패턴의 단위를 구단위로 한정시킬 때 발생하는 애매성을 해소하는 방법으로 시소러스를 기반으로 한 두단계 대역어 선택 방식을 제안함으로써 효과적으로 애매성을 감소시키면서 패턴의 길이를 줄이는 모델을 제시한다. 두단계 대역어 선택 방식은 원시언어의 한 패턴에 대해 여러 가능한 목적언어의 대역패턴들이 있을 때, 첫 번째 단계에서는 원시언어 내에서의 제약조건에 맞는 몇가지 대역패턴들을 선택하고, 두번째 단계에서는 목적언어 내에서의 제약조건에 가장 적합한 하나의 대역패턴을 선택하는 방식이다. 또한 본 논문에서는 이와 같은 모델에서 패턴의 수가 코퍼스의 증가에 따른 수렴가능성을 논한다.
Keywords