An Use of the Patterns for an Efficient Example-Based Machine Translation

효율적인 예제 기반 기계번역을 위한 패턴의 사용

  • Lee, Gi-Yeong (Dept. of Computer Science & Engineering, Hanyang University) ;
  • Kim, Han-U (Dept. of Computer Science & Engineering, Hanyang University)
  • 이기영 (한양대학교 전자계산학과) ;
  • 김한우 (한양대학교 전자계산학과)
  • Published : 2000.05.01

Abstract

An example-based machine translation approach is a new paradigm for resolving various problems caused by the rules of conventional rule-based machine translation. But, in pure example-based machine translation, it is very hard to find similar examples matched with input sentences by using reasonable parallel corpus. This problem causes large overheads in the process of sentence generation. This paper proposes new method of English-Korean transfer using both patterns and examples. The patterns are composed of sentence patterns and phrase patterns. Meta parts of the patterns make the example-based machine translation more practical by raising the probability to find similar examples. The use of patterns and examples can reduce the ambiguities in source language analysis and give us a high quality of MT. And experimental results with a test corpus are discussed.

예제 기반 기계번역 기법은 기존의 규칙 기반 기계번역에서 발생되는 다양한 문제점들을 해결하기 위해 제안된 새로운 기계번역 패러다임이다. 하지만 기존의 순수 예제 기반 기계번역의 경우 적당한 크기의 병렬 코퍼스를 사용하여 입력문과 거의 유사한 예문을 발견하는데는 한계가 있으며, 이러한 점이 번역문 생성 단계에서 부담으로 작용하게 된다. 본 논문에서는 예제 기반 기계번역 기법의 문제점을 보완하기 위한 새로운 대안으로서 패턴과 예문을 함께 사용하여 영한 변환을 수행하는 새로운 영한 변환 기법을 제안한다. 패턴은 크게 문장 패턴과 구 패턴으로 구분되며, 패턴의 메타 부분은 유사 예문 발견 확률을 높여서 예제 기반 기계 번역 기법을 보다 실용적으로 만들어준다. 실험 결과 기존의 표층 어휘 비교에 의한 순수 예제 기반 기계번역에 비해 비교적 적은 양의 예문을 가지고도 유사 예문 발견 확률이 높다는 것을 알 수 있었다.

Keywords

References

  1. Nagao. M., 'A Framework of a mechanical translation between Japanese and English by Analogy principle,' A. Elithorn and R. Barnerji, eds., Artificial and Human Intelligence, pp.173-180, 1984
  2. S. Nirenburg, C. Domashnev, D. J. Grannes, 'Two Approach to Matching in Example-Based Machine Translation,' Proceeding of TMl'93, pp.47 -57, 1993
  3. 佐藤 理史, '實例に基づく飜譯', 情報處理, Vol.33, No.6, pp.673-681, 1992
  4. 古? 藏, 隅田 英一郞, 飯田 仁, '變換主導型機械 飜譯の實現手法,' 自然言語處理80-8, pp.1-8, 1990
  5. 古? 藏, 飯田 仁, '變換と解析の協調的處理によゐ飜譯手法,' 自然言語處理87-4, pp.27-34, 1992
  6. Osamu Furuse and Hitoshi IIDA, 'Constituent Boundary Parsing for Example-Based Machine Translation,' Proceeding of COLING94, pp.105-111, 1994 https://doi.org/10.3115/991886.991902
  7. Koich Takeda, 'Pattern-Based Context-Free Grammars for Machine Translation,' http://xxx.lanl.gov/cmp-lg/ https://doi.org/10.3115/981863.981883
  8. Hideo Watanabe, 'A Method for Extracting Translation Patterns from Translation Examples', Proceeding of TMl'93, pp.292-301, 1993
  9. 佐藤 理史, アナロヅ-による機械飜譯, 共立出版株式會社, 1997
  10. 이호석, 김영택, '영한 변환사전 생성을 위한 말뭉치에 기반한 연어와 관용어의 자동 추출,' 한국정보과학회논문지, 제21권, 제11호, pp.2110-2117, 1934
  11. 서병락, 김영택, '한영 기계 번역을 위한 번역 패턴에 기반한 영어 문장 생성기,' 한국정보과학회논문지, 제23권, 제5호, pp.520-529, 1996
  12. 김나리, 김영택, '한국어 동사 패턴에 기반한 한국어 문장 분석과 한영 변환의 모호성 해결,' 한국정보과학회논문지, 제23권, 제7호, pp.766-775, 1996
  13. 송영빈, 최기선, '일한 문형사전을 위한 구문연구,' 제10회 한글 및 한국어 정보처리 학술대회, pp.295-303, 1998