Customization for English-Korean Spoken Language Machine Translation

영한 대화체 자동번역을 위한 특화 방안

  • Lee, Ki-Young (Natural Language Processing Team, Electronics and Telecommunications Research Institute) ;
  • Roh, Yoon-Hyung (Natural Language Processing Team, Electronics and Telecommunications Research Institute) ;
  • Kwon, Oh-Woog (Natural Language Processing Team, Electronics and Telecommunications Research Institute) ;
  • Choi, Sung-Kwon (Natural Language Processing Team, Electronics and Telecommunications Research Institute) ;
  • Kim, Young-Gil (Natural Language Processing Team, Electronics and Telecommunications Research Institute)
  • 이기영 (한국전자통신연구원 언어처리연구팀) ;
  • 노윤형 (한국전자통신연구원 언어처리연구팀) ;
  • 권오욱 (한국전자통신연구원 언어처리연구팀) ;
  • 최승권 (한국전자통신연구원 언어처리연구팀) ;
  • 김영길 (한국전자통신연구원 언어처리연구팀)
  • Published : 2009.10.09

Abstract

현재, 자동번역의 도메인은 응용 프로그램의 요구에 따라, 점차 문어체에서 대화체(spoken language)로 옮겨가고 있는 추세이다. 본 논문은 대화체가 지니는 특성을 자동번역 시스템을 구성하는 각 모듈별 및 지식 관점에서 분석하였다. 특성 분석을 기반으로 하여, 본 논문에서는 여행 영역을 대상으로 하는 대화체 자동번역시스템의 특화를 수행하였다. 대화체 자동번역을 위한 새로운 지식으로 구조화 번역메모리(Translation Memory)가 도입되었으며, 시스템을 구성하는 각 모듈별로 대화체 특화가 이루어졌다. 또한 기존의 문어체용 기구축 패턴 등이 정비되었으며, 고빈도 대화체 표현에 대한 신규 패턴이 도입되었다. 제안하는 방법의 검증을 위해 수동평가를 수행하였으며, 그 결과, 영한 대화체 자동번역에 있어서 번역률 향상이 있었다.

Keywords