Pre-Processing of Korean Syntactic Analyzer for Korean to English MT

한영 자동 번역을 위한 한국어 구문 분석 전처리

  • 김영길 (한국전자통신연구원 언어공학연구부 지식처리팀) ;
  • 양성일 (한국전자통신연구원 언어공학연구부 지식처리팀) ;
  • 서영애 (한국전자통신연구원 언어공학연구부 지식처리팀) ;
  • 김창현 (한국전자통신연구원 언어공학연구부 지식처리팀) ;
  • 홍문표 (한국전자통신연구원 언어공학연구부 지식처리팀) ;
  • 최승권 (한국전자통신연구원 언어공학연구부 지식처리팀)
  • Published : 2001.10.01

Abstract

형태소 해석 결과 생성되는 형태소 옅은 구문 분석을 수행하기에는 적절하지 않은 구문 단위로 구성되어 있는 경우가 많으며 이로 인해 구문 분석기가 불필요한 연산을 수행하여 과도한 구문 트리를 생성하는 원인이 된다. 따라서 본 논문에서는 한영 자동 번역의 한국어 구문 분석기 성능 향상 및 자연스러운 대역문 생성을 위하여 시간 부사구와 명사구에 대한 구묶음을 위한 구문 분석 전처리 방법을 제안하며 이를 위한 각 구 단위의 대역 패턴을 정의한다. 방송자막 및 매뉴얼 문장을 대상으로 실험한 결과, 각 문장 구문 단위를 평균적으로 26% 정도 감소시킴으로써 불필요한 파스 트리의 생성을 배제하여 구문 분석기의 성능을 향상시킬 수 있었다.

Keywords