A Corpus Formalization for Extracting the Syntactic Relations

구문 관계 지식 추출을 위한 코퍼스 정규화에 대한 연구

  • 조정미 (한국과학기술원, 전산학과) ;
  • 조영환 (한국과학기술원, 전산학과) ;
  • 김길창 (한국과학기술원, 전산학과)
  • Published : 1996.10.11

Abstract

대량의 코퍼스를 이용해 여러 가지 일반적인 언어 현상을 관찰하고, 언어 지식을 자동으로 획득하여 자연 언어 처리의 여러 분야에 이용하는 등의 연구가 활발히 진행되고 있으며, 이에 따라 코퍼스에 대한 필요성이 날로 증가하고 있다. 코퍼스에서 추출할 수 있는 유용한 지식 중의 하나가 구문 관계 지식이다. 그러나 한국어에 자주 나타나는 격이동이나 생략 현상, 복합어의 이형태 등은 정확한 지식 획득을 어렵게 할 뿐 아니라 자료 회귀 문제를 더욱 심화시킨다. 본 논문에서는 한국어의 문법적인 특징을 반영한 코퍼스정규화에 의해 이러한 문제를 해결하고자한다.

Keywords