Using Lexical Co-occurrence Information in Syntactic Analysis

구문 분석에서의 어휘간 공기 정보의 활용

  • Yoon, Jun-Tae (Department of Computer Science, CAIR KAIST) ;
  • Choi, Key-Sun (Department of Computer Science, CAIR KAIST) ;
  • Kim, Seon-Ho (Department of Computer Science, Engineering Science Yonsei University) ;
  • Song, Man-Suk (Department of Computer Science, Engineering Science Yonsei University)
  • 윤준태 (한국과학기술원 인공지능연구센터) ;
  • 최기선 (한국과학기술원 인공지능연구센터) ;
  • 김선호 (연세대학교 공과대학 컴퓨터과학과) ;
  • 송만석 (연세대학교 공과대학 컴퓨터과학과)
  • Published : 1998.10.09

Abstract

구문 분석에 있어서 어휘 정보는 구문적 중의성을 해결하는 데 매우 중요한 역할을 한다. 본 논문에서는 대량의 말뭉치로부터 추출된 공기 정보가 구문 분석에서 효과적으로 이용될 수 있음을 보인다. 첫째, 공기 정보로부터 보다 의미있는 연어를 추출하고 이를 구문 분석에 이용함으로써 보다 효율적인 파서의 구축이 가능함을 밝힌다. 둘째로는 대량의 말뭉치로부터 추출한 공기 정보가 구문 분석시 보조사나 조사 생략에 의한 격 중의성 혹은 관계 관형절에서 발생하는 명사구 이동에 따른 격 중의성의 해결에 적용될 수 있음을 보인다. 이를 위해 본 연구에서는 연세대학교 한국어 사전 편찬실의 연세 말뭉치 3,000만 어절과 KAIST 말뭉치 중 1,000만 어절로부터 <서술어, 명사, 격관계> 공기 정보를 추출하였다.

Keywords