Lexical Expansion of Sentence Parsers

구문분석기의 어휘확장

  • Kim, Min-Chan (School of Computer Engineering and Information Technology, University of Ulsan) ;
  • Kim, Gon (School of Computer Engineering and Information Technology, University of Ulsan) ;
  • J. Bae, Jae-Hak (School of Computer Engineering and Information Technology, University of Ulsan)
  • 김민찬 (울산대학교 컴퓨터 정보통신공학부) ;
  • 김곤 (울산대학교 컴퓨터 정보통신공학부) ;
  • 배재학 (울산대학교 컴퓨터 정보통신공학부)
  • Published : 2005.05.13

Abstract

본 논문에서는 구문분석기의 어휘확장을 통해 구문분석의 성공률을 높이고자 하였다. 구문분석은 문장내 구성성분들이 가지는 통사적인 관련성을 파악하는 작업이다. 구문분석 실패의 가장 빈번한 원인 중의 하나는 미등록 어휘의 출현이다. 결여된 어휘문제를 해결하는 것은 구문분석의 성공률을 높이고, 원문이해 시스템을 보다 더 견고하게 하는데 관건으로 작용한다. 이를 위하여, 본 논문에서는 구분분석기 LGPI+ 의 어휘 사전에 존재하지 않는 단어들을 또 다른 어휘자원인 WordNet을 이용하여 해결하고자 하였다. 구체적으로는, (1) 미등록 어휘를 WordNet에서 찾고, (2) 그 유의어 정보를 파악하여, (3) LGPI+ 어휘사전에 추가한다. 실험을 통하여 구문분석의 실패를 해결하고, 정확도와 성공률을 높일 수 있음을 확인하였다.

Keywords