Word Sense Disambiguation of Korean Verbs Using Weight Information from Context

가중치 정보를 이용한 한국어 동사의 의미 중의성 해소

  • Lim, Soo-Jong (Department of Computer Science, Yonsei University) ;
  • Park, Young-Ja (Department of Computer Science, Yonsei University) ;
  • Song, Man-Suk (Department of Computer Science, Yonsei University)
  • 임수종 (연세대학교 컴퓨터과학과) ;
  • 박영자 (연세대학교 컴퓨터과학과) ;
  • 송만석 (연세대학교 컴퓨터과학과)
  • Published : 1998.10.09

Abstract

본 논문은 문맥에서 추출한 가중치 정보를 이용한 한국어 동사의 의미 중의성 해소 모델을 제안한다. 중의성이 있는 단어가 쓰인 문장에서 그 단어의 의미 결정에 영향을 주는 단어들로 의미 결정자 벡터를 구성하고, 사전에서 그 단어의 의미 항목에 쓰인 단어들로 의미 항목 벡터를 구성한다. 목적 단어의 의미는 두 벡터간의 유사도 계산에 의해 결정된다. 벡터간의 유사도 계산은 사전에서 추출된 공기 관계와 목적 단어가 속한 문장에서 추출한 거리와 품사정보에 기반한 가중치 정보를 이용하여 이루어진다. 4개의 한국어 동사에 대해 내부실험과 외부실험을 하였다. 내부 실험은 84%의 정확률과 baseline을 기준으로 50%의 성능향상, 외부 실험은 75%의 정확률과 baseline을 기준으로 40 %의 성능향상을 보인다.

Keywords