한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)
- 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
- /
- Pages.219-224
- /
- 2009
- /
- 2005-3053(pISSN)
격틀 구조에 기반한 유사 동사 추출
Similar Verb Words Extraction based on their Case Frame Structure
- Cho, Junghyun (Dept. of Computer Engineering, Hallym University) ;
- Jung, Hyunki (Dept. of Computer Engineering, Hallym University) ;
- Kim, Yu-Seop (Dept. of Computer Engineering, Hallym University)
- 발행 : 2009.10.09
초록
한국어 Propbank를 구축하기 위해서는 유사 동사를 군집화하고 군집에 포함되는 동사들의 구문 및 의미 특성을 모아놓은 정보가 필요하다. 본 연구에서는 이러한 군집화의 초기 단계로써 개별 동사들의 격틀 구조에 기반하여 동사간의 유사도를 추정하여 유사 동사를 추출하고자 하였다. 본 연구는 개별 동사의 격틀 정보를 추출하기 위하여 세종 계획의 용언 사전과 KAIST 언어자원의 동사 격틀 사전을 활용하였다. 또한 격틀을 세분화하여 보다 상세한 격틀 정보를 생성하기 위하여 격틀이 가지고 있는 논항의 특성을 활용하였다. 동사의 유사도를 측정하기 위하여 개별 동사들은 벡터로 표현하였고, 벡터의 원소는 해당 동사가 다른 동사와 세분화된 격틀을 공유하는 정도로 하였다. 실험에서는 두 용언 사전에서 개별적으로 위의 과정을 진행하여 각 동사와 유사한 동사들을 추출하였다.