Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2002.10e
- /
- Pages.92-97
- /
- 2002
- /
- 2005-3053(pISSN)
Construction of Korean Verb Wordnet Using Preexisting Noun Wordnet and Monolingual Dictionary
명사 워드넷과 단일어 사전을 이용한 한국어 동사 워드넷 구축
- Lee, Ju-Ho (KOTERM, Dept. of CS, Korea Advanced Institute of Science and Technology) ;
- Bae, Hee-Suk (Korea Research Institute of Standard and Science) ;
- Kim, Eun-Hye (KOTERM, Dept. of CS, Korea Advanced Institute of Science and Technology) ;
- Kim, Hye-Kyong (KOTERM, Dept. of CS, Korea Advanced Institute of Science and Technology) ;
- Choi, Key-Sun (KOTERM, Dept. of CS, Korea Advanced Institute of Science and Technology)
- 이주호 (한국과학기술원 전산학과 전문용어언어공학연구센터) ;
- 배희숙 (한국표준연구원) ;
- 김은혜 (한국과학기술원 전산학과 전문용어언어공학연구센터) ;
- 김혜경 (한국과학기술원 전산학과 전문용어언어공학연구센터) ;
- 최기선 (한국과학기술원 전산학과 전문용어언어공학연구센터)
- Published : 2002.10.11
Abstract
의미기반 정보 검색, 자연어 질의 응답, 지식 자동 습득, 담화 처리 등 높은 수준의 자연언어처리 시스템에서 의미처리를 위한 대용량의 지식 베이스가 필요하다. 이러한 지식 베이스 중에서 가장 기본적인 것이 워드넷이다. 이러한 워드넷을 이용함으로써 여러 의미 사이의 의미 유사도를 구할 수 있고, 속성을 물려받을 수 있기 때문에 비슷한 속성을 가진 의미들을 한꺼번에 다루는 데 유용하다. 본 논문에서는 기본 어휘를 바탕으로 기존의 명사 워드넷과 단일어 사전을 이용하여 한국어 동사 워드넷을 구축하는 방법을 제시한다. 본 논문에서 1차 작업을 통하여 구축한 동사 워드넷에는 동사 1,757개에 대한 4,717개의 의미(중복을 포함하면 모두 5,235개의 의미)를 포함하고 있으며 특별히 의미가 많이 편중된 14개의 개념에 속한 571개의 의미를 53개의 세부 개념으로 재분류하여 최종적으로 모두 767개의 계층적 개념으로 구성된 동사 워드넷이 만들어 졌다.
Keywords