한국산업정보학회:학술대회논문집 (Proceedings of the Korea Society for Industrial Systems Conference)
- 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
- /
- Pages.208-211
- /
- 2009
근접 문맥정보와 대규모 웹 데이터를 이용한 단어 의미 중의성 해소
- 발행 : 2009.05.08
초록
본 논문은 구글(Google), 워드넷(WordNet)과 같이 공개된 웹 자원과 리소스를 이용한 비교사학습(Unsupervised learning) 방법을 제안하여 단어 의미의 중의성 문제를 해결하고자 한다. 구글 검색 API를 이용하여 단어의 확장된 근접 문맥정보를 추출하고, 워드넷의 계층체계와 synset을 이용하여 단어 의미 구분정보를 자동 추출한 후, 추출된 정보 간 유사도 계산을 통해 중의성을 갖는 단어의 의미를 결정한다.
키워드