근접 문맥정보와 대규모 웹 데이터를 이용한 단어 의미 중의성 해소

  • 강신재 (대구대학교 정보통신대학 컴퓨터IT공학부) ;
  • 강인수 (경성대학교 멀티미디어대학 컴퓨터정보학부)
  • 발행 : 2009.05.08

초록

본 논문은 구글(Google), 워드넷(WordNet)과 같이 공개된 웹 자원과 리소스를 이용한 비교사학습(Unsupervised learning) 방법을 제안하여 단어 의미의 중의성 문제를 해결하고자 한다. 구글 검색 API를 이용하여 단어의 확장된 근접 문맥정보를 추출하고, 워드넷의 계층체계와 synset을 이용하여 단어 의미 구분정보를 자동 추출한 후, 추출된 정보 간 유사도 계산을 통해 중의성을 갖는 단어의 의미를 결정한다.

키워드