Automatic word sense clustering using collocation for practical sense boundaries

의미 경계의 현실화를 위한 공기정보의 자동 군집화

  • 신사임 (한국과학기술원 전산학과, 전문용어 언어공학연구센터, 언어자원은행) ;
  • 최기선 (한국과학기술원 전산학과, 전문용어 언어공학연구센터, 언어자원은행)
  • Published : 2004.04.01

Abstract

본 논문에서는 다의어의 현실적인 의미 분포의 결정에 대해 이야기 하고자 한다. 수동으로 구축한 의미체계인 사전이나 시소러스들은 그 의미구분의 경개가 모호하고 비현실적인 부분이 많아서 언어처리 시스템의 적용에 문제점으로 지적되고 있다. 그러므로, 본 연구에서는 대용량 코퍼스에서 추출한 공기정보와 자동 군집화 방법들을 사용하여 실질적인 다의어의 의미 경계를 발견하는 방법을 제안하였다. 수동 구축된 사전과 코퍼스 기반 사전의 다의어 의미 분포와 비교해 본 결과, 본 논문에서 제안한 방법의 결과가 코퍼스 기반 사전의 의미 분포와 매우 유사한 결과를 보이는 것을 확인할 수 있었다.

Keywords