Enhancement of Word Clustering through Feature Extension

자질 확장에 따른 용어 클러스터링의 성능 향상

  • Park Eun-Jin (Department of Computer Engineering, Korea Maritime University.) ;
  • Kim Jae-Hoon (School of Computer Engineering & Information Technology, Ulsan University.) ;
  • Ock Cheol-Young (School of Computer Engineering & Information Technology, Ulsan University.)
  • 박은진 (한국해양대학교 컴퓨터공학과) ;
  • 김재훈 (울산대학교 컴퓨터정보통신공학부) ;
  • 옥철영 (울산대학교 컴퓨터정보통신공학부)
  • Published : 2005.11.01

Abstract

이 논문에서는 용어 클러스터링의 성능에 직접적인 영향을 주는 자질 확장에 따른 시스템의 성능 변화를 보았다. 객관적인 성능 비교를 위하여 용어 클러스터링 결과와 한국어 의미 계층망에서 추출한 클러스터를 비교하였다. 실험 결과, 용어의 뜻 풀이말을 자질로 사용한 경우보다 자질을 확장한 방법(Bigram, Case)이 성능이 좋게 나왔으며, 자질확장 시에 사용되는 말뭉치의 추출방법에 따라 다른 성능을 보였는데, 단순히 Bigram 정보를 사용하여 확장한 것 보다는 동사의 격 관계(Case)정보를 이용한 것이 성능이 좋게 나왔다.

Keywords