A Study of Korean State Adverb ordering Using Clusters

클러스터 분석을 통한 한국어 양태부사 어순에 관한 연구

  • 이신원 (전북과학대학 컴퓨터정보계열) ;
  • 황호전 (전북대학교 전자정보공학부) ;
  • 김법균 (전북대학교 전자정보공학부) ;
  • 안동언 (전북대학교 전자정보공학부) ;
  • 정성종 (전북대학교 전자정보공학부) ;
  • 두길수 (서남대학교 전기전자공학부)
  • Published : 2003.04.01

Abstract

본 연구에서는 영한 기계 번역 시스템의 생성단계에서 자연스러운 어순의 연속된 부사를 생성하기 위하여 클러스터링 기법을 이용하여 부사의 어순을 결정해 보고자 한다. 먼저 국문학자가 분류해 놓은 부사의 자질 정보를 살펴보고 그 자질 정보에 대한 부사의 어순을 살펴본다. 그 중에서 양태부사에 대한 어순 정보가 부사 어순 결정에 중요한 요인이 됨으로 양태부사에 대해서만 어순을 다루기로 한다. 통합 국어정보베이스에 수록된 한국어 구문구조 부착 망뭉치를 사용하여 연속 부사를 추출하고 그 빈도수를 추출하여 부사의 자질 정보를 부여한다. 부여된 부사의 자질 정보를 가지고 부사-부사 유사도를 계산하고 이 유사도에 기반하여 양태부사들을 재분류한다. 그리고, 양태부사의 어순 비율과 클러스터링을 통해서 세분류한 어순의 비율을 제시한다.

Keywords