Analysis of Compound Nouns Containing Korean or Foreign Unknown Words

한국어 및 외래어 미등록어를 포함한 복합명사 분석

  • Kim, Myoung-Sun (Div. of Computer and Telecommunications Engineering Yonsei University) ;
  • Ra, Dong-Yul (Div. of Computer and Telecommunications Engineering Yonsei University)
  • 김명선 (연세대학교 컴퓨터정보통신공학부) ;
  • 나동열 (연세대학교 컴퓨터정보통신공학부)
  • Published : 2006.06.02

Abstract

본 논문에서는 미등록어 처리가 강화된 복합명사 분석 기법을 제시한다. 기본적으로 모든 복합명사 내에 한국어나 외래어의 미등록어가 포함되어 있을 수 있다는 가정하에 분석을 시도한다. 따라서 등록어로 구성된 복합명사에 대해서도 미등록어가 포함된 분해 후보가 생성될 수도 있다. 이는 분해 후보의 수를 크게 증가시키는 문제를 일으킨다. 이 문제에 대처하기 위하여 미등록어의 분류에 따라 미등록어로서의 가능성 여부의 판별 및 제거, 분해 후보 상호간의 견제에 의한 제거 등을 이용하였다. 이러한 과정은 정답 후보 선택시에도 영향을 미쳐 정답이 아닌 분해 후보가 선택되는 것을 방지할 수 있으며, 처리 시간을 줄일 수 있는 이점이 있다. 실험 결과 제시된 기법들이 매우 효과적임을 확인할 수 있었다.

Keywords