Word Classification and Data Structure for Korean Morphological Analysis

한국어 형태소 분석을 위한 단어 유형 분류와 자료구조

  • Kang, Seung-Shik (School of Information and Computer Engineering, Hansung University)
  • 강승식 (한성대학교 정보전산학부)
  • Published : 1996.10.11

Abstract

한국어 정보처리 시스템은 유형별로 다양한 형태의 형태소 분석 정보를 필요로 하는데 이를 위하여 한국어의 단어 유형을 분류하고 형태소 분석 결과를 효율적으로 저장하는 자료구조를 제안한다. 형태소 분석에 필요한 단어 유형은 일반적인 유형과 단순화된 유형으로 구분하여 비교하였으며, 이를 기반으로 형태소 분석을 위한 새로운 단어 구성 전이도를 제시하였다. 형태소 분석 결과를 저장하는 자료구조는 HAM에서 사용되고 있는 자료구조를 기반으로 응용시스템에서 필요로 하는 정보를 쉽게 사용할 수 있도록 보완하고 저장 공간의 효율성을 개선하였다.

Keywords