한국어 사전의 압축 구현

Implementation of Compressing a Korean Lexicon

  • 임한규 (한서대학교 전산정보학과) ;
  • 박상호 (한서대학교 전산정보학과)
  • 발행 : 1997.11.01

초록

한국어 처리의 기본이 되는 형태소 분석을 위한 사전의 효율적인 구성을 위해 각 표제어의 반복 음절수에 의한 방식으로 이를 압축하고 복원하는 알고리즘을 보였다. 사전의 크기에 있어서 25% 줄일 수 있었으며 표제어를 검색할 때 횟수를 36 % 줄일 수 있었다. 아울러 빠른 검색을 위한 이진 사전을 오프셋에 의해 구성하였다.

키워드