Proceedings of the Korea Society for Industrial Systems Conference (한국산업정보학회:학술대회논문집)
- 1997.11a
- /
- Pages.395-403
- /
- 1997
Implementation of Compressing a Korean Lexicon
한국어 사전의 압축 구현
Abstract
한국어 처리의 기본이 되는 형태소 분석을 위한 사전의 효율적인 구성을 위해 각 표제어의 반복 음절수에 의한 방식으로 이를 압축하고 복원하는 알고리즘을 보였다. 사전의 크기에 있어서 25% 줄일 수 있었으며 표제어를 검색할 때 횟수를 36 % 줄일 수 있었다. 아울러 빠른 검색을 위한 이진 사전을 오프셋에 의해 구성하였다.
Keywords