Optional features for speeding up UTagger

UTagger의 속도 향상을 위한 선택적 기능제한

  • Published : 2012.10.06

Abstract

UTagger는 한국어 의미 처리를 위해 개발된 형태소분석기이며 의미 분열 기능도 가지고 있다. 정확률이 매우 높고 다앙한 기능을 갖추고 있으나 이전에 개발된 다른 형태소 분석기에 비하여 속도가 느리다는 단점을 가지고 있었다. 형태소 분석기의 빠른 속도는 많은 분야에서 요구되고 있기 때문에 본 논문에서는 UTagger의 정확률을 유지하면서 속도를 향상시키는 캐시(Cache) 방법과, 정확률을 조금 낮추면서 향상시키는 다앙한 방법들을 제시한다. 또한 상황에 따라 적합한 방법을 선택할 때 참조가 되도록 하기 위해 각 방법들 실험 결과를 정리한다.

Keywords