Korean BaseNP Identification Model using Forward and Backward Processing Characteristics

방향성을 이용한 한국어 비재귀 명사구 인식 모델

  • Lee, Sheen-Mok (Department of Electrical Engineering & Computer Science, Division of Computer Science, KAIST) ;
  • Kang, In-Ho (Department of Electrical Engineering & Computer Science, Division of Computer Science, KAIST) ;
  • Kim, Gil-Chang (Department of Electrical Engineering & Computer Science, Division of Computer Science, KAIST)
  • 이신목 (한국과학기술원 전자전산학과) ;
  • 강인호 (한국과학기술원 전자전산학과) ;
  • 김길창 (한국과학기술원 전자전산학과)
  • Published : 2001.10.12

Abstract

비재귀 명사구(baseNP)는 단순한 단어 패턴과 품사 패턴에 의하여 쉽게 인식되므로, 자연어처리의 다양한 분야에서 활용한다. 교착어의 지배 성분 후위 원칙에 의하여 한국어 비재귀 명사구 인식은 보다 많은 광역 정보를 필요로 하므로, 본 논문에서는 광역 정보의 활용이 쉬운 상태 기반 모델을 사용한다. 본 논문은 상태 기반의 한국어 비재귀 명사구 인식에서 방향성을 고려한다. 교착어의 특성상 한국어 비재귀 명사구는 처음 위치가 끝 위치에 비하여 인식이 어려운 특징을 가지므로 방향성을 고려하여 오른쪽 우선의 방범을 활용한 경우, 모델의 특성 및 성능이 변화한다. 본 논문에서는 기존의 왼쪽 우선 방법과 새로이 제안하는 오른쪽 우선 방법을 각각 적용하고, 양 방법을 통합하는 방법들을 제안한다. 통합 결과 92.55%의 정확률과 90.90%의 재현률을 얻었다.

Keywords