분석 배제 정보와 후절어를 이용한 한국어 명사추출

Korean Noun Extraction Using Exclusive Segmentation Information and Post-noun morpheme sequences

  • 이도길 (고려대학교 컴퓨터과학과) ;
  • 류원호 (고려대학교 컴퓨터과학과) ;
  • 임해창 (고려대학교 컴퓨터과학과)
  • 발행 : 2000.06.01

초록

명사 추출기는 정보검색, 문서분류, 문서요약, 정보추출 등의 분야에서 사용되고 있으며, 정확한 명사 추출과 빠른 색인 속도는 이들 시스템 성능과 밀접한 관계가 있다. 한국어에서 명사를 추출하기 위해서는 형태소 분석이 필요한데, 본 논문에서는 대량의 품사부착된 말뭉치로부터 추출한 분석배제 정보와 후절어를 이용함으로써 형태소 분석을 생략하거나 보다 단순한 처리에 의해 명사를 추출하는 방법을 제안한다. 실험결과에 의하면, 제안된 방법에 의한 명사추출기는 비교적 높은 정확률과 재현율을 나타내며, 빠른 속도를 보였다.

키워드