한국인지과학회:학술대회논문집 (Proceedings of the Korean Society for Cognitive Science Conference)
- 한국인지과학회 2000년도 한글 및 한국어 정보처리
- /
- Pages.19-25
- /
- 2000
분석 배제 정보와 후절어를 이용한 한국어 명사추출
Korean Noun Extraction Using Exclusive Segmentation Information and Post-noun morpheme sequences
초록
명사 추출기는 정보검색, 문서분류, 문서요약, 정보추출 등의 분야에서 사용되고 있으며, 정확한 명사 추출과 빠른 색인 속도는 이들 시스템 성능과 밀접한 관계가 있다. 한국어에서 명사를 추출하기 위해서는 형태소 분석이 필요한데, 본 논문에서는 대량의 품사부착된 말뭉치로부터 추출한 분석배제 정보와 후절어를 이용함으로써 형태소 분석을 생략하거나 보다 단순한 처리에 의해 명사를 추출하는 방법을 제안한다. 실험결과에 의하면, 제안된 방법에 의한 명사추출기는 비교적 높은 정확률과 재현율을 나타내며, 빠른 속도를 보였다.
키워드