Korean Morphological Analysis and Part-Of-Speech Tagging with LSTM-CRF based on BERT

Park, Cheoneum;Lee, Changki;Kim, Hyunki;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2019.10a
/
Pages.34-36
/
2019
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Korean Morphological Analysis and Part-Of-Speech Tagging with LSTM-CRF based on BERT

BERT기반 LSTM-CRF 모델을 이용한 한국어 형태소 분석 및 품사 태깅

Park, Cheoneum (Kangwon National University) ;
Lee, Changki (Kangwon National University) ;
Kim, Hyunki (Electronics and Telecommunications Research institute)

박천음 (강원대학교) ;
이창기 (강원대학교) ;
김현기 (한국전자통신연구원)

Published : 2019.10.10

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

기존 딥 러닝을 이용한 형태소 분석 및 품사 태깅(Part-Of-Speech tagging)은 feed-forward neural network에 CRF를 결합하는 방법이나 sequence-to-sequence 모델을 이용한 방법 등의 다양한 모델들이 연구되었다. 본 논문에서는 한국어 형태소 분석 및 품사 태깅을 수행하기 위하여 최근 자연어처리 태스크에서 많은 성능 향상을 보이고 있는 BERT를 기반으로 한 음절 단위 LSTM-CRF 모델을 제안한다. BERT는 양방향성을 가진 트랜스포머(transformer) 인코더를 기반으로 언어 모델을 사전 학습한 것이며, 본 논문에서는 한국어 대용량 코퍼스를 어절 단위로 사전 학습한 KorBERT를 사용한다. 실험 결과, 본 논문에서 제안한 모델이 기존 한국어 형태소 분석 및 품사 태깅 연구들 보다 좋은 (세종 코퍼스) F1 98.74%의 성능을 보였다.

Keywords

BERT;
LSTM-CRF

Acknowledgement

이 논문은 2019년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행 된 연구임(No.2013-2-00131, 휴먼 지식증강 서비스를 위한 지능진화형 Wise QA 플랫폼 기술 개발)

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

Korean Morphological Analysis and Part-Of-Speech Tagging with LSTM-CRF based on BERT

BERT기반 LSTM-CRF 모델을 이용한 한국어 형태소 분석 및 품사 태깅

Abstract

Keywords

Acknowledgement

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)