Named-entity Recognition Using Bidirectional LSTM CRFs

Bidirectional LSTM CRFs를 이용한 한국어 개체명 인식

  • Song, Chi-Yun (Department of Software Engineering, Gachon University) ;
  • Yang, Sung-Min (Department of Software Engineering, Gachon University) ;
  • Kang, Sangwoo (Department of Software Engineering, Gachon University)
  • 송치윤 (가천대학교 소프트웨어학과) ;
  • 양성민 (가천대학교 소프트웨어학과) ;
  • 강상우 (가천대학교 소프트웨어학과)
  • Published : 2017.10.13

Abstract

개체명 인식은 문서 내에서 고유한 의미를 갖는 인명, 기관명, 지명, 시간, 날짜 등을 추출하여 그 종류를 결정하는것을 의미한다. Bidirectional LSTM CRFs 모델은 연속성을 갖는 데이터에 가장 적합한 RNN기반의 심층 학습모델로서 개체명 인식 연구에 가장 우수한 성능을 보여준다. 본 논문에서는 한국어 개체명 인식을 위하여 Bidirectional LSTM CRFs 모델을 사용하고, 입력 자질로 단어뿐만 아니라 품사 임베딩 모델과, 개체명 사전을 활용하여 입력 자질을 구성한다. 또한 입력 자질에 대한 벡터의 크기를 최적화 하여 기본 모델보다 성능이 향상되었음을 증명하였다.

Keywords