Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2016.10a
- /
- Pages.252-256
- /
- 2016
- /
- 2005-3053(pISSN)
On Word Embedding Models and Parameters Optimized for Korean
한국어에 적합한 단어 임베딩 모델 및 파라미터 튜닝에 관한 연구
- Choi, Sanghyuk (Seoul National University) ;
- Seol, Jinseok (Yonsei University) ;
- Lee, Sang-goo (Seoul National University)
- Published : 2016.10.07
Abstract
본 논문에서는 한국어에 최적화된 단어 임베딩을 학습하기 위한 방법을 소개한다. 단어 임베딩이란 각 단어가 분산된 의미를 지니도록 고정된 차원의 벡터공간에 대응 시키는 방법으로, 기계번역, 개체명 인식 등 많은 자연어처리 분야에서 활용되고 있다. 본 논문에서는 한국어에 대해 최적의 성능을 낼 수 있는 학습용 말뭉치와 임베딩 모델 및 적합한 하이퍼 파라미터를 실험적으로 찾고 그 결과를 분석한다.