DOI QR코드

DOI QR Code

워드 임베딩 기반 연구 논문 분류 기법

Research Paper Classification Scheme based on Word Embedding

  • 비스와스 딥또 (대구가톨릭대학교 컴퓨터소프트웨어학과) ;
  • 길준민 (대구가톨릭대학교 컴퓨터소프트웨어학부)
  • Dipto, Biswas (Dept. of Computer Software Engineering, Daegu Catholic University) ;
  • Gil, Joon-Min (School of Computer Software Engineering, Daegu Catholic University)
  • 발행 : 2021.11.04

초록

텍스트 분류(text classification)는 원시 텍스트 데이터로부터 정보를 추출할 수 있는 기술에 기반하여 많은 양의 텍스트 데이터를 관심 영역으로 분류하는 것으로 최근에 각광을 받고 있다. 본 논문에서는 워드 임베딩(word embedding) 기법을 이용하여 특정 분야의 연구 논문을 분류하고 추천하는 기법을 제안한다. 워드 임베딩으로 CBOW(Continuous Bag-of-Word)와 Sg(Skip-gram)를 연구 논문의 분류에 적용하고 기존 방식인 TF-IDF(Term Frequency-Inverse Document Frequency)와 성능을 비교 분석한다. 성능 평가 결과는 워드 임베딩에 기반한 연구 논문 분류 기법이 TF-IDF에 기반한 연구 논문 분류 기법보다 좋은 성능을 가진다는 것을 나타낸다.

키워드

과제정보

이 논문은 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(No. NRF-2019R1F1A1062039).