토픽 모형 및 사회연결망 분석을 이용한 한국데이터정보과학회지 영문초록 분석

Kim, Gyuha;Park, Cheolyong

  • 투고 : 2014.12.16
  • 심사 : 2015.01.10
  • 발행 : 2015.01.31


이 논문에서는 텍스트마이닝 (text mining) 기법을 이용하여 한국데이터정보과학회지에 게재된 논문의 영어초록을 분석하였다. 먼저 다양한 방법을 통해 단어-문서 행렬 (term-document matrix)을 생성하고 이를 사회연결망 분석 (social network analysis)을 통해 시각화하였다. 또한 토픽을 추출하기 위한 방법으로 LDA (latent Dirichlet allocation)와 CTM (correlated topic model)을 사용하였다. 토픽의 수, 단어-문서 행렬의 생성방법에 따라 엔트로피 (entropy)를 통해 토픽 추출 모형들의 성능을 비교하였다.


사회연결망 분석;텍스트마이닝;토픽 모형;한국데이터정보과학회지


