Term Extraction and Ranking for Building Term Dictionary

전문용어사전 구축을 위한 전문용어 추출 및 순위화

  • 구희관 (과학기술연합대학원대학교 응용정보과학) ;
  • 정한민 (한국과학기술정보연구원, 차세대정보시스템연구실) ;
  • 이병희 (한국과학기술정보연구원, 차세대정보시스템연구실) ;
  • 성원경 (한국과학기술정보연구원, 차세대정보시스템연구실)
  • Published : 2005.05.13

Abstract

전문용어는 특정 분야의 전문가 사이에서 통용되는 표현 매체이며, 일반용어에 비해 생성과 소멸의 주기가 짧은 특징을 가지고 있다. 이런 특징 때문에 일반용어 사전구축과 달리 전문용어 사전을 구축하기 위해서는 신속한 대응전략이 필요하다. 이를 위해 본 논문에서는 전문용어 사전 구축을 위한 다음과 같은 두 단계의 과정을 제안한다. 우선 형태소 후처리와 결합규칙을 이용하여 1,200만 어절의 신문 말뭉치로부터 단일어 10만과 복합어 30만의 용어후보를 추출하고, 고빈도 용어 후보 6만개를 선별해 용어지배지수(Term Dominance Value)라는 개념을 도입하여 전문용어를 선정한다. 실험을 통해 용어지배지수 순위와 누적빈도순위 및 최근연도 순위를 비교한 결과 본 논문에서 제안한 용어지배지수가 전문용어 활용도를 나타내는 훌륭한 지표역할을 할 수 있음을 확인할 수 있었다.

Keywords