A Study on Term Life Cycle for Science & Technology Terms -Focused on 'ETNEWS' Corpus-

과학기술 용어에 대한 용어 생명주기 고찰 -전자신문 말뭉치를 중심으로-

  • Published : 2006.11.10

Abstract

Keeping pace with the speed of development of science & technology domain, the domain terms continuously repeat the step of creation and extinction. This study tries to define term life cycle and analyze extracted terms from a large corpus with the viewpoint. We chose 'ETNEWS' corpus which includes about 17 million Eojeols for 12 years because it is easy to inspect the transition of term life cycle and the corpus represents computer, IT, and electrotechnology domains. This study acquired several useful conclusions including the relation between specificity and life of terms. We expect that term life cycle will contribute to analyze the competition of similar technologies and determine which term be registered into general dictionary.

과학기술 분야에서의 기술 발전 속도에 맞추어 해당 분야의 용어 역시 생성과 소멸을 끊임없이 반복한다. 본 연구에서는 아직까지 체계적으로 다루어지고 있지 않은 용어 생명주기를 정의하고 다양한 관점으로 대용량 말뭉치에서 추출된 용어들을 분석함으로써 그 필요성을 주장하고자 한다. 용어 추출을 위한 대상으로서 12년 분량의 1,700여만 어절을 포함하는 전자신문 말뭉치를 선정하였는데, 그 이유는 여러 기간에 걸친 말뭉치이므로 용어 생명주기 추이를 파악하기 용이하며, 기술 발전이 빠른 대표적인 분야인 컴퓨터/IT/전기 전자를 포함하고 있기 때문이다. 본 연구를 통해 기간에 따른 용어 생명주기 변화, 용어 수명과 전문성과의 관계 등 여러 분석 결과를 얻었으며, 앞으로 일반 사전에의 등재 여부를 결정이나 유사 기술 간의 경쟁 구도를 분석 등 다양한 응용 분야에 활용될 것으로 기대 한다.

Keywords