한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)
- 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
- /
- Pages.439-441
- /
- 2005
- /
- 1598-5164(pISSN)
수식어구를 이용한 한국어 용어의 전문성 측정
Measuring the Specificity of Korean Terms Using Modifiers
- 구희관 (과학기술연합대학원대학교 응용정보과학) ;
- 정한민 (한국과학기술정보연구원 차세대정보시스템연구실) ;
- 이병희 (한국과학기술정보연구원 차세대정보시스템연구실) ;
- 성원경 (한국과학기술정보연구원 차세대정보시스템연구실)
- Koo Heekwan (Practical Information Science, UST) ;
- Jung Hanmin (Information System Research Lab., KISTI) ;
- Lee Byeong-Hee (Information System Research Lab., KISTI) ;
- Sung Won-Kyung (Information System Research Lab., KISTI)
- 발행 : 2005.07.01
초록
용어의 전문성은 전문용어의 판넬 기준을 정하고 그 계층구조를 밝히는데 유용하다. 본 논문에서는 말뭉치로부터 추출한 한국어 용어의 전문성을 측정하는 효과적인 방법을 제안한다. 말뭉치에서 관형형 전성어미('ㄴ/은/는')가 부여된 전문용어와 함께 출현하는 수식어구는 일반명사의 수식어구보다 제한적인 형태로 나타난다. 이런 점에 착안하여 본 논문에서는 수식어구를 포함하는 문맥정보에 대해 엔트로피를 측정하여 용어의 전문성을 측정하였다. 이를 위해 한국어 수식어구를 분석하고 기존 전문성 측정 방법에서 간과되어진 수식어구 출현빈도를 고려하여 엔트로피를 상대적 비율로 계산함으로써 한국어에 적합한 전문성 측정을 하였다. 400만 어절의 신문 말뭉치에서 추출한 전문용어와 ETRI 시소러스를 이용하여 실험을 해 본 결과 본 논문에서 제안하는 한국어 용어 전문성 측정방법이 효과적임을 알 수 있었다.
키워드