한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)
- 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
- /
- Pages.43-49
- /
- 2005
- /
- 2005-3053(pISSN)
용어 클러스터링의 성능 평가
Performance Evaluation for Word Clustering
- Park, Eun-Jin (Department of Computer Engineering, Korea Maritime University) ;
- Kim, Jae-Hoon (Department of Computer Engineering, Korea Maritime University) ;
- Ock, Cheol-Young (School of Computer Engineering & Information Technology, Ulsan University)
- 발행 : 2005.10.21
초록
이 논문에서는 전자 사전의 뜻 풀이말을 이용하여 용어를 자동 분류하는 용어 클러스터링 시스템을 설계하였다. 클러스터링 성능에 영향을 미치는 요소로 자질 선택 자질 표현 그리고 유사도 측정 등이 있다. 이 논문에서는 이러한 요소들이 용어 클러스터링에 미치는 영향을 평가해보았다. 클러스터링 결과를 객관적으로 비교하기 위해서 용어 클러스터링 결과와 한국어 의미 계층망에서 추출한 정답 클러스터를 비교하였다 실험 결과, 용어의 뜻 풀이말만 자질로 사용한 방법보다는 뜻 풀이말 자질을 확장하는 방법이 훨씬 더 좋은 결과를 보였다.
키워드