DOI QR코드

DOI QR Code

The Method of Using the Automatic Word Clustering System for the Evaluation of Verbal Lexical-Semantic Network

동사 어휘의미망 평가를 위한 단어클러스터링 시스템의 활용 방안

  • 김혜경 (부산대학교 인지과학협동과정) ;
  • 윤애선 (부산대학교 불어불문학과, 인지과학협동과정)
  • Published : 2006.09.01

Abstract

For the recent several years, there has been much interest in lexical semantic network However it seems to be very difficult to evaluate the effectiveness and correctness of it and invent the methods for applying it into various problem domains. In order to offer the fundamental ideas about how to evaluate and utilize lexical semantic networks, we developed two automatic vol·d clustering systems, which are called system A and system B respectively. 68.455.856 words were used to learn both systems. We compared the clustering results of system A to those of system B which is extended by the lexical-semantic network. The system B is extended by reconstructing the feature vectors which are used the elements of the lexical-semantic network of 3.656 '-ha' verbs. The target data is the 'multilingual Word Net-CoroNet'. When we compared the accuracy of the system A and system B, we found that system B showed the accuracy of 46.6% which is better than that of system A. 45.3%.

References

  1. 김혜경, 윤애선. 2006. 동사 어휘의미망의 반자동 구축을 위한 사전정의문의 중심어 추출. '언어와 정보'. 10(1)
  2. 이경순. 2001. '정보검색에서 벡터공간 검색과 클러스터 분석을 통한 문서 순위 결정 모델'. 한국과학기술원 전자전산학과 박사학위논문
  3. 조현양, 최성필. 2004. 계층적 결합형 문서 클러스터링 시스템과 복합명사 색인방법과의 연관관계 연구. '한국문헌정보학회지'. 38(4): 179-192
  4. Baeza-Yates, Ricardo, and Berthier. Ribeiro-Neto. 1999. Modern Information Retrieval, ACM Press.
  5. Ikehara, Satoru. et al. 1997. The Semantic System, volume 1 of Goi-Taikei -- A Japanese Lexicon. Iwanami Shoten
  6. Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski, 2000, DATA MINING Methods for Knowledge Discovery, Kluwer Academic Publishers
  7. 김혜경, 최기선, 윤애선. 2005. ‘[-하]동사류’ 어휘의미망 구축을 위한 사전 정의문 분석. '한국사전학회 제 7회 학술대회 발표논문집', 153-169
  8. 한국과학기술원 전문용어언어공학연구센터. 2005. '다국어 어휘의미망'. KAIST PRESS
  9. 박석문. 2000. '코퍼스 품사 태깅 매뉴얼'. 한국과학기술원
  10. 신중호, 박혁로, 이기호. 1993. 단어의 유사성 척도와 클러스터링 알고리즘. '한국 인지과학회 논문지'. 9(2)
  11. Fellbaum, Christiane. 1998. Wordnet: An Electronic Lexical Database. MIT Press.
  12. 한글학회. 1991. '우리말큰사전'. 어문각
  13. 김준수. 2004. '의미정보와 시소러스를 이용한 한국어 어휘 중의성 해소 모델'. 울산대학교 컴퓨터정보통신공학과 박사학위논문
  14. 최준호. 2004. '의미적 멀티미디어 정보검색을 위한 개념간 유사도 측정 방법'. 조선대학교 전자계산학과 박사학위논문
  15. Dong, Zhendong, and Quiang. Dong. 2006. How-Net and the Computation of Meaning. World Scientific Publishing
  16. 기민호. 2001. '단어클러스터링 기반 정보처리 도구 개발 기술'. 정보통신부 우수신기술 지정 . 지원 사업 최종 보고서
  17. 옥철영. 2005. 한국어 Wordnet 구축: 명사를 중심으로. '한국언어정보학회 2005 정기 학술대회 발표 논문집', 1-15
  18. 최호섭, 옥철영. 2002. 한국어 의미망 구축과 활용. '한국어학'. 17: 301-329
  19. Vossen, Piek. 2005. EuroWordNet General Document