DOI QR코드

DOI QR Code

상호정보량의 정규화에 대한 연구

A Study on Relative Mutual Information Coefficients

  • 이재윤 (연세대학교 문헌정보학과)
  • 발행 : 2003.12.01

초록

상호정보량은 용어간 유사도 산출을 비롯한 다양한 분야에서 연관성 척도로 사용되어왔다. 그러나 값의 범위가 일정하지 않으며 지나치게 저빈도인 경우를 선호하는 경향이 제한점으로 지적되고 있다. 이런 점을 보완하기 위해서 상호정보량을 정규화하는 상대적 상호정보량 계수를 제안하였다. 제안된 계수의 특성을 알아본 다음, 세 실험집단을 대상으로 전역적(global) 질의확장 검색을 수행한 결과 검색 성능을 향상시킬 수 있었다.

Mutual information as an association measure, has been used for various purposes as well as for calculating term similarity. There we, however, some limits in mutual information. It tends to emphasize low frequency terms extremely because the marginal value of mutual information changes inversely to frequency of terms. To compensate for this limit this study suggests relative mutual information(RMI) coefficients which normalize mutual information, and examines their characteristics in some details. The RMI coefficients also improve effectiveness of global query expansion when they are adapted to three different collections.

키워드

참고문헌

  1. 박사학위논문, 한국과학기술원 자연언어 정보검색에서 상호정보를 이용한 2단계 문서순위 결정 방법 강현규
  2. 제4회 한글 및 한국어 정보처리 학술대회 논문집 시소러스 작성을 위한 개념 획득 도구 김명철;이운재;최기선;김길창
  3. 정보관리학회지 v.11 no.1 자동색인기 성능시험을 위한 Test Set 개발 김성혁;서은경;이원규;김명철;김영환;김재군
  4. 석사학위논문, 계명대학교 정보 검색에서 상호 정보를 이용한 문서 순위의 재조정 김정세
  5. 제12회 한글 및 한국어 정보처리 학술대회 논문집 한국어 테스트 컬렉션 HANTEC의 확장 및 보완 김지영;장동현;맹성현;이석훈;서정현;김현
  6. 박사학위논문, 서울대학교 한국어 정보 검색을 위한 상호 정보량에 기반한 복합어 자동 색인 김판구
  7. 95 가을 한국정보과학회 학술발표논문집 품사태깅된 말뭉치로부터 한국어 연어 추출 이공주;김재훈;김길창
  8. 한국정보과학회 가을 학술발표논문집(Ⅰ) 유사계수에 따른 전역적 질의 확장 검색 성능 비교 이재윤
  9. 제10회 한국정보관리학회 학술대회 논문집 질문 유형에 따른 이터넷 검색엔진의 성능 비교 이재윤
  10. 박사학위논문, 충남대학교 교차언어 정보검색에서 상호정보를 이용한 사전기반 질의변환 장명길
  11. 석사학위논문, 연세대학교 격 관계와 상호정보를 이용한 한국어 의존 파서에 관한 연구 정석원
  12. Information Theory and Coding Abramson, Norman
  13. Proceedings of the University of Vaasa, Discussion Papers No. 44 no.44 Entroy correlation coefficient : a measure of statistical depedence for categorized data Astola, Jaakko;Ilkka Virtanen
  14. Proceedings of the First Text REtrieval Conference (TREC-1) Automatic retrieval with locality information using SMART Buckley, Chris,Gerard Salton;James Allan;D.K.Harman(ed.)
  15. Journal of the American Society for Information Science and Technology v.52 no.4 A corpus-based approch to comparative evaluation of statistical term association measures Chung, Young Mee;Jae Yun Lee https://doi.org/10.1002/1532-2890(2000)9999:9999<::AID-ASI1073>3.0.CO;2-5
  16. Computational Linguistics v.16 no.1 Word assocation norms, mutual information and lexicography Church,K.W.;P.Hanks
  17. Annual Review of Information Science and Technology v.31 Query expansion Efthimiadis,E.N.;M.E.Williams(ed.)
  18. Transmission of Information: A statistical Theory of Communications Fano, Robert M.
  19. Information Processing & Management v.35 no.1 A comparison of collocation-based similarity measures in query expansion Kim,M.C.;K.S.Choi https://doi.org/10.1016/S0306-4573(98)00040-5
  20. SPSS: Statistical Package for the Social Sciences(2nd ed.) Nie,N.H.;C.H.Hull;J.G.Jenkins;K.Steinbrenner;D.H.Bent
  21. IEEE Transactions on Medical Imaging v.16 no.2 Multimodality image registration by masimization of mutual information Maes,F.;A.Collignon;D.Vandermeulen;G.Marchal;P.Suetens https://doi.org/10.1109/42.563664
  22. Information Processing & Management v.36 no.3 Query expansion using heterogeneous thesauri Mandala,R.;T.Tokunaga;H.Tanaka
  23. IEEE Transactions on Medical Imaging v.20 no.3 Elastic registration of fMRI data using Bezier-spline transformations Otte,M. https://doi.org/10.1109/42.918470
  24. IEEE Transactions on Medical Imaging v.22 no.8 Mutual-information-based registration of medical images : s survey Pluim,J.P.W;J.B.A.Maintz;M.A.Viergever https://doi.org/10.1109/TMI.2003.815867
  25. Proceedings fo the 16th Annual International ACM-SIGIR Conference on Research and Development in Information Retrieval Concept based query expansion Qiu,Y.;H.P.Frei
  26. Bell System Technical Journal v.27 A mathematical theory of communication Shannon,C.E. https://doi.org/10.1002/j.1538-7305.1948.tb01338.x
  27. Automatic Information Organization and Retrieval Salton, Gerard
  28. Cluster Analysis Algorithms for Data Reduction and Classification of Objects Spth, Helmuth
  29. Journal of Machine Learning Research v.3 no.Dec Cluster ensembles: A knowledge reuse framework for combining multiple partitions Strehl, Alexznder;Joydeep Ghosh
  30. Ph. D. thesis, University of London Measures of 3D Medical Image Alignment Studholme, Colin
  31. Proceedings of the Fourteenth International Conference on Machine Learning (ICML'97) A comparative study on feature selection in test categorization Yang, Yiming;J.P.Pedersen