A Theoretical Study on Indexing Methods using the Metadata for the Automatic Construction of a Thesaurus Browser

시소러스 브라우저 자동구현을 위한 Metadata를 이용한 색인어 처리방안에 대한 연구

  • 서휘 (창원전문대학 문헌정보과)
  • Published : 2004.12.01

Abstract

This paper is intended to present the theoretical analyses on automatic indexing, which is vital in the process of constructing a thesaurus browser, and clustering algorithms to construct hierarchical relations among terms as well as the methods for the automatic construction of a thesaurus browser. The methods to select the index term automatically in the web documents are studied by surveying the methods for analyzing and processing metadata which conforms to bibliographical roles of traditional paper documents in web documents. Also, the result of the study suggests to adding or involving the metadata in web documents, using the metadata automatic editor because metadata is not listed in most of the web documents.

본 연구에서는 시소러스 브라우저를 자동으로 구성하기 위한 방법에 대한 이론적인 연구와 함께 시소러스 브라우저 구성과정의 핵심인 자동색인과 용어 간 계층을 자동으로 형성하는 클러스터링 알고리즘에 대한 선행 연구결과를 제시하였다. 그리고 웹 문헌에서 전통적인 종이 형태 문헌의 서지사항에 해당하는 메타데이터를 분석하고 이를 처리하는 방안을 조사함에 의해 웹 문헌에서 색인어를 자동으로 추출할 수 있는 방안에 대하여 연구하였다. 또한 대부분의 웹 문헌에 메타데이터가 수록되어 있지 않음에 착안하여 기존의 웹 문헌에 메타데이터 자동 편집기를 이용하여 메타데이터를 수록하는 방안에 대한 연구결과를 제시하였다.

Keywords

References

  1. H. Albrechtsen, 'PRESS : A Thesaurus-based Information System for Software Reuse,' Proceedings of the Study Conference on Classification Reseach,Vo1.5(1992), p.140
  2. W. Schnmitz-Esser, 'New Approaches in Thesaurus Application,' Intematior Classification, Vo1.18, No.3(1991), pp.144-145
  3. F. W. Lancaster,정보검색시스템. 윤구호, 김태승 공역(서울 : 구미무역, 1985), pp.314-315
  4. F. W. Lancaster, Vocabulary Control for Information Retrieval, 2nd ed.(VIrginia : Informtion Resources Press, 1986), pp.165-169
  5. D. Soergel, Organizing Informtion,Principles of Database and Retrieval System(New York : Academic Press, 1985), pp.222-224
  6. M Bates, 'Subject Access in Online Catalogs : A Design Model,' JASIS, 37(1986), p.366.
  7. F. W. Lancaster,정보검색시스템,p.313
  8. Moid A. Siddiqui, 'Full-Text Database,' Online Review, Vol.15, No.6(1991), p.369
  9. E. J. Mckinin. et al., 'The Medline/full-text Tesearch Project,' JASIS, Vol.42, No.4(1991), p.303
  10. C. L. Borgman, 'Why are Online Catalogs still Hard to Use?' JASIS, Vol.47, No.7(1996), pp.493-503 https://doi.org/10.1002/(SICI)1097-4571(199607)47:7<493::AID-ASI3>3.0.CO;2-P
  11. J. Rowley, 'The Controlled versus Natural Indexing Languages Debate Revisited : A Perspective on Information Retrieval Practice and Research,' Journal of Information Science, Vol.20, No.2(1994), pp.115-116
  12. B. H Weinberg, 'Library Classification and Information Retrival Thesauri : Comparison and Contrast,' Cataloging and Classification Quarterly, Vol.19, No.3/4(1995), p.39
  13. Susan Jones et al, 'Interactive Thesaurus Navigation: Intelligence Rules OK?' JASIS, Vol.46, No.1(1995), p.52 https://doi.org/10.1002/(SICI)1097-4571(199501)46:1<52::AID-ASI6>3.0.CO;2-1
  14. 최석두, '매크로시소러스에서의 용어 관리,' 전문용어언어공학센터 전문용어언어정보공학 심포지움, 제1권(1998), p.44
  15. F. W. Lancaster, Vocaulary Control for Information Retrieval, 2nd ed.(Virginia : Information Resources Press, 1986), pp.23-28
  16. 남영준, 색인어형태분석에 의한 한국어 자동색인기법 연구(박사학위논문, 중앙대학교 대학원 문헌정보학과, 1994)
  17. N. Jardine and C. J. Van Rijisbergen, 'The Use of Hierachic Clustering in Information Retrieval,' Infomation Storage and Retrieval, 7(1971), pp.217-226 https://doi.org/10.1016/0020-0271(71)90051-9
  18. Gerald Salton Dynamic Information and Library Processing( New-jersey : Prentice Hall, 1975),p.329
  19. Helen J. Peat and Peter Willett, 'The Limitations of Term Co-Occurrence Data for Query Expansion in Document Retrieval Systems,' JASIS, Vol.42, No.5(1991), pp.378-383 https://doi.org/10.1002/(SICI)1097-4571(199106)42:5<378::AID-ASI8>3.0.CO;2-8
  20. 노정순, '탐색결과에 근거한 자연어질의 자동확장 및 응용에 관한 연구 고찰,' 정보관리학회지, 제16권, 제2호(1999), pp.49-80
  21. C. J. Van Rijisbergen, The Hyper-Textbook of the CJ. Van Rijsgergen's Textbook on Information Retrieval, 1998,
  22. 신현성, 시맨틱 웹을 위한 RDF 편집기(석사학위논문, 경기대학교정보통신대학원, 2002), p.26
  23. William B. Frakes & Ricardo Baeza-Yates, 정보검색,류근호, 김진호 공역(서울 : 시그마 프레스,1994), pp.154-205