DOI QR코드

DOI QR Code

A Study on Error Data Types in the KERIS Union Catalog - Focused on Dissertation Bibliographic Database -

종합목록 데이터의 오류 유형에 관한 연구 - KERIS종합목록의 학위논문 서지데이터를 중심으로 -

  • Published : 2002.12.01

Abstract

The KERIS Union Catalog is the largest bibliographic database in Korea. It has over 5.7 million bibliographic records and at present 330 university libraries are participating in shared cataloging services. The database, however, includes various errors and a large number of duplicate data because separate databases from many university libraries were merged without proper quality control in a short period. This study intends to find error data types by analyzing dissertation bibliographic data. The results show that error data are mainly caused by input errors, and the mistakes in using MARC formats and cataloging rules.

KERIS의 대학도서관 종합목록은 330개 대학도서관이 가입하여 570만 레코드를 보유하고 있는 국내 최대의 목록이다. 그러나 각 회원기관이 이미 구축한 DB를 짧은 기간 내 통합하면서 중복 및 오류 레코드가 많이 포함되어 있기 때문에 검색의 효율성이 떨어진다는 지적이 있다. 따라서 본 연구에서는 전체 자료의 10%를 차지하는 학위논문 데이터 1000건을 대상으로 오류 데이터의 유형을 분석함으로서 데이터의 품질을 측정하고 기계적으로 오류데이터를 색출할 수 있는 방안을 제시하였다. 분석 결과 오류데이터는 전체 표본 DB의 30%를 차지하였고 발생하는 주요 원인은 1)입력오류 2)MARC의 사용 오류 3)목록규칙의 적용 오류가 가장 큰 원인으로 나타났다.

Keywords

References

  1. 2001년도 종합목록서비스 운영현황보고서
  2. 한국문헌자동화목록법형식: 단행본용 국립중앙도서관(편)
  3. 도서관학논집 v.제21집 서지데이터베이스의 품질관리-k관의 MARC레코드 분석을 중심으로 김지훈
  4. 석사학위논문 첨단학술정보센터 종합목록데이터베이스 품질관리에 관한 연구 이지은
  5. Bibliographic input standards(4th ed.) OCLC
  6. Journal of Information Science v.24 no.4 Duplicate Detection and record consolidation in large bibliographic databases: the COPAC database experience in Great Britain Cousins,S.A. https://doi.org/10.1177/016555159802400402
  7. Determining Duplicate Records: Kinetica Duplicates Guidelines for Monographs
  8. Bibliographic Formats and Standards: Chapter 4. When to Input a New Record OCLC
  9. Bibliographic Formats and Standards: Chapter 5. Quality Assurance OCLC
  10. OCLC Cataloging Service User Guide.(3 ed.) OCLC
  11. Annual Review of OCLC Research Duplicate detection O'Neill.E.A.
  12. Characteristics of duplicate records in OCLC's union catalog. LRTS v.37 no.1 O'Neill,E.A.;Sally A. Rogers;W.Michael Oskins
  13. Program v.26 no.1 An Expert system for quality control and duplicate detection in bibliographic databases Ridley,M.J. https://doi.org/10.1108/eb047100
  14. Journal of Information Science v.23 no.1 Measuring quality in the production of databases Rittberger,M.;Rittberger,W. https://doi.org/10.1177/016555159702300103