Metadata Design for Archiving Public Deep Web Records

공공기관 심층 웹기록물 아카이빙을 위한 메타데이터 설계

  • 차승준 (충남대학교 공과대학 컴퓨터공학과) ;
  • 최윤정 (충남대학교 공과대학 컴퓨터공학과) ;
  • 이규철 (충남대학교 공과대학 컴퓨터공학과)
  • Published : 2009.11.30

Abstract

According to the development of web sites' technologies, public institutions use web sites to carry out their business and also to utilize as pathway between government and the people also. Public web records means the result of business process over web sites in public institutions. Although there is much valuable information, it is vanished away easily because there is not yet proper methods and tools for preservation. The purpose of this paper is to design the metadata elements required when archiving deep web records, which is a kind of web records. For that, we first analyze oversea's related researches to define what public deep web records is. Then we define metadata elements about that and also explain the relationship on archival information package in Korea and dublin core metadata to support interoperability for them. The defined metadata can be used for the basis technologies in archiving domestic public web records.

웹 기술이 발전함에 따라, 공공기관에서는 웹을 이용하여 업무를 처리하고 또한 국가와 시민간의 연결통로로 사용하고 있다. 웹기록물은 공공기관에서 이용하는 웹 사이트상에서의 업무처리의 결과로, 정보로서 중요한 가치를 담고 있으나 보존의 방법과 도구가 부족하여 많은 양의 자원들이 소실되고 있는 실정이다. 본 논문은 웹기록물의 한 분류인 심층 웹기록물 아카이빙에 필요한 메타데이터 설계를 목적으로 하고 있다. 이를 위해 우선 국외 연구기관 및 연방정부에서 제공하는 심층 웹기록물에 대해 알아보고, 이를 바탕으로 국내 공공기관의 심층 웹기록물을 정의하였다. 정의된 심층 웹기록물을 바탕으로 아카이빙에 필요한 메타데이터 항목을 설계하고, 국내외 호환성을 위해 전자기록물 장기보존포맷과 더블린코어 메타데이터와의 관계를 설명하였다. 이는 국내 웹기록물 아카이빙의 기반기술로 활용될 수 있다.

Keywords

References

  1. 김유성, "공공기록물 관리에 관한 법률의 제정 의의와 개선방안", 한국기록관리학회, 제8권, 제1호, 2008, pp. 5-25.
  2. 유효림, "정부부처 웹 아카이빙 방안 연구", 명지대학교 석사학위 논문, 2007.
  3. 이지은, "공공기관의 웹기록 관리방안 연구", 한국 외국어대학교 석사학위 논문, 2006.
  4. 차승준, 정준선, 이규철, "공공기관 웹기록물 아카이빙을 위한 웹 크롤러 연구 개발", 한국정보과학회 데이터베이스 연구, 제26권, 제2호, 2009. 8, pp. 1-15.
  5. 차승준, 이규철, "웹기록물 아카이빙 기반기술 연구 개발", 지식정보산업연합학회 창립기념 학술대회, 창간호, 2008, pp. 369-377.
  6. 차승준, 천동석, 이규철, "웹기록물 아카이빙을 위한 워크플로우 및 메타데이터 연구", 제30회 한국정보처리학회 추계학술발표대회, 제15권, 제2호, 2008, pp. 1379-1382.
  7. 행정안전부 국가기록원, "전자기록물 장기보존포맷 기술규격(Standard of Archival Information Package)", 2008.
  8. Adrian B., "Archiving Website:a practical guide for informatio management professionals," facet publishing, 2006.
  9. Archives New Zealand, "A Guide to Developing RecordKeeping Strategies for Websites," 2008, http://www.archives.govt.nz/continuum/documents/publications/g20.pdf.
  10. BrightPlanet, http://www.brightplanet.com/
  11. Dublin Core Metadata Initiative, "Dublin Core Metadata Element Set. version 1.1," 2008, http://dublincore.org/documents/dces/.
  12. DeepWebResearch, http://www.deepwebresearch.com/.
  13. Heejung, K. Hyewon, L. 2007. Development of Metadata Elements for Intensive Web Archiving., 정보관리학회지, 제24권, 제2호, pp. 143-160.
  14. Michael K. BERGMAN, "The Deep Web:Surfacing Hiidden Value," Bright Planet White Paper, 2001, http://www.brightplanet.com/images/uploads/12550176481-deepwebwhitepaper.pdf.
  15. National Archives of Australia, "Archiving Web Resources:Guidelines for Keeping Records of WEb-based Activity in the Commonwealth Government," 2001, http://www.naa.gov.au/Images/archweb_guide_tcm2-903.pdf.
  16. Swiss Federal Archives, "SIARD Format Description," 2009, http://www.bar.admin.ch/themen/00532/00536/00818/index.html-lang=en.