• 제목/요약/키워드: Web archiving

검색결과 71건 처리시간 0.024초

심층 웹 문서 수집을 위한 크롤링 알고리즘 설계 (Crawling Algorithm Design for Deep Web Document Collection)

  • 원동현;강윤정;박혁규
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.367-369
    • /
    • 2022
  • 웹 기술이 발전함에 따라 웹은 사용자의 요구에 맞는 맞춤 정보들을 제공하게 된다. 클릭 이벤트나 사용자의 질의어에 따라 정보가 제공되며 검색엔진으로는 검색이 어려운 정보가 제공되는 웹 서비스를 심층웹이라 한다. 이러한 심층웹은 표면웹보다 많은 정보를 포함하고 있지만, 방문 당시의 정보를 수집하는 일반적인 크롤링으로는 정보 수집이 어렵다. 심층웹은 javascript와 같은 스크립트언어를 브라우저에서 실행함으로 서버의 정보를 사용자에게 제공한다. 본 논문에서는 심층웹 수집을 위해 스크립트를 분석하여 동적으로 변화되는 웹사이트의 탐색 및 정보 수집이 가능한 알고리즘을 제안한다. 본 논문에서는 실험을 위해 질병관리청의 게시판의 스크립트를 분석하였다.

  • PDF

국가 심층 웹기록물 보존 포맷과 OAIS 참조모델 간의 데이터 맵핑 (Data Mapping between Korea Deep Web Archiving Format and Reference Model for OAIS)

  • 박병주;차승준;이규철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.197-200
    • /
    • 2010
  • 웹 기술이 발달함에 따라 공공기관 웹사이트는 단순한 행정기관의 홍보에서 벗어나 국민과 정부 간의 의사소통의 증거인 동시에 업무의 기록으로서 역할을 담당하고 있다. 따라서 공공기관의 웹사이트들은 공공기록물로 인식하고 보호해야 한다. 하지만 공공기관의 웹기록물 중 하나인 심층 웹기록물은 실시간으로 상이한 페이지를 동적으로 구성하기 때문에 기존의 보존방법과는 다른 수집 보존 활용 기술이 요구된다. 국가기록원은 이러한 특징을 가지고 있는 심층 웹기록물을 장기보존하기 위해서 심층 웹기록물 장기보존 포맷인 KoDeWeb을 연구하고 개발하였다. KoDeWeb은 전자기록물이기 때문에 전자기록물로서 진본성 및 무결성을 보장해야 한다. 본 연구에서는 KoDeWeb의 전자기록물로서의 진본성 및 무결성을 증명하기 위해 국제 전자기록물 표준인 OAIS 참조모델에 KoDeWeb을 맵핑시켰다. 나아가 OAIS표준을 따르고 있는 전자기록물 장기보존 시스템에 KoDeWeb을 사용함으로써, 정부 및 공공기관의 심층 웹기록물 생성 및 수집을 체계화하고, 또한 민간이 운영하는 웹의 심층 웹기록물 장기보존에 활용할 수 있다.

  • PDF

웹기록물 보존을 위한 전자기록물 장기보존포맷 확장 설계 (Extension of the Long-term Archival Information Package for Electronic Records to Accommodate Web Records)

  • 박병주;차승준;이규철
    • 한국전자거래학회지
    • /
    • 제15권4호
    • /
    • pp.33-47
    • /
    • 2010
  • 웹기록물은 공공기관의 업무활동이나 전자상거래에 대한 법적증거로 활용될 수 있기 때문에 보존할 가치가 있는 정보이지만 웹기록물의 특징 중 하나인 '휘발성'으로 인해 소실되고 있다. 따라서 이렇게 사라지는 웹기록물을 장기보존하기 위한 장기보존포맷이 정의되어야 한다. 웹기록물은 전자기록물의 일종이기 때문에 전자기록물 장기보존포맷에 보존할 수 있어야 한다. 하지만 현재 표준으로 제시된 포맷은 웹기록물의 특성을 고려하지 않고 정의되었기 때문에 웹기록물을 보존할 수 없다. 본 논문에서는 표면/심층 웹기록물 문서보존포맷으로 연구된 KoDeWeb/KoSurWeb과 전자기록물 장기보존포맷을 분석하고, 이를 바탕으로 웹기록물을 보존할 수 있는 확장된 전자기록물 장기보존포맷을 정의하였다. 정의된 포맷을 활용하면 웹기록물도 전자기록물들과 같이 보존되어 활용될 수 있고, 전자 상거래에 관련된 공공기관의 웹기록물을 보존함으로써 전자 상거래에 대한 법적 증거로서 활용될 수 있다.

디지털미디어 기반 미술 정보 활용 방안 연구 - 미술 감상 모바일 애플리케이션을 중심으로 - (A Study on the Use of Art Information Based on Digital Media - Focusing on Art Appreciation Mobile Application -)

  • 허유경;박승호
    • 디자인융복합연구
    • /
    • 제15권5호
    • /
    • pp.1-19
    • /
    • 2016
  • 디지털 매체의 등장은 기존의 미술 정보 아카이빙(archiving)을 기준으로 관람객의 적극적인 개입을 가능하게 만들었다. 그럼에도 관객들은 미술관이 제공하는 정보를 해석하는 데에 어려움을 느끼고 있다. 이에 따라 본 연구는 미술관이 구축해온 아카이빙 자료가 디지털 매체를 기반으로 관객에게 유의미하게 전달 될 수 있는 정보 가이드라인을 제안하는 것을 목표로 진행되었다. 이를 위해 현재 제공되는 디지털 기반 미술 정보 제공 서비스 중 모바일의 사례를 크게 후퍼 그린힐(Hooper-Greenhill, E)의 주제어를 기반으로 콘텐츠 맥락의 측면과 정보 전달 방식, 기능의 측면에서 분석하였다. 이 후 분류된 세부 주제어들을 관람객의 감상 단계에 입각해 재배열 하였고, 재구성된 정보의 구조는 미술관이 주체가 된 정보의 유형화와 제공이 아닌 관람객의 이해 단계를 주체로 한 정보 구조를 구축했다는 데에 그 의의가 있다. 본 연구에서 제안한 미술 정보 활용 방안은 향 후 웹을 기반으로 한 미술관의 트랜스미디어 스토리텔링의 실제적 서비스 구축의 구체적 방향 설정에 도움이 될 수 있을 것이라 기대한다.

전자저널 관리 현황과 개선 방안에 관한 연구 - 대학도서관을 중심으로 - (A Study of Current Issues and Recommendations for E-Journal Management: Focus on Academic Libraries)

  • 이란주
    • 한국비블리아학회지
    • /
    • 제24권2호
    • /
    • pp.247-268
    • /
    • 2013
  • 본 연구의 목적은 대학도서관을 중심으로 전자저널 관리 현황을 살펴보고 개선과제를 도출함으로써 향후 전자저널의 효율적 관리체계를 구축하기 위한 기초자료를 제공하는데 있다. 이를 위하여 선행연구를 조사하고 도서관 웹사이트를 분석하였으며 도서관 사서와의 인터뷰를 통해서 자료를 수집하였다. 본 연구에서는 최종이용자가 전자저널 이용을 가능하게 하는데 필요한 전반적인 전자저널 관리업무를 포괄적으로 다루었다. 주요 논의는 1) 이용행태, 2) 선정, 구독 및 평가, 3) 접근과 검색, 4) 이용자교육 및 홍보, 5) 아카이브, 6) 오픈액세스, 7) 장서개발정책 등으로 구성하였다.

대용량 데이터를 처리하는 ERP시스템의 성능개선(튜닝) 사례;(주)대교

  • 서병민;김승일
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.582-587
    • /
    • 2007
  • ERP system is a good one because it provides required data to the Board of Directors at the right time, but needs to collect many data in this system. Nevertheless, increase in data leads to the system's quality deterioration which makes companies to carry out quality improvement. In order to solve quality deterioration problem, a company's quality improvement director must execute under acknowledgement of the relationships between sectors to be improved, which are DBMS, Application, System, Data Management, Archiving, and Reorganization. But in many cases, these relationships are ignored due to massive size of each of the sectors, resulting fragmental quality improvement operation. This case paper proposes a solution to effectively solve quality deterioration problem created by the massive data produced while operating ERP System(constructed by SAP package and web). First, it defines the sectors where quality improvements are vital, and lists out things to be considered. Then, by analysing the working process of these sectors, proposes the most efficient order of the improvement process. This case will eventually help the company's quality improvement director to execute quality improvement most effectively without trials and errors, which is this paper's ultimate goal.

  • PDF

DICOM Converter를 이용한 웹상에서의 MINI-PACS 구현 (Implementation of MINI-PACS using the DICOM Converter on the Web)

  • 지연상
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제23권1호
    • /
    • pp.103-111
    • /
    • 2000
  • In recent years, medical procedures have become more complex, while financial pressures for shortened hospital stays and increased efficiency in patient care have increased. As a result, several shortcomings of present film-based systems for managing medical images have become apparent. Maintaining film space is labor intensive and consumes valuable space. Because only single copies of radiological examinations exist, they are prone to being lost or misplaced, thereby consuming additional valuable time and expense. In this paper, MINI-PACS for image archiving, transmission, and viewing offers a solution to these problems. Proposed MINI-PACS consists of mainly four parts such as Web Module, Client-Server Module, Internal Module, Acquisition Module. In addition, MINI-PACS system includes DICOM Converter that Non-DICOM file format converts standard file format. In Client-Server Module case, Proposed system is combined both SCU(Service Class User: Client) part and SCP(Service Class Provider: Server)part therefore this system provides the high resolution image processing techniques based on windows platform. Because general PACS system is too expensive for Medium and Small hospitals to install and operate the full-PACS. Also, we constructed Web Module for database connection through the WWW.

  • PDF

웹 아카이브 OASIS의 현황에 관한 연구 (A Research on the OASIS, an Web Archive in Korea, Revisited)

  • 윤정옥
    • 정보관리연구
    • /
    • 제42권3호
    • /
    • pp.95-116
    • /
    • 2011
  • 이 연구에서는 국립중앙도서관이 구축 운영하는 웹 아카이브인 OASIS 콘텐츠의 특성과 문제점을 살펴보았다. 2011년 5월 20일부터 6월 10일 사이 OASIS 웹사이트를 통해 제공되는 주제별 디렉토리에서 철학, 종교 등 5개 주제와 사회과학과 기술과학 소주제의 수집 웹사이트 55종 및 '최신 자료'와 '많이 본 자료' 리스트를 분석하였다. OASIS는 수집 콘텐츠의 주제 분포의 편중, 웹사이트 저작자/발행자 권위 및 학술적 가치의 근거 미약, 아카이빙 대상의 정의 부적합, 수집 및 이용 통계 처리의 모호성 등 문제점이 나타났고, 이에 대한 포괄적이며 체계적인 개선책 마련이 시급한 상황이다.

윈도우 플랫폼 상에서 Web Module 과 Converter를 이용한 Any-PACS 구현 (Implementation ANY-PACS Using Web Module and DICOM Converter on the windows platform)

  • 윤민종;이준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 춘계종합학술대회
    • /
    • pp.93-98
    • /
    • 1999
  • 본 논문에는 DICOM Converter를 구현하여 새로운 장비를 구입하지 않고, 기존의 장비를 이용해 DICOM 표준안 영상으로 변환할 수 있게 하였다. 그리고 클라이언트/서버 모듈 부분에서 한 시스템 내에서 SCU 와 SCP를 동시에 수행할 수 있어 중소 병원에 적합한 단계적인 PACS 시스템을 구축할 수 있다. 또한 Web 상에서의 환자정보, 영상정보, 검사정보, 그리고 장비정보와 같은 DB 연동을 할 수 있어 점진적으로 확장 및 통합이 가능한 소형의 부분적인 시스템을 구현하였다 결과적으로, 본 시스템은 안정된 개방형 시스템을 기반으로 하였기에 가격을 낮추었을 뿐 아니라 투자에 대한 실패를 크게 감소시키었다.

  • PDF

국내 대학 리포지터리의 세계적 영향력에 관한 연구 (Global Impact of Institutional Repositories in South Korean University)

  • 신은자
    • 정보관리학회지
    • /
    • 제34권1호
    • /
    • pp.197-218
    • /
    • 2017
  • 이 연구는 국내 대학 리포지터리의 글로벌 가시성과 영향력을 파악하기 위하여 관련 사이트인 OpenDOAR, ROAR, RWR 등에서 데이터를 수집하여 분석하였다. 그리고 이 분석 결과를 기관 리포지터리의 위상을 공고히 하고 영향력 확산에 노력하는 비영어권 아시아 주요 국가와 비교함으로써 국내 대학 리포지터리의 경쟁력을 확인하였다. 연구 결과 세 사이트에 모두 등재되어 있는 국내 대학 리포지터리는 9개에 불과하였다. 이 가운데 RWR 세계 순위 500위 안에 든 대학은 한 곳일 정도로 국내 대학 리포지터리의 세계적인 위상은 매우 낮았다. 반면 아시아 주요국인 일본과 대만은 대학의 리포지터리 수가 각각 257개, 52개일 정도로 많아 국내 대학 리포지터리 현황과 대조적이었다. 그렇지만 이 연구는 국내 선도적인 대학 리포지터리가 최근 연구업적관리시스템과 연계하여 구성원의 샐프 아카이빙을 보다 적극적으로 수행하기 시작하였다는 점을 새롭게 확인하였다. 이는 향후 대학 리포지터리의 양적 성장을 기대할 수 있게 하는 단서라는 점에서 긍정적이었다.