• Title/Summary/Keyword: 체크 포인트

Search Result 72, Processing Time 0.022 seconds

Design of Fault-tolerant MA Migration Scheme based on Encrypted Checkpoints (암호화된 체크포인트를 이용한 결함 허용성을 가지는 이동 에이전트의 이주 기법 설계)

  • 김구수;엄영익
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.13 no.6
    • /
    • pp.77-84
    • /
    • 2003
  • A mobile agent is a program which represents a user in a network and is capable of migrating from one node to another node, performing computations on behalf of the user. In this paper, we suggest a scheme that can safely recover mobile agent using the checkpoint that is saved at the platform that it visited previously and restart its execution from the abnormal termination point of the mobile agent. For security, mobile agent uses its public key to encrypt the checkpoint and the home platform uses the private key of the mobile agent to decrypt the encrypted checkpoints at the recovery stage. When home platform receives the checkpoint of the mobile agent, home platform verifies the checkpoint using message digest. Home platform verifies the correctness of the checkpoint by comparing the message digest generated at checkpoint mention time with the message digest generated at mobile agent recovery time.

Analysis of Checkpointing Model with Instantaneous Error Detection (즉각적 오류 감지가 가능한 경우의 체크포인팅 모형 분석)

  • Lee, Yutae
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.26 no.1
    • /
    • pp.170-175
    • /
    • 2022
  • Reactive failure management techniques are required to mitigate the impact of errors in high performance computing. Checkpoint is the standard recovery technique for coping with errors. An application employing checkpoints periodically saves its state, so that when an error occurs while some task is executing, the application is rolled back to its last checkpointed task and resumes execution from that task onward. In this paper, assuming the time-to-errors are independent each other and generally distributed, we analyze the checkpointing model with instantaneous error detection. The conventional assumption that two or more errors do not take place between two consecutive checkpoints is removed. Given the checkpointing time, down-time, and recovery time, we derive the reliability of the checkpointing model. When the time-to-error follows an exponential distribution, we obtain the optimal checkpointing interval to achieve the maximum reliability.

Determining Checkpoint Intervals of Non-Preemptive Rate Monotonic Scheduling Using Probabilistic Optimization (확률 최적화를 이용한 비선점형 Rate Monotonic 스케줄링의 체크포인트 구간 결정)

  • Kwak, Seong-Woo;Yang, Jung-Min
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.21 no.1
    • /
    • pp.120-127
    • /
    • 2011
  • Checkpointing is one of common methods of realizing fault-tolerance for real-time systems. This paper presents a scheme to determine checkpoint intervals using probabilistic optimization. The considered real-time systems comprises multiple tasks in which transient faults can happen with a Poisson distribution. Also, multi-tasks are scheduled by the non-preemptive Rate Monotonic (RM) algorithm. In this paper, we present an optimization problem where the probability of task completion is described by checkpoint numbers. The solution to this problem is the optimal set of checkpoint numbers and intervals that maximize the probability. The probability computation includes schedulability test for the non-preemptive RM algorithm with respect to given numbers of checkpoint re-execution. A case study is given to show the applicability of the proposed scheme.

A Study on Optimal Checkpointing Interval in Real-Time Systems (실시간 시스템에서의 효과적인 체크포인트 간격에 대한 연구)

  • 변계섭;김재훈
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.7A
    • /
    • pp.1220-1226
    • /
    • 2001
  • 실시간 시스템에서 예상치 못한 오류 방생은 성능에 악영향을 미친다. 이를 예방하기 위하여 체크포인팅(checkpointing)이라는 후방 에러복구기법을 이용하여 오류 발생시에도 예측 가능한 결과를 보장할 수 있다. 실시간 시스템에서의 체크포인팅은 비실시간 시스템과는 달리 시간제약성을 만족시켜야 하기 때문에 비실시간에서 최적인 체크포인팅 간격과는 다르게 고려되어야 한다. 본 논문에서는 체크포인트 간격에 따른 실시간 시스템과 비실시간 시스템간의 성능의 차이를 시뮬레이션을 통하여 확인하였고 결과를 분석하였다.

  • PDF

A Study on the Optimal Heartbeat Intervals for High Availability Systmes (고가용성 시스템을 위한 최적의 Heartbeat 간격에 대한 연구)

  • 박주용;김재훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.4-6
    • /
    • 2001
  • 일반 시스템에서는 결함이 발생하였을 때, 즉 어떠한 작업을 수행하는 프로세스 또는 하드웨어에 결함이 발생하였을 때 작업이 중단되거나 처음부터 다시 수행하여야 한다. 그러나, 고가용성 시스템은 일반 다른 시스템과 달리 어떠한 결함이 발생했을 때에도 지속적으로 서비스를 수행할 수 있는 하드웨어나 소프트웨어 시스템이 구축되어 있다. 고가용성 시스템에서 Heartbeat을 이용하여 시스템에서 발생하는 결함이 발견하여 필요한 조치를 위할 수 있도록 한다. 또한, 체크포인트(Checkpoint)f와 롤백(Roll-Back) 기법을 사용하여 컴퓨팅의 손실을 최소화하기 위하여 컴퓨팅 작업을 처음부터 다시 시작하는 것이 아니라 최근의 상태 저장 순간으로 되돌아가 다시 시작한다. 본 논문에서는 고가용성 시스템에서 체크포인트와 Heartbeat을 사용할 때 체크포인트 간격과 Heartbeat 간격에 따른 평균 수행시간을 구하고, 최적의 체크포인트 간격을 적용한 경우에 Heartbeat 간격에 따른 시스템의 성능을 분석하고 비교하였다.

An Efficient Checkpointing Method for Mobile Hosts via the Software Agent (이동 기기에 적합한 소프트웨어 에이전트 기반의 효율적 체크포인팅 기법)

  • Lim, Sung-Chae
    • The KIPS Transactions:PartA
    • /
    • v.15A no.2
    • /
    • pp.111-118
    • /
    • 2008
  • With the advance in mobile communication systems, the need for distributed applications running on multiple mobile devices also grows gradually. As such applications are subject to H/W failures of the mobile device or communication disruptions, compared to the traditional applications in fixed networks, it is crucial to develop any recovery mechanism suitable for them. For this, checkpointing is widely used to restart interrupted applications. In this paper, we devise an efficient checkpointing method that adopts the software agent executed at the mobile support station. The agent, called the checkpointing agent, is aimed at supporting the concept of rollback-distance (R-distance) that bounds the maximum number of roll-backed local checkpoints. By means of the R-distance, our method can prevent undesirable domino effects and heavy checkpoint overhead, while providing high flexibility in checkpoint creation.

Adaptive Checkpointing Protocol for Improving of Fault Tolerance in Distributed System (분산 시스템에서 고장 감내성의 향상을 위한 적응형 체크포인팅 프로토콜)

  • 이용호;장태무
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.90-92
    • /
    • 1999
  • 비동기 체크포인팅 프로토콜은 분산 시스템에서 고장 감내성을 제공하기 위한 방법중 하나다. 이 방법은 모든 프로세스가 독립적으로 자신의 지역 체크포인트를 두고 어느 한 프로세스에서의 고장 발생시 가장 최근의 체크포인트에서부터 롤백을 하는 것이다. 하지만 이 방법은 어느 한 프로세스에서의 고장 발생이 다른 프로세스의 롤백까지 유도하는 캐스캐이드 롤백을 발생시킬 수 있는 단점이 있다. 본 논문에서는 고장 감내성의 수준을 높이기 위하여 비동기 체크포인팅 프로토콜을 사용하면서도 캐스캐이드 롤백을 막을 수 있는 적응형 체크포인팅 프로토콜을 사용한다. 프로세스사이에 오고가는 모든 메시지의 복사본이 서버쪽의 중재자를 통하여 서버에 있는 기계 상태 테이블에 저장된다. 이렇게 하여 서버에는 무든 지역 기계의 상태가 저장되어 기계 고장이 발생했을 경우에 고장이 발생한 기계의 복구에 사용된다.

  • PDF

Light-weight Checkpointing Mechanism for Reducing Overhead in Mobile Computing Systems (모바일 컴퓨팅 시스템에서 과부하를 줄이기 위한 경량 체크포인팅 기법)

  • Lee Chang-Yup;Choi Chang-Yeol;Kim Sung-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.160-162
    • /
    • 2006
  • 최근 모바일 환경에서 모바일 기기가 결항에 쉽게 노출될 수 있다는 특성 때문에 모바일 컴퓨팅 시스템에서의 결함 허용에 대한 관심이 높아지고 있다. 결함 허용을 제공하기 위한 기법 중 하나로 체크포인팅을 들 수 있는데, 이를 모바일 환경에 적용하기 위해서는 체크포인트의 실행으로 인해 모바일 기기에 가해지는 과부하를 줄이는 것이 중요하다. 따라서 본 논문에서는 각각의 프로세스가 독립적으로 실행하는 BASIC 체크포인트를 없앰으로써 과부하를 줄이기 위한 체크포인팅 기법을 제안한다.

  • PDF

A Metadata Management Scheme for Efficient Mount on YAFFS2 Flash File System (YAFFS2 플래시 파일시스템 상에서 효율적인 마운트를 위한 메타데이터 관리기법)

  • Seo, Hyoung-Woon;Shin, Myung-Sub;Park, Dong-Joo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.74-76
    • /
    • 2011
  • 최근 플래시 메모리에 기반을 둔 임베디드 시스템의 사용이 급증하고 있다. 스마트폰이 대중화됨에 따라, 플래시 메모리용 파일시스템에 대한 필요성이 증가되고 있다. 보편적으로 사용하는 YAFFS2 파일시스템은 초기화 시 오래 걸리는 단점이 존재하여 체크포인트 기능으로 보안 하고 있다. 그러나 갑작스러운 Power Failure 나 언마운트시 체크포인트가 저장되지 않으면 전체 영역을 스캔해야 하는 문제점이 존재한다. 본 논문에서는 YAFFS2의 성능 개선 및 신뢰성 향상을 위한 메타데이터 관리 기법을 제안한다. 메인메모리상에 유지되는 메타데이터의 영역을 나눠서 관리해서, Power Failure 가 발생하거나 체크포인트가 존재하지 않아도 전 영역을 스캔 하는 문제점 을 피할 수 있다.

A Checkpointing Framework for Dependable Real-Time Systems (고신뢰 실시간 시스템을 위한 체크포인팅 프레임워크)

  • Lee, Hyo-Soon;Shin, Heonshik-Sin
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.29 no.4
    • /
    • pp.176-184
    • /
    • 2002
  • We provide a checkpointing framework reflecting both the timeliness and the dependability in order to make checkpointing applicable to dependable real-time systems. The predictability of real-time tasks with checkpointing is guaranteed by the worst case execution time (WCET) based on the allocated number of checkpoints and the permissible number of failures. The permissible number of failures is derived from fault tolerance requirements, thus guaranteeing the dependability of tasks. Using the WCET and the permissible number of failures of tasks, we develop an algorithm that determines the minimum number of checkpoints allocated to each task in order to guarantee the schedulability of a task set. Since the framework is based on the amount of time redundancy caused by checkpointing, it can be extended to other time redundancy techniques.