DOI QR코드

DOI QR Code

Determining Checkpoint Intervals of Non-Preemptive Rate Monotonic Scheduling Using Probabilistic Optimization

확률 최적화를 이용한 비선점형 Rate Monotonic 스케줄링의 체크포인트 구간 결정

  • 곽성우 (계명대학교 전자공학과) ;
  • 양정민 (대구가톨릭대학교 전자공학과)
  • Received : 2010.08.06
  • Accepted : 2010.10.30
  • Published : 2011.02.25

Abstract

Checkpointing is one of common methods of realizing fault-tolerance for real-time systems. This paper presents a scheme to determine checkpoint intervals using probabilistic optimization. The considered real-time systems comprises multiple tasks in which transient faults can happen with a Poisson distribution. Also, multi-tasks are scheduled by the non-preemptive Rate Monotonic (RM) algorithm. In this paper, we present an optimization problem where the probability of task completion is described by checkpoint numbers. The solution to this problem is the optimal set of checkpoint numbers and intervals that maximize the probability. The probability computation includes schedulability test for the non-preemptive RM algorithm with respect to given numbers of checkpoint re-execution. A case study is given to show the applicability of the proposed scheme.

체크포인트 기법은 실시간 시스템의 내고장성을 구현하는 대표적인 방법이다. 본 논문에서는 확률 최적화를 이용하여 체크 포인트 구간을 결정하는 기법을 제시한다. 본 논문에서 다루는 실시간 시스템은 멀티 태스크(multi-task)들로 구성되며 Poisson 분포를 가지는 과도 고장이 발생한다. 또 멀티 태스크들은 비선점형 Rate Monotonic 알고리듬으로 스케줄링된다. 이번 연구에서는 멀티 태스크들의 수행 성공 확률을 체크포인트 삽입 개수로 표현하는 최적화 문제를 설정하고 이 확률값을 최대로 만드는 체크포인트 개수와 구간 길이를 구한다. 제안된 확률 계산 과정은 체크포인트 재수행 횟수에 대한 비선점형 RM 알고리듬의 스케줄링 가능성을 판별하는 방법도 포함한다. 사례 연구를 통해서 제안된 기법의 적용가능성을 입증한다.

Keywords

References

  1. C. M. Krishina and K. G. Shin, Real-Time Systems, New York: McGraw-Hill, 1997.
  2. A. Ziv and J. Bruck, “Performance optimization of checkpointing schemes with task duplication,” IEEE Transactions on Computers, vol. 46, no. 12, pp. 1381-1386, 1997. https://doi.org/10.1109/12.641939
  3. T. Ozaki, T. Dohi, H. Okamura, and N. Kaio, “Distribution-free checkpoint placement algorithms based on min-max principle,” IEEE Transactions on Dependable and Secure Computing, vol. 3, no. 2, pp. 130-140, 2006. https://doi.org/10.1109/TDSC.2006.22
  4. S.-M. Ryu, “Reliability analysis for static checkpointing in embedded real-time systems,” 2007 International Symposium on Advanced Intelligent Systems, pp. 965-970, 2007.
  5. J. T. Daly, “A higher order estimate of the optimum checkpoint interval for restart dumps,” Future Generation Computer Systems, vol. 22, pp. 303-312, 2006. https://doi.org/10.1016/j.future.2004.11.016
  6. H. Kim and K. G. Shin, “Design and analysis of an optimal instruction retry policy for TMR controller computers,” IEEE Transactions on Computers, vol 45, no. 11, pp. 1217-1225, 1996. https://doi.org/10.1109/12.544478
  7. J. W. S. Liu, Real-Time Systems, New Jersey: Prentice Hall, 2000.
  8. 허보진, 손동철, 김창석, 이상용, “이동통신에서 무선채널할당과 CPU 작업 스케줄링 관계 연구,” 한국지능시스템학회 논문지, 제16권 제5호 pp. 575-580, 2006.
  9. 곽성우, 정용주, “RM 스케줄링된 실시간 태스크에서의 최적 체크포인터 구간 선정,” 전기학회논문지, 제56권 제6호, pp. 1122-1129, 2007.
  10. 곽성우, 정용주, “성능 함수를 고려한 실시간 제어 태스크에서의 최적 체크 포인터 구간 선정,” 전기학회논문지, 제57권 제5호 pp. 875-880, 2008.
  11. A. Ranganathan and S. J. Upadhyaya, “Performance evaluation of rollback-recovery techniques in computer programs,” IEEE Transactions on Reliability, vol. 42, no. 2, pp. 220-226, 1993. https://doi.org/10.1109/24.229490

Cited by

  1. Fault Diagnosis and Tolerance for Asynchronous Counters with Critical Races Caused by Total Ionizing Dose in Space vol.22, pp.1, 2012, https://doi.org/10.5391/JKIIS.2012.22.1.49
  2. Determination of Optimal Checkpoint Intervals for Real-Time Tasks Using Distributed Fault Detection vol.26, pp.3, 2016, https://doi.org/10.5391/JKIIS.2016.26.3.202