• 제목/요약/키워드: 체크포인팅

검색결과 37건 처리시간 0.21초

실시간 시스템에서의 효과적인 체크포인트 간격에 대한 연구 (A Study on Optimal Checkpointing Interval in Real-Time Systems)

  • 변계섭;김재훈
    • 한국통신학회논문지
    • /
    • 제26권7A호
    • /
    • pp.1220-1226
    • /
    • 2001
  • 실시간 시스템에서 예상치 못한 오류 방생은 성능에 악영향을 미친다. 이를 예방하기 위하여 체크포인팅(checkpointing)이라는 후방 에러복구기법을 이용하여 오류 발생시에도 예측 가능한 결과를 보장할 수 있다. 실시간 시스템에서의 체크포인팅은 비실시간 시스템과는 달리 시간제약성을 만족시켜야 하기 때문에 비실시간에서 최적인 체크포인팅 간격과는 다르게 고려되어야 한다. 본 논문에서는 체크포인트 간격에 따른 실시간 시스템과 비실시간 시스템간의 성능의 차이를 시뮬레이션을 통하여 확인하였고 결과를 분석하였다.

  • PDF

이식성을 고려한 사용자기반 MPI 체크포인터의 설계 및 구현 (Design and Implementation of a User-based MPI Checkpointer for Portability)

  • 안선일;한상영
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권1_2호
    • /
    • pp.35-43
    • /
    • 2006
  • MPI 체크포인터는 MPI 응용 프로그램에 체크포인팅을 통해 결함내성을 제공하는 툴이다. 네트워크의 개방성이 확대되고 GRID에 대한 활용이 증가함에 따라 MPI 체크포인터가 다양한 플랫폼과 MPI 구현들로 쉽게 이식되어야 한다는 요구가 커지고 있다. 기존의 MPI 체크포인터들은 자동 체크포인팅과 복구 기능에 초점을 맞추었고 이식성에 대한 고려가 없었기 때문에, 다른 플랫폼과 MPI 구현들로 이식되기 어려웠다. 본 논문에서는 사용자기반 MPI 체크포인터인 STFT를 개발하면서 이식성을 위해 고려하였던 설계 및 구현 이슈들에 대해 설명한다. STFT는 MPI 체크포인터의 이식성을 위해 첫째로 단일 프로세스 체크포인터들에 대한 추상화 인터페이스를 제시한다. 둘째로 사용자기반 체크포인팅 방법에서 사용자가 체크포인팅할 수 있는 지점을 제한하여 메시지 체크포인팅을 회피한다. 셋째로 네트워크 연결을 재생성하기 위해 MPI_Init가 다른 랭크를 가진 프로세스들과 항상 고정된 순서대로 연결을 생성하도록 강제한다. 이를 통해 STFT는 다양한 플랫폼과 MPI 구현들로 쉽게 이식 가능할 것으로 기대되며, 우리는 프로토타입의 구현을 통해서 STFT가 LAM과 MPICH/P4의 두 MPI 구현들로 쉽게 이식 가능함으로 확인하였다.

고신뢰 실시간 시스템을 위한 체크포인팅 프레임워크 (A Checkpointing Framework for Dependable Real-Time Systems)

  • 이효순;신현식
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권4호
    • /
    • pp.176-184
    • /
    • 2002
  • 본 논문은 고신뢰 실시간 시스템에 체크포인팅을 적용할 수 있도록 실시간성과 신뢰성을 모두 고려하는 체크포인팅 프레임워크를 제공한다. 실시간 태스크의 시간 예측성은 할당된 체크포인트의 수와 태스크가 실행 중에 감내 해야하는 고장의 수를 기반으로 태스크의 최악 실행 시간(WCET: Worst Case Execution Time)을 산출함으로써 보장된다. 태스크가 실행 중에 극복해야하는 고장의 수는 태스크의 신뢰성 요구조건을 기반으로 산출됨으로써 태스크의 신뢰성이 보장되도록 한다. 이렇게 얻어진 태스크들의 WCET와 태스크가 극복해야 하는 고장의 수를 이용하여, 각 태스크의 스케줄 가능성을 보장하기 위해 요구되는 최소의 체크포인트 수를 유도하는 알고리즘을 제안한다. 본 논문에서 제안하는 프레임워크는 체크포인팅의 시간 중복량을 기반으로 하므로, 다른 시간 중복 기법에 대해서도 확장이 용이하다.

분산 시스템에서 고장 감내성의 향상을 위한 적응형 체크포인팅 프로토콜 (Adaptive Checkpointing Protocol for Improving of Fault Tolerance in Distributed System)

  • 이용호;장태무
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.90-92
    • /
    • 1999
  • 비동기 체크포인팅 프로토콜은 분산 시스템에서 고장 감내성을 제공하기 위한 방법중 하나다. 이 방법은 모든 프로세스가 독립적으로 자신의 지역 체크포인트를 두고 어느 한 프로세스에서의 고장 발생시 가장 최근의 체크포인트에서부터 롤백을 하는 것이다. 하지만 이 방법은 어느 한 프로세스에서의 고장 발생이 다른 프로세스의 롤백까지 유도하는 캐스캐이드 롤백을 발생시킬 수 있는 단점이 있다. 본 논문에서는 고장 감내성의 수준을 높이기 위하여 비동기 체크포인팅 프로토콜을 사용하면서도 캐스캐이드 롤백을 막을 수 있는 적응형 체크포인팅 프로토콜을 사용한다. 프로세스사이에 오고가는 모든 메시지의 복사본이 서버쪽의 중재자를 통하여 서버에 있는 기계 상태 테이블에 저장된다. 이렇게 하여 서버에는 무든 지역 기계의 상태가 저장되어 기계 고장이 발생했을 경우에 고장이 발생한 기계의 복구에 사용된다.

  • PDF

실시간 시스템에서의 효과적인 Checkpointing Interval에 대한 연구 (A Study of Optimal Checkpointing Interval in Real-Time Systems)

  • 변계섭;김재훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.15-17
    • /
    • 2000
  • 실시간 시스템에서 예상치 못한 오류 발생은 성능에 악영향을 미친다. 이를 예방하기 위하여 체크포인팅이라는 후방 에러복구기법을 이용하여 오류 발생시에도 예측 가능한 결과를 보장할 수 있다. 실시간 시스템에서의 체크포인팅은 비실시간 시스템과는 달리 시간제약성을 만족시켜야 하기 때문에 비실시간에는 최적인 체크포인팅 간겨곽는 다르게 고려 되어야 한다. 이런 체크포인트 간격에 따른 성능의 차이를 시뮬레이션을 통하여 확인하였고 결과를 분석하였다.

  • PDF

즉각적 오류 감지가 가능한 경우의 체크포인팅 모형 분석 (Analysis of Checkpointing Model with Instantaneous Error Detection)

  • 이유태
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.170-175
    • /
    • 2022
  • 고성능 컴퓨팅 분야에서 오류의 영향을 완화하기 위해 사후 장애 관리 기법이 필요하다. 일반적인 오류 복구 기법은 체크포인트 기법이다. 이 기법은 체크포인트를 설정해서 주기적으로 응용 프로그램의 상태를 저장했다가, 오류가 발생했을 때 오류 발생 이전 상태로 시스템을 복구하는 것이다. 본 논문에서는 오류 발생 시간이 독립이고 동일한 일반적인 분포를 따른다는 가정에서 즉각적으로 오류를 감지하는 경우의 체크포인팅 모형을 분석한다. 두 체크포인트 사이에 많아야 하나의 오류만 발생한다는 가정을 제거한다. 체크포인트 발생 시간, 고장 시간, 복구 시간 등이 주어질 때, 시스템의 신뢰도를 유도한다. 또한, 오류 발생 시간이 지수 분포를 따르는 경우에 최적의 체크 포인팅 시간 간격을 구한다.

모바일 컴퓨팅 시스템에서 과부하를 줄이기 위한 경량 체크포인팅 기법 (Light-weight Checkpointing Mechanism for Reducing Overhead in Mobile Computing Systems)

  • 이창엽;최창열;김성수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.160-162
    • /
    • 2006
  • 최근 모바일 환경에서 모바일 기기가 결항에 쉽게 노출될 수 있다는 특성 때문에 모바일 컴퓨팅 시스템에서의 결함 허용에 대한 관심이 높아지고 있다. 결함 허용을 제공하기 위한 기법 중 하나로 체크포인팅을 들 수 있는데, 이를 모바일 환경에 적용하기 위해서는 체크포인트의 실행으로 인해 모바일 기기에 가해지는 과부하를 줄이는 것이 중요하다. 따라서 본 논문에서는 각각의 프로세스가 독립적으로 실행하는 BASIC 체크포인트를 없앰으로써 과부하를 줄이기 위한 체크포인팅 기법을 제안한다.

  • PDF

무선 센서 네트워크를 위한 모바일 체크포인팅 (Mobile Checkpointing for Wireless Sensor Networks)

  • 이상호;허준영;조유근;홍지만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.775-777
    • /
    • 2005
  • 무선 센서 네트워크는 다양한 환경에서 자연의 정보를 수집하여 인간이 필요로 하는 형태로 정보를 제공하는 네트워크이다. 이러한 센서 네트워크는 수많은 우선 센서 노드들로 이루어지고, 각 센서 노드는 자율적으로 자연의 정보를 계측하고, 이웃 노드와 통신하며, 결함 발생시에 이를 허용하고 대처할 수 있어야 한다. 본 논문에서는 무선 센서 네트워크를 위한 모바일 체크포인팅 기법을 소개한다. 모바일 체크포인팅 기법을 통하여, 보다 안정적인 결함 허용 무선 센서 네트워크를 구현해 낼 수 있고, 실험 결과를 통하여 이 기법을 사용하였을 때에 전체 센서 네트워크가 보다 더 안정적으로 동작할 수 있음을 보인다.

  • PDF

중복구조 실시간 시스템에서의 고장 극복 및 최적 체크포인팅 기법 (Fault Recovery and Optimal Checkpointing Strategy for Dual Modular Redundancy Real-time Systems)

  • 곽성우
    • 대한전자공학회논문지TC
    • /
    • 제44권7호통권361호
    • /
    • pp.112-121
    • /
    • 2007
  • 본 논문에서는 중복 구조 시스템을 이용하여 각 프로세서에서의 출력을 비교하여 효율적으로 고장을 탐지하고, 체크포인팅 기법을 적용하여 과도 고장뿐 아니라 영구적 고장을 극복하기 위한 방법을 제안한다. 매 체크포인터에서는 각 프로세서로부터의 출력과 과거 체크포인터에 저장된 데이터를 불러와 서로 비교한 후 과거 체크포인터로 회귀할지 태스크의 수행을 계속 수행할지 결정한다. 과도 고장과 영구 고장이 발생할 수 있는 상황에서 제안된 체크포인팅 기법을 탑재한 중복 구조 시스템을 마코프 모델을 이용하여 모델링한다. 마코프 모델로부터 실시간 태스크가 데드라인 이내에서 성공적으로 수행을 끝낼 확률을 계산하고, 이 확률식을 이용하여 중복구조 시스템에 탑재할 체크포인터 구간을 최적화한다. 최적화된 체크포인터 구간은 태스크의 성공적 수행 확율을 최대화 하도록 선정하였다.

이동 기기에 적합한 소프트웨어 에이전트 기반의 효율적 체크포인팅 기법 (An Efficient Checkpointing Method for Mobile Hosts via the Software Agent)

  • 임성채
    • 정보처리학회논문지A
    • /
    • 제15A권2호
    • /
    • pp.111-118
    • /
    • 2008
  • 이동 통신 시스템의 발전과 함께 여러 대의 이동 기기에서 동작하는 분산 응용의 필요성이 점차 커지고 있다. 모바일 기기의 고장이나 통신망 단절이 기존 고정 통신망에 비해 자주 발생하는 환경을 고려할 때 모바일 응용을 위한 복구 기법이 매우 중요하며, 중단된 응용의 재시작을위해 체크포인팅이 널리 사용되고 있다. 본 논문에서도 이런 분산 응용의 복구를 위한 효율적 체크포인팅 기법을 제안한다. 제안된 기법에서는 MSS(Mobile Support Station)에서 동작하는 체크포인팅 에이전트라는 소프트웨어 에이전트를 사용한다. 이 에이전트는 R-distance(rollback-distance) 개념을 지원하며, 이를 통해 복귀되는 지역 체크포인트의 최대 개수를 한정할 수 있다. 제안된 방식은 기존의 문제점이었던 도미노 현상이나 체크포인트 유지에 필요한 추가 비용을 크게 줄이면서도 매우 유연한 방식의 체크포인트 생성을 지원할 수 있다.