• 제목/요약/키워드: rollback-recovery

검색결과 31건 처리시간 0.018초

성능 함수를 고려한 실시간 제어 테스크에서의 최적 체크 포인터 구간 선정 (Determination of Optimal Checkpoint Interval for Real-time Control Tasks Considering Performance Index Function)

  • 곽성우;정용주
    • 전기학회논문지
    • /
    • 제57권5호
    • /
    • pp.875-880
    • /
    • 2008
  • In this paper, a novel method to determine the optimal checkpoint interval for real-time control task is proposed considering its performance degradation according to tasks's execution time. The control task in this paper has a specific sampling period shorter than its deadline. Control performance is degraded as the control task execution time is prolonged across the sampling period and eventually zero when reached to the deadline. A new performance index is defined to represent the performance variation due to the extension of task execution time accompanying rollback fault recovery. The procedure to find the optimal checkpoint interval is addressed and several simulation examples are presented.

ARIES/RL: 장기 트랜잭션을 지원하기 위한 ARIES 확장 (ARIES/RL: An Extension of ARIES with Re-Logging to Support Long-Duration Transactions)

  • 정재목;이강우;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권1호
    • /
    • pp.129-140
    • /
    • 2000
  • 본 논문에서는 장기 트랜잭션이 존재할 경우에, 제한된 로그 공간을 효율적으로 사용하기 위해 재로깅이라는 기법을 ARIES에 확장한 ARIES/RL 알고리즘을 제시한다. ARIES/RL은 로그 공간이 현재 수행되는 트랜잭션에 충분하지 않은 경우 트랜잭션 취소나 재시동 고장회복에 사용되는 로그레코드를 로그의 끝쪽으로 옮기는 기법이다. 이 기법은 기존의 ARIES가 가지는 장점을 그대로 유지하면서, 장기 트랜잭션을 수행시키는 경우 로그를 더 효율적으로 사용하게 된다. 또한 논문에서는 ARIES/RL의 성능 평가의 결과를 제시한다.

  • PDF

분산 계산 환경의 검사점 작성 및 롤백 복구 프로토콜 (Checkpointing and Rollback-Recovery Protocols in Distributed Computing Systems)

  • 안성준;조유근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.93-95
    • /
    • 1999
  • 메시지 전달을 이용한 분산 계산 환경의 검사점 작성 및 롤백 프로토콜은 조정 검사점 작성(coordinated checkpointing), 약조정 검사점, 작성(loosely coordinated checkpointing), 독립적 검사점 작성(independent checkpointint)등 크게 세 종류로 구분할 수 있다. 이 프로토콜들의 성능은 프로세스간 통신의 빈도, 통신의 패턴 등 응용의 특성 및 수행 환경에 영향을 받는다. 기존에 제안된 프로토콜 각각의 성능에 대해서는 많은 연구가 있었으나 이질적인 종류의 프로토콜들을 동일한 환경에서 구현하여 성능을 비교하는 연구는 이루어지지 않았다. 본 논문에서는 검사점 작성 및 롤백 복구 프로토콜들을 구현하고, 동일한 환경에서 성능을 측정한 결과를 제시한다. 아울러 검사점 작성 및 롤백 복구 프로토콜의 성능에 영향을 미치는 요소들을 분석하여, 이들 프로토콜의 성능 평가 기준과 응용의 특성에 적합한 프로토콜의 선택 기준을 제시한다.

  • PDF

일괄구성과 확장된 지연삭제를 이용한 B+-Tree의 동시성 제어 및 회복 (Concurrency Control and Recovery Method of B+-Tree using Bulk Loading and Extended Lazy Deletion)

  • 김대일;김성희;조숙경;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.128-130
    • /
    • 2000
  • B+-Tree는 데이트베이스 관리 시스템에서 대용량의 데이터를 관리하기 위해 가장 널리 사용되는 인덱스이다. 그런 기존의 B+-Tree는 데이터베이스의 초기 구성 및 재구성시 많은 비용이 들고, 또한 삭제 연산의 빈번한 발생시 색인 구조 변경연산의 발생빈도가 높아져 동시성이 떨어진다는 단점이 있다. 이러한 문제점을 해결하기 위해서 기존 대부분의 데이터베이스 관리시스템에서는 일괄구성과 지연삭제를 이용하고 있으나, 동시성 및 회복에 대한 처리가 미흡하여 실제 시스템에 적용하기에는 문제가 있다. 따라서 본 논문에서는 일괄구성과 지연삭제 방법을 적용한 B+-Tree에서의 동시성 및 회복기법을 제안한다. 제안된 기법은 일괄구성 시에 잠금의 부하와 연속적인 철회(Cascade Rollback)가 없고, 또한 지연 삭제기법을 확장함으로써 빈 페이지 리스트 관리에 대한 부하가 없으며, 삭제 연산에 대한 회복 시 논리적 복귀(Logical Undo)가 빨라지고 구현이 간단해진다는 장점이 있다.

  • PDF

Reducing Overhead of Distributed Checkpointing with Group Communication

  • Ahn, Jinho
    • 한국정보기술학회 영문논문지
    • /
    • 제10권2호
    • /
    • pp.83-90
    • /
    • 2020
  • A protocol HMNR, was proposed to utilize control information of every other process piggybacked on each sent message for minimizing the number of forced checkpoints. Then, an improved protocol, called Lazy-HMNR, was presented to lower the possibility of taking forced checkpoints incurred by the asymmetry between checkpointing frequencies of processes. Despite these two different minimization techniques, if the high message interaction traffic occurs, Lazy-HMNR may considerably lower the probability of knowing whether there occurs no Z-cycle due to its shortcomings. Also, we recognize that no previous work has smart procedures to be able to utilize network infrastructures for highly decreasing the number of forced checkpoints with dependency information carried on every application message. We introduce a novel Lazy-HMNR protocol for group communication-based distributed computing systems to cut back the number of forced checkpoints in a more effective manner. Our simulation outcomes showed that the proposed protocol may highly lessen the frequency of forced checkpoints by comparison to Lazy-HMNR.

P2P 컴퓨팅에서 중복 수행 결과의 정확성 검증 기법 (A Verification of Replicated Operation In P2P Computing)

  • 박찬열
    • 컴퓨터교육학회논문지
    • /
    • 제7권3호
    • /
    • pp.35-43
    • /
    • 2004
  • 인터넷을 기반으로 독립적인 장치들이 참여하는 P2P 컴퓨팅은 원하는 목적을 달성하는데 있어서 참여 장치들의 이탈, 고장, 네트워크 상태, 익명성 등으로 인해 잦은 접속단절과 보안 공격을 겪는다. 여러 연구와 구현에서 이러한 문제들을 해결하기 위해 공유되는 자원의 중복 기법을 사용한다. 이 논문에서는 컴퓨팅 자원의 공유를 목적으로 하는 P2P 컴퓨팅에서 수행되는 작업의 중복 수행을 통해 접속단절과 보안 공격에도 올바른 결과를 얻어내는 정확성 검증 기법을 제안한다. 제안하는 기법에서는 종속성이 존재하는 단위작업들에 대해 시스템 전체의 전역적인 메시지 교환 없이 주기적으로 정확성을 검증하고, 검증된 결과는 검사점이 되어 복귀 회복이 가능한 결함 포용이 가능하다.

  • PDF

하드웨어 성능 카운터와 디버깅 기능을 이용한 리코드-리플레이 방법 (An Efficient Record-Replay Mechanism using Hardware Performance Counters and Debugging Facilities)

  • 맹지찬;유민수
    • 정보처리학회논문지A
    • /
    • 제18A권5호
    • /
    • pp.177-180
    • /
    • 2011
  • 본 논문에서는 인터럽트의 기록과 재현을 통해 소프트웨어의 실행을 동일하게 재현하는 리코드-리플레이(record-replay) 기법을 제안한다. 전통적인 리코드-리플레이 방법에서는 경합(race) 현상을 대표적인 비결정적 요인으로 간주하여 임계영역으로의 진입/진출, 공유 메모리 접근, 메시지 교환 등을 기록하고 동일한 순서(order)로 재현하는 방법을 다루어 왔다. 하지만, 인터럽트 역시 프로그램의 실행에 영향을 끼칠 수 있는 중요한 비결정적 요인이며, 게다가 인터럽트의 경우 발생 순서는 물론 정확한 발생 시점을 재현하는 것이 필요하다. 이에 본 논문에서는 프로세서 하드웨어가 제공하는 성능 카운터와 디버깅 기능을 이용하여 인터럽트의 발생 시점을 정확하게 기록하고 재현하는 방법을 제안한다.

원격 로깅 기법을 이용하는 고장 허용 소프트웨어 분산공유메모리 시스템의 구현 (An Implementation of Fault Tolerant Software Distributed Shared Memory with Remote Logging)

  • 박소연;김영재;맹승렬
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권5_6호
    • /
    • pp.328-334
    • /
    • 2004
  • 최근에 소프트웨어 분산공유메모리 시스템은 그 성능이 높아짐에 따라 큰 규모의 클러스터 상에서 사용되는 경우가 많아졌다. 그러나 시스템 규모가 커지면서 고장이 발생하는 가능성도 높아졌다. 시스템의 가용성을 높이기 위하여 고장 허용 기능을 제공하는 분산공유메모리 시스템이 요구되었으며 메시지 로깅에 대한 많은 연구가 이루어져 왔다. 본 논문에서는 고속의 네트웍을 이용하여 복구에 필요한 메시지들을 원격 노드의 메모리에 로깅 하는 방법을 제안한다. 원격 로깅은 정상 수행 동안 빈번한 디스크 접근을 요구하지 않으므로 오버헤드가 적다. 또한 로그를 유지하는 백업 노드들이 고장나지 않은 경우 다중 노드의 고장을 허용하여, 분산공유메모리 시스템의 신뢰성을 높인다. 본 논문에서는 FT-KDSM (Fault Tolerant KAIST DSM) 시스템을 설계하고 구현하여 원격 로깅의 성능을 보이고 고장으로부터의 복구 시간을 보인다.

인과적 메시지 로그 및 복구를 위한 효율적인 알고리즘 (Efficient Algorithms for Causal Message Logging and Revoery)

  • 이병주;박태순;염헌영;조유근
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권7호
    • /
    • pp.767-777
    • /
    • 1999
  • 인과적 메시지 로깅 기법은 정상프로세스를 역전(roll-back)시키거나 메시지의 저장을 위해 프로세스의 수행을 중단시키지 않는 장점을 지니고 있지만, 메시지의 크기가 지나치게 커진다는 단점을 지니고 있다. 본 논문에서는 인과적 메시지 로깅 기법의 이러한 문제점을 해결하기 위하여 로그 상속의 개념을 정의하고 로그 연혁을 이용하여 로그 비용, 특히 로그 크기 면에서 효율적인 로깅 기법을 제안한다. 또한 이 로깅 알고리즘을 이용하여 복구시 메시지의 수와 크기를 줄여 복구시간을 줄이는 효율적인 복구 알고리즘을 제안하고, 제안한 알고리즘이 메시지 로그 크기 면에서 효율적임을 증명한다. 또 제안한 알고리즘의 성능을 검증하기 위하여 두 가지 종류의 모의 실험을 수행하여 기존의 로깅 프로토콜과 메시지 크기 면에서의 성능을 비교한 결과를 제시하였다.Abstract Causal message logging has many good properties such as nonblocking message logging and no rollback propagation. However, it requires a large amount of information to be piggybacked on each message, which may incur severe performance degradation. This paper presents an efficient causal logging algorithm based on the new message log structure, LogOn, which represents the causal inter-process dependency relation with much smaller overhead compared to the existing algorithms. The proposed algorithm is efficient in the sense that it entails no additional information other than LogOn to be carried in each message, while other existing algorithms require extra information other than the message logs. This paper also presents an efficient recovery algorithm to solve the problem of a large amount of data exchanges during the recovery. To verify the performance of our algorithm, we give an analysis of the algorithm and perform two simulations and compare the log size with other causal logging protocols.

IMMORTAL : 원격 메쏘드 호출에 기반한 결함허용 분산 미들웨어 시스템 (IMMORTAL : Fault Tolerant Distributed Middleware System based on Remote Method Invocation)

  • 현무용;김식;김명준;야마키다 지로
    • 한국정보과학회논문지:정보통신
    • /
    • 제29권5호
    • /
    • pp.562-572
    • /
    • 2002
  • 분산 시스템을 지원하기 위한 패러다임으로서 분산객체 기술이 각광받고 있다. DSOM, DCOM, CORBA, Java RMI 등으로 대표되는 분산 미들웨어 플렛폼들은 분산 어플리케이션의 개발을 용이하게 하지만, 어플리케이션들의 신뢰성 및 가용성을 증진시키기 위한 직접적인 지원은 미흡한 상태이다. 분산 객체 패러다임을 지원하기 위한 결함 허용 기술의 개발 작업은 상당히 복잡하며, 오류가 발생할 소지가 높기 때문에, 분산 객체의 신뢰성과 가용성을 지원하는 개발툴에 대한 요구가 급증하고 있는 실정이다. 본 논문에서는 RMI에 기반한 결함허용 분산 미들웨어 시스템인 IMMORTAL을 제안하고자 한다. 제안된 시스템은 신뢰성 있는 분산 컴퓨팅을 지원하기 위해 로그 기반 롤백 복구 메커니즘을 채택하였다. 일련의 실험을 통해 IMMORTAL 하에서 동작중인 실험용 어플리케이션들이 다양한 하드웨어 및 소프트웨어 결함에도 불구하고 지속적으로 동작함을 확인하였고, 제안된 시스템의 성능 및 비례확장성을 평가하였다.