• 제목/요약/키워드: 체크포인팅

검색결과 37건 처리시간 0.027초

Cactus와 Globus에 기반한 그리드 컴퓨팅 환경에서의 응용프로그램 수준의 체크포인팅을 사용한 동적 재구성 기법 (A Dynamic Reconfiguration Method using Application-level Checkpointing in a Grid Computing Environment with Cactus and Globus)

  • 김영균;오길호;조금원;나정수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권6호
    • /
    • pp.465-476
    • /
    • 2005
  • 본 논문에서는 Cactus와 Globus 기반의 그리드 컴퓨팅 환경에서 응용프로그램 수준의 체크 포인팅을 사용한 동적 재구성(Dynamic Reconfiguration) 기법을 새로이 제안하였다. 기존의 동적 재구성은 특정 하드웨어와 운영체제에 종속적이었으나 제안한 방법은 특정 하드웨어와 운영체제의 지원 없이 동적재구성이 가능하고 응용프로그램도 동적 재구성을 고려할 필요 없이 프로그래밍이 가능하다. 제안한 동적 재구성 기법에서 초기 연산자원의 구성을 갖고 실행되는 작업은 실행 중에 동적으로 발견된 새로운 연산자원을 포함하여 계속 연산을 수행한다. 본 연구에서 제안된 방법은 새롭게 발견된 연산자원의 프로세서 성능과 유휴 메모리를 고려하여, 해당 연산자원을 수행중인 연산에 포함할 것인가 여부를 결정한다 연산중 연산 결과의 실시간 가시화를 가능하도록 하고 운영체제에 종속적이지 않은 응용프로그램 수준의 체크 포인팅 기법을 사용하여 중간 연산결과를 저장한다. 새롭게 발견된 유휴사이트, 유휴프로세서를 포함하도록 연산자원의 구성을 재구성한 후 체크 포인팅 파일을 사용하여 작업을 계속 실행한다. 제안한 동적 재구성 기법은 K*Grid 환경에서 연산시간을 단축함을 확인하였다.

셀룰라 네트워크 환경에서의 이중화 체크포인팅을 이용한 이동 호스트 및 기지국 결함 복구 기법 (Replicated Chaeckpointing Failure Recovery Schemes for Mobile Hosts and Mobile Support Station in Cellular Networks)

  • 변계섭;김재훈
    • 한국통신학회논문지
    • /
    • 제27권1B호
    • /
    • pp.13-23
    • /
    • 2002
  • 이동 호스트는 무선 통신망의 낮은 대역폭과 호스트들의 이동성, 부족한 저장장치와 배터리 수명 등으로 인하여 결함 발생 가능성이 높다. 이동 호스트의 결함에 효율적으로 대처하기 위한 결함 허용 기법에 관한 연구가 많이 진행되어 왔다. 셀룰라 네트워크에서는 이동 호스트이외에도 이동 호스트를 연결시키는 기지국은 보다 높은 수준의 가용도를 요구하므로 기지국의 결함에 대한 연구도 필수적이다. 본 논문에서는 이동 호스트 결함 복구를 위한 체크포인팅 기법을 기반으로 기지국 결함 복구를 위한 체크포인팅 이중화 기법을 제안하고 성능을 분석하였다. 또한 이동 호스트의 결함 복구를 위해 체크포인트가 존재하는 기지국의 복구를 기다리는 방법과 다른 기지국의 체크포인트를 이용하는 방법의 성능을 비교 분석하였다.

뉴메모리 기반 시스템에서 세밀한 COW 관리 기법을 통한 효율적 프로세스 체크포인팅 기법 (Efficient Process Checkpointing through Fine-Grained COW Management in New Memory based Systems)

  • 박재형;문영제;노삼혁
    • 정보과학회 논문지
    • /
    • 제44권2호
    • /
    • pp.132-138
    • /
    • 2017
  • 본 연구에서는 뉴메모리 기반 컴퓨팅 시스템의 신뢰성을 높이기 위해 프로세스 단위로 체크포인팅하는 시스템을 설계하고 구현한다. 프로세스 체크포인팅을 위하여 일반적인 프로세스 실행에서 문맥전환이 일어나는 시점마다 결함이 발생하기 이전의 안전한 상태로 되돌아갈 수 있는 롤백 시점을 만든다. 본 연구에서는 롤백 시점의 안전한 프로세스 상태에 대한 새로운 프로세스를 만들며 이를 P-process(Persistent-process)라고 명명한다. P-process를 만드는 주기를 세밀한 간격인 문맥전환 때마다 만들기 때문에 결함이 발생하였을 때 롤백으로 인한 프로세스 실행시간 손실을 작게 만들 수 있다. P-process를 만드는 오버헤드를 줄이기 위하여 프로세스의 메모리 상태에서 변경된 부분만 저장할 수 있도록 COW(Copy-On-Write) 메커니즘을 이용하였다. 문맥전환 때마다 P-process를 생성하였을 때 PARSEC 벤치마크의 11개 워크로드 중 8개의 워크로드에서 5% 내의 실행 시간 오버헤드가 발생하였으며 오버헤드가 많이 발생한 워크로드도 P-process의 생성 주기의 조정으로 오버헤드를 감소시킬 수 있었다.

셀룰라 네트워크를 위한 조정된 2-계층 체크포인팅 알고리즘 (Two-Tier Coordinated Checkpointing Algorithm for Cellular)

  • 변계섭;김재훈
    • 한국통신학회논문지
    • /
    • 제26권10A호
    • /
    • pp.1615-1624
    • /
    • 2001
  • 이동 컴퓨팅 환경에서는 충분하지 못한 자원으로 인해 기존의 분산 알고리즘이 비효과적인 경우가 많다. 특히 이동 호스트의 낮은 가용성으로 인하여 중단 없는 서비스를 보장받기 힘들다. 이들의 원인은 낮은 대역폭과 호스트들의 이동성, 작은 저장장치 및 안전하지 않은 저장장치, 이동 호스트와 이동 호스트, 이동 호스트와 기지국간의 통신 오버헤드 그리고 충분하지 못한 배터리 수명들을 들 수 있다. 특히 통신 오버헤드(이동 호스트를 찾는 오버헤드, 이동 호스트의 정보를 저장하는 오버헤드 등)로 인해 호스트의 배터리 수명을 단축시키고 통신비용을 증가시킨다. 이러한 통신 오버헤드를 최소화함으로써 이동 호스트의 배터리 수명이나 고장으로부터 좀 더 안전한 시스템을 구성할 수 있다. 본 논문에서는 셀룰라 네트워크를 기반으로 하는 이동 컴퓨팅 환경에서 통신비용과 이동 호스트의 작업을 최소화시키는 조정된 2-계층 체크포인팅(coordinated checkpointing) 알고리즘을 제안하고 수학적으로 비용을 분석하였으며 기존 알고리즘과 성능을 비교하였다. 기존의 조정된 체크포인팅 알고리즘에서 통신비용(메시지 수)의 복잡도는 이동 호스트의 수의 제곱(O(n$^2$))이지만, 제안한 알고리즘은 기지국의 수 더하기 이동 호스트의 수의 제곱(O(n+$m^2$))이다. 일반적으로 기지국의 수에 비해 이동 호스트의 수가 상대적으로 훨씬 많기 때문에 (n>>m) 기존의 알고리즘에 비해 제안한 알고리즘은 상대적으로 많은 통신비용을 감소시킬 수 있다.

  • PDF

셀룰라 네트워크 환경에서의 효율적인 기지국 결함 복구 기법 (Efficient Failure Recovery Schemes far Mobile Support Station in Cellular Networks)

  • 변계섭;김재훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.127-129
    • /
    • 2001
  • 이동 호스트는 무선 통신망의 낮은 대역폭과 호스트들의 이동성, 부족한 저장장치와 배터리 수명 등으로 인하여 결함 발생 가능성이 높다. 이동 호스트의 결함에 효율적으로 대처하기 위한 결함 허용 기법에 관한 연구가 많이 진행되어 왔다. 셀룰라 네트워크에서는 이동 호스트이외에도 이동 호스트를 연결시키는 기지국은 보다 높은 수준의 가용도를 요구하므로 기지국의 결함에 대한 연구도 필수적이다. 본 논문에서는 이동 호스트 결함 복구를 위한 체크포인팅 기법을 기반으로 기지국 결함 복구를 위한 체크포인팅 이중화 기법을 제안하고 성능을 분석하였다. 또한 이동 호스트의 결함 복구를 위해 체크포인트가 존재하는 기지국의 복구를 기다리는 방법과 다른 기지국의 체크포인트를 이용하는 방법의 성능을 비교 분석하였다.

  • PDF

객체지향 종속 추적 및 체크포인팅(checkpointing)을 이용한 복구 가능한 분산 공유 메모리 시스템 (Recoverable Distributed shared Memory Systems Using Object-Oriented Dependency Tracking and Checkpointing)

  • 김재훈
    • 한국정보처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.476-484
    • /
    • 1999
  • 메시지 전달 방식으로 노드간 통신을 하는 분산 시스템의 고장허용을 위하여 메시지 저장과 체크 포인팅에 관한 많은 연구가 이루어졌다. 복구 가능한 분산 공유메모리 시스템에 대한 대부분의 연구 또한 메시지 전달 방식에서 사용되었던 방법을 채택하였다. 그러나, 메시지 전송시스템과 분산공유메모리 시스템의 근본적인 차이(함수전달(function shipping)과 데이터전달(data shipping)의 차이) 때문에 메시지 전달 시스템에서 사용되었던 방식이 분산공유메모리 시스템에 항상 적합하게 사용될 수 없다. 본 논문에서는 복구 가능한 분산공유메모리 시스템을 위하여 객체지향방법을 제안하였다. 프로세스간 종속 추적대신 페이지간 종속 추적을 이용한 체크 포인팅 및 복구 가능한 전략을 분산 공유 메모리 시스템에 적용하였다.

  • PDF

분산시스템에서 가상 체크포인팅을 이용한 비동기화 체크포인팅 알고리즘 (An Asychronous Checkpointing Algorithm Using Virtual Checkpointing On Distributed Systems)

  • 김도형;박창순;김종
    • 한국정보처리학회논문지
    • /
    • 제6권5호
    • /
    • pp.1203-1211
    • /
    • 1999
  • Checkpointing is the one of fault-tolerant techniques to restore faults and to restart job fast. Checkpointing algorithms in distributed systems have been studied for many years. These algorithms can be classified into synchronous Checkpointing algorithms and asynchronous Checkpoiting algorithms. In this paper, we propose an independent Checkpointing algorithm that has a minimum Checkpointing counts equal to periodic Checkpointing algorithm, and relatively short rollback distance at faulty situation. Checkpointing count is directly related to task completion time in a fault-free situation and short rollback distance is directly related to task completion time in a faulty situation. The proposed algorithm is compared with the previously proposed asynchronous Checkpointing algorithms using simulation. In the simulation, the proposed Checkpointing algorithm produces better results than other algorithms in terms of task completion time in fault-free as well as faulty situations.

  • PDF

모바일 컴퓨팅을 위한 조정된 체크포인팅 알고리즘 (Coordinated Checkpointing Algorithm for Mobile Computing Systems)

  • 변계섭;김재훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.511-513
    • /
    • 2001
  • 이동 컴퓨팅 환경에서는 충분하지 못한 자원으로 인해 기존의 분산 알고리즘이 비효과적인 경우가 많다. 특히 이동 호스트의 낮은 가용성으로 인하여 중단 없는 서비스를 보장받기 힘들다. 이들의 원인은 낮은 대역폭과 호스트들의 이동성, 작은 저장공간 및 안전하지 않은 저장장치, 이동 호스트와 기지국간 또는 이동 호스트들 사이의 통신 오버헤드 그리고 충분하지 못한 베터리 수명들을 들 수 있다. 특히 통신 오버헤드(이동 호스트를 찾는 비용, 이동 호스트의 정보를 저장하는 비용 등)로 인해 이동 호스트의 베터리 수명을 단축시키고 통신 비용을 증가시킨다. 이러한 통신 오버헤드를 최소화함으로써 이동 호스트의 베터리 수명을 연장시키고 시스템의 성능을 향상시킬 수 있다. 본 논문에서는 셀룰라 네트워크를 기반으로 하는 이동 컴퓨팅 환경에서 통신비용과 이동 호스트의 작업을 최소화시키는 조정된 체크포인팅(coordinated checkpointing) 알고리즘을 제안하고 수학적으로 비용을 분석하였으며 기존 알고리즘과 성능을 비교하였다.

클러스터 기반 라우팅 프로토콜을 위한 결함허용기법 (A Fault-tolerant Scheme for Clustering Routing Protocols)

  • 민홍;김봉재;정진만;김석현;윤진혁;조유근;허준영;이상호;홍지만
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권6호
    • /
    • pp.668-672
    • /
    • 2010
  • 무선 센서 네트워크에서의 결함 허용은 센서 노드의 취약성 보완과 신뢰성 높은 정보 제공을 위해 필요하다. 센서 노드들의 자원 제약적인 특성 때문에 오류에 노출되기 쉬우며, 기존의 체크포인팅 기법 들은 센서 네트워크의 특성을 고려하지 않고 설계되었기 때문에 이를 적용하기 어렵다. 본 논문에서는 클러스터 기반의 라우팅 프로토콜에 체크포인팅 기법을 적용하여 헤드 노드의 결함 시 발생할 수 있는 정보 손실과 높은 복구 비용 문제를 해결하는 방법을 제안한다.

모바일 호스트의 안정적인 복구를 위한 메시지 로그 기법들의 성능비교 (Performance Comparison of Message Log Methods for Stable Recovery of Mobile Host)

  • 최가현;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.27-30
    • /
    • 2004
  • 모바일 컴퓨팅 환경은 네트워크가 손상되기 쉬우며, MH(Mobile Host)를 지원하는 MSS(Mobile Support Station)가 안정적이지 못하기 때문에, 이런 상황을 고려하여 시스템 환경을 모델링 한다. 메시지 전송 시 에러가 발생했을 경우 복구 기법으로 체크포인팅 기법과 메시지 로깅 기법을 추가적으로 사용하게 된다. 본 논문에서는 움직임을 기반으로 한 모바일 시스템 환경에서 체크포인트와 함께 메시지 로그를 사용하는 기법의 성능을 비교하고자 한다.

  • PDF