• 제목/요약/키워드: fault tolerance information

검색결과 328건 처리시간 0.027초

고 신뢰성 큐브 네트웍 (Enhanced Cube Network for the High Reliability)

  • 문영성
    • 인터넷정보학회논문지
    • /
    • 제4권6호
    • /
    • pp.25-31
    • /
    • 2003
  • 고성능 컴퓨팅 및 통신을 위하여 상호연결네트워크는 효율적이며 신뢰성이 높아야 한다. 상호연결네트워크의 훨트 톨러런스를 높이기 위해 제안되었던 이전 방안들은 효율성이 떨어지거나 추가적인 오버헤드가 너무 많이 필요하였다. 따라서 본 논문에서는 비교적 간단한 구조로 높은 신뢰성을 제공하면서도 효율적인 상호연결네트워크를 제안한다. 제안된 구조의 신뢰도를 이전의 제안되었던 구조와 비교하여 우수함을 입증한다.

  • PDF

하이퍼큐브를 이용한 결함 허용 라우팅 알고리즘 (Fault-Tolerant Routing Algorithm in Hypercube Multicomputers)

  • 최병환;강성수;이충세
    • 한국통신학회논문지
    • /
    • 제30권5C호
    • /
    • pp.320-328
    • /
    • 2005
  • 하이퍼 큐브는 정규적이며 결함 허용 능력을 갖고 있기 때문에 결함 허용 알고리즘을 구현하기 쉽다. 하이퍼 큐브를 이용한 결함 허용 알고리즘들이 많이 개발되었다. 이러한 알고리즘들 중에 안전(safe)과 불안정(unsafe) 개념을 이용한 알고리즘이 Masuyama등에 의해 개발되었다. 이 논문에서는 Masuyama의 알고리즘을 개선한 새로운 알고리즘을 제안하고 시뮬레이션을 통하여 성능을 비교한다.

Active-Active 방식의 DNS 서버의 이중화 구축 및 결함내성 시험 (Foundation Techniques and Fault-tolerance Tests of Active-Active Duplicated Domain Name Servers)

  • 최재원
    • 한국정보통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.90-100
    • /
    • 2013
  • 본 논문에서는 기존의 Active-Standby 방식의 이중화가 아닌 Active-Active 방식의 DNS (Domain Name System) 이중화에 관해 연구하였다. Active-Active 방식의 DNS 이중화를 위해 1, 2차 DNS 서버 간에는 rsync와 crontab을 이용하여 주기적으로 복사하여 동일한 상태를 유지하고, 1차 혹은 2차 DNS 서버가 장애로 인해 정지되더라도 살아 있는 DNS 서버가 계속해서 서비스를 지속하도록 하였다.

다중 Gigabit Server NICs에서 동적 검출 주기를 적용한 결함 허용 메커니즘 (A Fault Tolerance Mechanism with Dynamic Detection Period in Multiple Gigabit Server NICs)

  • 이진영;이시진
    • 인터넷정보학회논문지
    • /
    • 제3권5호
    • /
    • pp.31-39
    • /
    • 2002
  • 인터넷의 초고속 성장과 멀티미디어 데이터의 급격한 증가로 고속의 전송 매체와 인터페이스 시스템이 요구되고 있다. 이러한 고속의 네트워크 대역폭을 지원하기 위한 대안으로 다중(Multiple) NIC가 개발되고 연구되어 왔다. 다중 NIC를 사용함으로써 기존 네트워크 환경의 큰 변화 없이 고속의 LAN 환경을 구축할 수 있으므로 고성능. 저비용의 효과를 얻을 수 있다. 그러나 대용량 다중 NIC에 SPOF(Singe Point Of Failure) 결함으로 시스템 중단이 생기면, 대용량의 멀티미디어 데이터를 서비스하는 시스템인 만큼 커다란 손실을 가져오게 된다. 따라서 본 논문에서는 결함으로 오는 손실을 방지하기 위해 결함 허용 기법을 사용하여 '결함 허용 다중 NIC'에 대해서 연구한다. 기존의 TMR, Primary-Standby 기법. Watchdog Timer 기법에서 발생되는 자원에 대한 가용성과 내구성의 비효율적인 부분을 고려하여, 동적으로 검출 주기를 변환하여 다운타임을 최소화 할 수 있는 효율적인 결함 허용 메커니즘을 설계하여 제안한다. 결과적으로 본 논문에서 제안한 결함 허용 기법은 결함이 발생하여 생기는 오버헤드 시간을 줄이고자, Fault Detection에서 소요되는 Timeout 시간을 감소시켜 시스템 전반적으로 다운타임을 최소화시킬 수 있다.

  • PDF

결함 허용을 제공하는 원격 프로시듀어 호출 기법 (Remote Procedure Call Scheme to Support Fault-Tolerance)

  • 한석진;구용완
    • 한국정보처리학회논문지
    • /
    • 제2권4호
    • /
    • pp.453-465
    • /
    • 1995
  • 원격 프로시듀어 호출은 좀 더 효율적이며 신뢰성이 가미된 분산 프로그램을 프로 그래머가 작성하기 쉽도록 하기 위하여 연구 되어 왔다. 본 연구에서는 하드웨어 결함 에 대한 신뢰성 있는 결함 허용 원격 프로시듀어 호출 기법을 제시한다. 결합 허용은 chain이라 불리는 노드의 그룹으로 프로시듈어를 복제 하여 제공하며, chain내의 사본 들은 선형적인 순서로 되어 있다. 프로시듀어에 대한 호출은 chain내의 첫 번째 사본 (primary copy)으로 보내지며, 나머지 사본에게는 내부적으로 전파된다. 결함이 발생 한 경우, 결함이 발생하지 않은 chain 내의 첫 번째 사본이 caller에게 결과를 반환하 게 된다. 특히, 제한적으로 ack message을 사용함으로써 중복된 call message와 result message의 처리를 피하였다. 이 기법은 기존의 원격 프로시듀어 호출에 비하여 효율적 이고 신뢰성 있는 결함 허용을 제공하게 된다.

  • PDF

계층적 지역 등록 Mobile IP에서 백업 FA를 이용한 장애 관리 구조 (A Fault Management Architecture Using Backup FA in Hierarchical Local Registration Mobile IP)

  • 임기운;홍충선;이대영
    • 한국통신학회논문지
    • /
    • 제26권11C호
    • /
    • pp.1-9
    • /
    • 2001
  • Mobile IP 프로토콜은 IP 호스트들이 IP 주소의 변화 없이 다른 네트워크 사이를 이동하는 것을 지원해준다. 지역 등록을 지원하는 Mobile IP 시스템은 비교적 먼 곳에 위치한 Home Agent로의 홈 등록 메시지의 빈도를 줄이기 위해 제안되어졌다. 이 지역 등록 Mobile IP 프로토콜은 MN의 등록 요청을 가려내 에이젼트가 처리함으로 성능 향상을 가져온다. 그러나 지역 등록 Mobile IP 접근 방법은 FA 장애 극복과 같은 몇 가지 고려해야 문제점을 가지게 된다. 본 논문에서는 계층적 지역 등록 Mobile IP에서 FA의 장애 극복하기 위한 기존의 프로토콜에 대해 살펴보고 계층적 지역 등록 Mobile IP에서 백업 FA에 의해 FA의 장애를 효율적으로 극복하는 새로운 FA 장애 극복 프로토콜에 대해 제안한다.

  • PDF

교정 제어를 이용한 비동기 순차 머신의 영구 고장 극복 (Corrective Control of Asynchronous Sequential Machines for Tolerating Permanent Faults)

  • 양정민
    • 전자공학회논문지SC
    • /
    • 제47권5호
    • /
    • pp.9-17
    • /
    • 2010
  • 교정 제어는 비동기 순차 머신의 안정 상태 동작을 원하는 목적에 맞게 바꾸어주는 역할을 한다. 본 논문에서는 교정 제어를 이용하여 영구 고장이 존재하는 비동기 순차 머신의 고장 극복 기법을 제안한다. 비동기 순차 머신에서 영구 고장이 발생하면 머신은 원래 상태로 영원히 회복되지 못하고 제한된 상태 집합 내에서만 동작하게 된다. 하지만 비동기 순차 머신이 줄어든 작동 범위 안에서도 정상적인 동작을 계속할 수 있는 여유도를 가지고 있다면 교정 제어 기법을 이용하여 고장 극복 문제를 해결할 수 있다. 본 논문에서는 영구 고장을 탐지할 수 있는 조건과 함께 고장 극복 문제를 푸는 교정 제어기가 존재할 필요충분조건을 밝힌다. 또한 사례 연구를 통해서 제안된 제어기의 설계 과정을 예시한다.

Fault-tolerant ZigBee-based Automatic Meter Reading Infrastructure

  • Hwang, Kwang-Il
    • Journal of Information Processing Systems
    • /
    • 제5권4호
    • /
    • pp.221-228
    • /
    • 2009
  • Due to low cost, low-power, and scalability, ZigBee is considered an efficient wireless AMR infrastructure. However, these characteristics of ZigBee can make the devices more vulnerable to unexpected error environments. In this paper, a fault-tolerant wireless AMR network (FWAMR) is proposed, which is designed to improve the robustness of the conventional ZigBee-based AMR systems by coping well with dynamic error environments. The experimental results demonstrate that the FWAMR is considerably fault-tolerant compared with the conventional ZigBee-based AMR network.

Analytic Model for Optimal Checkpoints in Mobile Real-time Systems

  • Lim, Sung-Hwa;Lee, Byoung-Hoon;Kim, Jai-Hoon
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권8호
    • /
    • pp.3689-3700
    • /
    • 2016
  • It is not practically feasible to apply hardware-based fault-tolerant schemes, such as hardware replication, in mobile devices. Therefore, software-based fault-tolerance techniques, such as checkpoint and rollback schemes, are required. In checkpoint and rollback schemes, the optimal checkpoint interval should be applied to obtain the best performance. Most previous studies focused on minimizing the expected execution time or response time for completing a given task. Currently, most mobile applications run in real-time environments. Therefore, it is extremely essential for mobile devices to employ optimal checkpoint intervals as determined by the real-time constraints of tasks. In this study, we tackle the problem of determining the optimal inter-checkpoint interval of checkpoint and rollback schemes to maximize the deadline meet ratio in real-time systems and to build a probabilistic cost model. From this cost model, we can numerically find the optimal checkpoint interval using mathematical tools. The performance of the proposed solution is evaluated using analytical estimates.

Rotational Wireless Video Sensor Networks with Obstacle Avoidance Capability for Improving Disaster Area Coverage

  • Bendimerad, Nawel;Kechar, Bouabdellah
    • Journal of Information Processing Systems
    • /
    • 제11권4호
    • /
    • pp.509-527
    • /
    • 2015
  • Wireless Video Sensor Networks (WVSNs) have become a leading solution in many important applications, such as disaster recovery. By using WVSNs in disaster scenarios, the main goal is achieving a successful immediate response including search, location, and rescue operations. The achievement of such an objective in the presence of obstacles and the risk of sensor damage being caused by disasters is a challenging task. In this paper, we propose a fault tolerance model of WVSN for efficient post-disaster management in order to assist rescue and preparedness operations. To get an overview of the monitored area, we used video sensors with a rotation capability that enables them to switch to the best direction for getting better multimedia coverage of the disaster area, while minimizing the effect of occlusions. By constructing different cover sets based on the field of view redundancy, we can provide a robust fault tolerance to the network. We demonstrate by simulating the benefits of our proposal in terms of reliability and high coverage.