• 제목/요약/키워드: fault tolerant system

검색결과 422건 처리시간 0.02초

Robust Backup Path Selection in Overlay Routing with Bloom Filters

  • Zhou, Xiaolei;Guo, Deke;Chen, Tao;Luo, Xueshan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권8호
    • /
    • pp.1890-1910
    • /
    • 2013
  • Routing overlay offers an ideal methodology to improve the end-to-end communication performance by deriving a backup path for any node pair. This paper focuses on a challenging issue of selecting a proper backup path to bypass the failures on the default path with high probability for any node pair. For existing backup path selection approaches, our trace-driven evaluation results demonstrate that the backup and default paths for any node pair overlap with high probability and hence usually fail simultaneously. Consequently, such approaches fail to derive a robust backup path that can take over in the presence of failure on the default path. In this paper, we propose a three-phase RBPS approach to identify a proper and robust backup path. It utilizes the traceroute probing approach to obtain the fine-grained topology information, and systematically employs the grid quorum system and the Bloom filter to reduce the resulting communication overhead. Two criteria, delay and fault-tolerant ability on average, of the backup path are proposed to evaluate the performance of our RBPS approach. Extensive trace-driven evaluations show that the fault-tolerant ability of the backup path can be improved by about 60%, while the delay gain ratio concentrated at 14% after replacing existing approaches with ours. Consequently, our approach can derive a more robust and available backup path for any node pair than existing approaches. This is more important than finding a backup path with the lowest delay compared to the default path for any node pair.

태스크 기반 이중화 방안 (Paper Duplication Method Supported by Task)

  • 이종찬;박상준;강권일
    • 한국통신학회논문지
    • /
    • 제27권1C호
    • /
    • pp.103-111
    • /
    • 2002
  • IMT-2000에서 RNC의 Main Control Processor는 호 처리를 담당하는 부분으로, 고신뢰도와 실시간성이 요구되므로 결함 허용 시스템의 연구가 중요하다. 이를 위하여 본 연구에서는 태스크 기반 이중화 방안을 제안한다. 이 방안은 Active side의 태스크들이 메시지 단위로 동작하고, 동작 후 변경된 메모리 영역의 데이터를 Standby side에 전달하는 방식을 기본으로 하며, 절체 시 recovery를 위해 메시지를 logging하는 방식이다. 제안한 방식은 dual down 및 동기화 과정의 복잡성을 제거 할 뿐만 아니라, 태스크가 동기를 제어하므로 좀 더 정확한 동기화가 가능하다. 또한 효과적으로 태스크 기반 이중화를 수행하기 위한 결함 탐지 및 처리 방안을 제시한다. 이 방안은 결함 탐지 확률을 높이고 결함에 의하여 발생한 오류 데이터가 Standby side로 전송되는 것을 원천적으로 차단하는 것에 중점을 둔다.

다중구조관리자 특성이 반영된 확률모델 기반의 몬테카를로 신뢰도 해석 기법 연구 (Reliability Analysis of a System with Redundancy Management Based on Monte-Carlo Probability Model)

  • 김성수;박상혁;김성환;최기영;박춘배;하철근
    • 제어로봇시스템학회논문지
    • /
    • 제17권11호
    • /
    • pp.1132-1137
    • /
    • 2011
  • Critical systems with high reliability feature fault tolerant redundancy. Conventional analytical reliability analysis methods that use the Reliability Block Diagram do not adequately reflect characteristics of the redundancy management system and are not suitable for this applications. This paper uses Monte-Carlo method to calculate the reliability of complicated redundant systems. The method was first validated for cases with analytical solutions. Then, the tool was successfully applied to analyze reliability of the flight control systems with a voter as redundancy management system.

Concurrency Control Method to Provide Transactional Processing for Cloud Data Management System

  • Choi, Dojin;Song, Seokil
    • International Journal of Contents
    • /
    • 제12권1호
    • /
    • pp.60-64
    • /
    • 2016
  • As new applications of cloud data management system (CDMS) such as online games, cooperation edit, social network, and so on, are increasing, transaction processing capabilities for CDMS are required. Several transaction processing methods for cloud data management system (CDMS) have been proposed. However, existing transaction processing methods have some problems. Some of them provide limited transaction processing capabilities. Some of them are hard to be integrated with existing CDMSs. In this paper, we proposed a new concurrency control method to support transaction processing capability for CDMS to solve these problems. The proposed method was designed and implemented based on Spark, an in-memory distributed processing framework. It uses RDD (Resilient Distributed Dataset) model to provide fault tolerant to data in the main memory. In our proposed method, database stored in CDMS is loaded to main memory managed by Spark. The loaded data set is then transformed to RDD. In addition, we proposed a multi-version concurrency control method through immutable characteristics of RDD. Finally, we performed experiments to show the feasibility of the proposed method.

AVTMR 시스템의 설계 및 RAM 평가 (Design of AVTMR system and Evaluation of RAM (Reliability, Availability, Maintainability))

  • 김현기;이기서
    • 한국통신학회논문지
    • /
    • 제25권12B호
    • /
    • pp.2016-2024
    • /
    • 2000
  • 본 논문에서는 결함의 영향을 받지 않고 동작할 수 있는 AVTMR(All Voting Triple Modular Redundancy) 시스템을 개발하였으며, MILSPEC-217F에 기반을 둔 고장율을 계산하여 AVTMR과 SS(Single System) 시스템을 비교 및 평가하였다. 설계된 시스템은 MC68000을 기반으로 한 3중화된 다수결 보터(Triplicated Majority Voter)를 이용하여 시스템을 개발하였다. 본 논문에서는 시스템의 신뢰도(Reliability), 가용도(Avaliability), 유지보수도(Maintainability)를 마코브 모델(Markov model)로 평가하였으며, 또한 시스템의 MTTF(Mean Time to Failure)를 계산하여 시스템의 수명을 구하였고, 설계된 AVTMR 시스템이 SS(Single System)보다 전체 시스템 평가에서 우수한 특성을 가진다는 것을 시뮬레이션을 통해 알 수 있었다. 또한, AVTMR 시스템은 결함을 허용(Fault tolerant)하는 시스템 특성을 가지기 때문에, 인간의 생명과 관련된 철도 시스템, 선박 시스템이나 항공기 시스템에 적용될 수 있다.

  • PDF

원자력발전소 안전계통용 고신뢰성 MVB 네트워크 구현 (Implementation of High-Reliable MVB Network for Safety System of Nuclear Power Plant)

  • 설재윤;김기창;김유성;박재현
    • 전기학회논문지
    • /
    • 제61권6호
    • /
    • pp.859-864
    • /
    • 2012
  • The computer network plays an important role in modern digital controllers within a safety system of a nuclear power plant. For the reliable and realtime data communication between controllers, this paper proposes a modified high-reliable MVB(multi-function vehicle bus) as a main control network for a safety system of a nuclear power plant. The proposed network supports the state-based communication in order to ensure the deterministic communication latency, and very fast network recovery when the bus master fails compare to the standard MVB. This paper also shows the implementation results using a FPGA-based testbed.

AVTMR 과 듀얼 듀플렉스 시스템 비교에 관한 연구 (A study on the comparision of AVTMR (All Voting Triple Modular Redundancy) and Dual-Duplex system)

  • 김현기;신석균;이기서
    • 한국통신학회논문지
    • /
    • 제26권6A호
    • /
    • pp.1067-1077
    • /
    • 2001
  • 본 논문에서는 결함의 영향을 받지 않고 동작할 수 있는 AVTMR(All Voting Triple Modular Redundancy) 시스템과 듀얼 듀플렉스(Dual-duplex) 시스템을 설계하고, 각 시스템의 평가를 통하여 RAMS(Reliability, Avaliability, Maintainability, Safety)를 비교하였다. ABTMR 시스템은 3중화된 보터(voter)를 사용하여 설계를 하였으며, 듀얼 듀플렉스 시스템은 비교기(comparator)를 이용하여 시스템을 설계하였다. 각 시스템은 버스 레벨로 데이터를 비교하도록 설계하였으며, 시스템 평가를 위해서 소자의 고장율은 MILSPEC-217F에 기반을 두고 RELEX6.0을 이용하였고, 마코브 모델(Markov model)을 이용하여 시스템의 RAMS를 평가하였다. 본 논문에서는 각 시스템을 MC68000을 기반으로 설계하여, 각각 시스템에 사용되는 비용 및 시스템이 어느 부분에서 선호될 수 있는가를 RAMS 및 MTTF(Mean Time To Failure)를 통하여 선택할 수 있는 기반을 제시하도록 나타내고 있다. 이러한 AVTMR이나 듀얼 듀플렉스 시스템(dual-duplex system)은 결함 허용 시스템(fault tolerant system)으로 인간의 생명과 직접적인 관련이 있는 고속철도 시스템이나 항공기 시스템에 적용될 수 있다.

  • PDF

LMI를 이용한 자기부상 시스템의 $H_{\infty}$ 제어기 설계 ($H_{\infty}$ Controller Design for Electromagnetic Suspension System using LMIs)

  • 장석명;성소영;성호경;김봉섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 추계학술대회 논문집 학회본부 B
    • /
    • pp.280-283
    • /
    • 2000
  • In this paper, a fault tolerant control problem is considered for a class of nonlinear system formulated in a gain scheduling form with LMI-based H-inf control technique Key benefits of this proposed scheme are demonstrated in the simulation of an electromagnetic suspension system with actuator and/or sensor failures, and the method is compared with the convensional state-feedback and output-feedback controller. It is clearly observed that the proposed control scheme shows an improved output performance in comparision with convensional methods.

  • PDF

차량용 지능형 네트워크에서의 동기식 이더넷중심 오류 주입 알고리즘 구현☆ (Synchronize Ethernet-based Fault Injection Algorithm Implementation for Intelligent Automotive Network)

  • 장은지;김인영;이웅재
    • 인터넷정보학회논문지
    • /
    • 제17권4호
    • /
    • pp.43-50
    • /
    • 2016
  • 본 논문은 차량용 지능형 네트워크에서 각광 받게 될 이더넷중심의 프로토콜과 데이터 전송 시 임의의 오류에 내성이 있는 알고리즘을 제안하였다. 동시에 시뮬레이션과 실험을 통해 구현과 검증을 시도하여 시스템의 유용성을 증명하였다. 기존의 차량 통신 서비스 시스템에 적용시키기 위한 알고리즘에 대하여 문헌 조사하고 최종적으로 새로운 알고리즘을 구현하였다. 실제 차량용 실시간 데이터의 경우 임의의 값이 불규칙적으로 발생하기 때문에 임의의 데이터를 생성하여 실험을 진행하고 payload의 설정을 표준 형식에 맞추었다. 구현된 알고리즘의 성능을 확인하고자 기존의 알고리즘에서 단일 데이터에서부터 혼합형 (Hybrid-type) 데이터까지 확인하였을 때의 문제점을 확인하고 제안하는 알고리즘의 실효성을 확인하였다.

하이퍼 큐브 컴퓨터에서 효과적인 오류 허용 다중전송기법 (Efficient Fault-Tolerant Multicast on Hypercube Multicomputer System)

  • 명훈주;김성천
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권5_6호
    • /
    • pp.273-279
    • /
    • 2003
  • 하이퍼큐브 컴퓨터는 정규적 구조(regular structure)와 짧은 지름(short diameter) 등 병렬 처리에 적합한 특징을 지니고 있기 때문에 이에 대해 많은 연구가 있어 왔다. 하이퍼큐브의 성능을 좌우하는 중요한 요소 중 하나는 프로세서간의 통신인데, 이 중 다중전송(multicast)은 하나의 전송데이터의 복제, 신호처리 둥과 같은 다양한 응용 프로그램에서 이용되는 중요한 통신패턴이다. 병렬 컴퓨터에서 프로세서의 수가 증가함에 따라 구성요소들이 오류가 날 확률도 높아졌다. 이러한 이유로, 오류 난 구성요소들이 있어도 다중 전송이 가능하게 효율적으로 설계하는 것이 중요하다. 이러한 오류 허용 라우팅과 다중 전송은 오류 정보에 따라, 국지적 오류 정보를 바탕으로 하는 전략, 전역적 오류 정보를 바탕으로 하는 전략, 제한된 오류 정보를 바탕으로 하는 전략 등이 있는데, 이 중에서 후자가 정보 수집비용이 적으면서도 좋은 성능을 보인다. 본 논문에서는 최근에 제안된 완전 도달성 정보와 새로 추가한 국지적 정보를 이용해서 라우팅 알고리즘을 제안하고, 이것을 바탕으로 다중 전송 성공률이 높은 새로운 다중 전송 알고리즘을 제안한다. 제안 기법은 완전 도달성 정보와 국지적 정보를 이용하여 우회하는 경우와 다중전송 실패하는 경우를 줄임으로써, 기존의 기법보다 통신량의 차이는 거의 없으면서도 다중전송 성공률을 향상시킬 수 있음을 시뮬레이션을 통해 검증하였다.