• Title/Summary/Keyword: a fault-tolerant system

검색결과 366건 처리시간 0.023초

이동 컴퓨팅 환경에 기반을 둔 데이터베이스 시스템에서 서버의 고장 회복 기법 (A Recovery Mechanism for Server Failure in Database Systems based on Mobile computing Environments)

  • 조정란;황부현
    • 한국정보처리학회논문지
    • /
    • 제6권1호
    • /
    • pp.1-10
    • /
    • 1999
  • 이동 컴퓨팅 환경은 무선 통신망 기술의 발전에 힘입어 사용자의 이동성을 지원할 수 있는 환경이다. 사용자들은 이동 트랜잭션을 수행함으로써 데이터베이스에 접근하고 원하는 결과를 얻는다. 이러한 이동 트랜잭션의 올바른 수행과 데이터베이스의 일관성을 유지하기 위해서는 트랜잭션들을 스케줄하기 위한 동시성 제어 기법과 캐쉬를 다루는 캐슁 기법, 그리고 고장에 견고한 시스템 구축을 위한 회복 기법이 필요하다. 이동 컴퓨팅 시스템은 기존의 분산 시스템을 기반으로 하고 있으나, 사용자의 이동성이나 무선 매체의 특성으로 인하여 기존의 분산시스템에서 사용하는 회복방법들을 그대로 사용할 수 없다. 따라서 본 논문에서는 고장에 경고한 이동 컴퓨팅 시스템 구출을 위한 회복 기법을 제안하고자 하는데, 특히 이동 컴퓨팅 환경에서 발생할 수 있는 고장의 유형 가운데 서버의 고장에 대한 회복 알고리즘을 개발하고 평가 분석하다.

  • PDF

전차륜 독립휠 구동 및 조향 제어 기반 특수목적용 6WD/6WS 차량의 주행제어 알고리즘 연구 (A Study on Maneuvering Control Algorithm Based on All-wheel Independent Driving and Steering Control for Special Purpose 6WD/6WS Vehicles)

  • 이대옥;여승태
    • 한국군사과학기술학회지
    • /
    • 제16권3호
    • /
    • pp.240-249
    • /
    • 2013
  • This paper discusses the maneuvering control algorithm based on all-wheel independent driving and steering control techniques for special purpose 6WD/WS vehicles. The maneuvering control algorithms considering superior dynamic characteristics of high power in-wheel motors and independent steering system are designed to perform driving, steering, vehicle stability, and fault tolerant control. The maneuvering controller applies sliding and optimal control theories considering optimal torque distribution and friction circle related to the vertical tire force. The fault tolerant control algorithm is applied to obtain the similar maneuverability to that of the non-faulty vehicle. The simulations using the Matlab/Simulink dynamics model and experiments using HIL simulator mounting the real controllers with the designed control algorithms prove the improved performances in terms of vehicle stability and maneuverability.

다중 분할된 구조를 가지는 클러스터 검사점 저장 기법 (A Multistriped Checkpointing Scheme for the Fault-tolerant Cluster Computers)

  • 장윤석
    • 정보처리학회논문지A
    • /
    • 제13A권7호
    • /
    • pp.607-614
    • /
    • 2006
  • 검사점 저장 기법을 사용하여 주기적으로 클러스터 노드들의 프로세스 수행 정보를 전역 저장 장치에 저장하는 분산 클러스터 시스템에서 결함 허용 성능을 유지하는 데 드는 비용을 줄이고 전체 프로세스의 수행 성능을 증가시키기 위해서는 검사점 정보를 저장할 때에 네트워크로 전달되는 부하를 각 노드에 최대한 적절하게 분산하여 데이터 저장 시간을 줄임으로써 검사점 정보를 저장하는 동안 전체 클러스터 시스템의 프로세스가 지연되는 시간을 줄이도록 하여야 한다. 이를 위하여 분산 RAID 기반의 단일 입출력 공간을 사용하는. 클러스터 시스템에서는 여러가지 검사점 저장 기법을 사용하며, 검사점 정보의 저장 기법에 따라서 저장 성능과 결함 회복 성능이 달라진다. 본 연구에서는 분할된 검사점 저장 기법을 개선하여 검사점 데이터를 분산 RAID 기반의 단일 입출력 공간에 저장할 때에 그룹별로 분할되는 분할 그룹 크기를 검사점 정보가 저장될 때의 네트워크의 트래픽에 따라서 동적으로 결정하여 네트워크를 통한 분산 RAID에 저장함으로써 네트워크 병목현상을 최소화하는 다중 분할된 검사점 저장 구조를 제안하였다. 제안된 구조의 성능을 분석하기 위하여 최대 512개의 가상 노드로 구성된 클러스터 시스템을 대상으로 하여 MPI 와 Linpack HPC 벤치마크를 통한 성능 평가를 수행하였으며, 성능 평가 결과는 검사점 정보의 크기와 클러스터의 크기가 증가할수록 제안된 기법이 검사점 정보의 저장과 결함 회복 능력에 대하여 기존의 검사점 저장 기법에 비하여 우수한 성능을 보인다.

인과적 메시지 로깅에서 확장성 지원 방법 (How To Support Scalability in Causal Message Logging)

  • 김기범;황종선;유헌창;손진곤;정순영
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권4호
    • /
    • pp.362-372
    • /
    • 2000
  • 인과적 메시지 로깅기법은 프로세스의 파손 결함을 포용하는 분산 시스템을 작은 비용으로 구축할 수 있는 기법이다. 기존의 인과적 메시지 로깅기법은 결함 포용 시스템 내에 고정된 수의 프로세스가 존재한다는 기본가정을 갖고 있다. 이러한 가정은 새로운 프로세스의 추가 혹은 현존하는 프로세스의 소멸 시 모든 프로세스들이 자신의 자료구조를 변경해야 한다. 그러나, 우리는 각각의 프로세스가 모든 프로세스에 대한 목록을 유지하는 것이 아니라 통신을 수행하는 프로세스에 대한 목록을 유지하도록 한다. 이러한 방법은 결함 포용시스템을 여러 다른 스케일에서도 동작하도록 하여 준다. 이러한 기법을 이용하여, 우리는 현존하는 인과적 메시지 로깅 기법에 적용할 수 있는 새로운 회복 알고리즘을 개발하였다. 제안하는 알고리즘은 1) 회복리더를 필요로 하지 않는 분산화된 기법이고, 2) 회복이 진행되는 동안 정상프로세스의 실행을 막지 않는 비방해기법이고, 3) 여러 프로세스의 동시 결함도 포용할 수 있는 기법이다. 기존의 인과적 메시지 로깅기법에서는 위의 성질 중 하나 이상을 만족시키지 못했다.

  • PDF

다중화 구조 고신뢰성 제어기기를 위한 보팅 시스템버스 프로토콜 (Voting System Bus Protocol for a Highly-Reliable PLC with Redundant Modules)

  • 정우혁;박재현
    • 제어로봇시스템학회논문지
    • /
    • 제20권6호
    • /
    • pp.689-694
    • /
    • 2014
  • An SPLC (Safety Programmable Logic Controller) must be designed to meet the highest safety standards, IEEE 1E, and should guarantee a level of fault-tolerance and high-reliability that ensures complete error-free operation. In order to satisfy these criteria, I/O modules, communication modules, processor modules and bus modules of the SPLC have been configured in triple or dual modular redundancy. The redundant modules receive the same data to determine the final data by the voting logic. Currently, the processor of each rx module performs the voting by deciding on the final data. It is the intent of this paper to prove the improvement on the current system, and develop a voting system for multiple data on a system bus level. The new system bus protocol is implemented based on a TCN-MVB that is a deterministic network consisting of a master-slave structure. The test result shows that the suggested system is better than the present system in view of its high utilization and improved performance of data exchange and voting.

단일 MAC을 이용한 자동 고장 극복 Ethernet NIC (Network Interface Card) 장치 구현 (A Novel Implementation of Fault-Tolerant Ethernet NIC (Network Interface Card) Using Single MAC)

  • 김세목;;이동호;이종명
    • 한국통신학회논문지
    • /
    • 제37C권11호
    • /
    • pp.1162-1169
    • /
    • 2012
  • Mission critical 임무를 수행하는 Ethernet 기반 첨단 네트워크 시스템에서 자동 고장 극복 기능은 시스템의 중단 없는 운용을 위한 중요한 요구사항 중의 하나이다. 이러한 고장 극복 기능은 네트워크 시스템의 각 노드에 멀티 port를 지원하는 네트워크 인터페이스 카드 (Network Interface Card, NIC)를 설치함으로써 가능하다. 현재 가용한 NIC 장치는 두 개 또는 그 이상의 MAC (Media Access Control)을 사용하여, active port 고장 시에 MAC switching하여 자동 고장 극복 기능을 수행한다. 이러한 NIC 장치는 일반적으로 co-processor 및 이를 위한 펌웨어 (firmware)를 필요로 하며, 이에 따라 고장 극복 시간이 길어지고 throughput이 저하되는 단점이 있다. 또한 co-processor를 위한 펌웨어는 전술 환경 변화에 따라 upgrade를 해야 하므로 고장 극복 장치 가격도 상승하게 한다. 본 논문은 기존 하드웨어 방식에서 일반적으로 사용하는 co-processor와 다수 MAC 대신에, 하나의 MAC 만을 사용하는 새로운 하드웨어 방식 NIC 장치 설계 방안을 제시한다. 제시된 새로운 NIC은 단일 MAC과 일반 로직게이트 블럭으로 설계하여 고장 극복 기능을 수행한다. 제안 방식에 따라 NIC을 구현하여 성능 실험을 통해 기존 방식 대비 우수함을 입증하였다.

Spark Streaming 기반 클라우드 시스템에서 실시간 고장 복구를 지원하기 위한 기법들 (Techniques to Guarantee Real-Time Fault Recovery in Spark Streaming Based Cloud System)

  • 김정호;박대동;김상욱;문용식;홍성수
    • 정보과학회 논문지
    • /
    • 제44권5호
    • /
    • pp.460-468
    • /
    • 2017
  • 실시간 클라우드의 실현에 있어서 데이터 분석 프레임워크는 중추 역할을 수행한다. 현존하는 프레임워크들 중에 가장 많은 요구사항들을 충족하는 것은 Spark Streaming이다. 하지만 이 프레임워크는 초 단위 실시간 고장 복구를 충족하지 못하고 있다. Spark Streaming의 고장 복구 기법은 정상 동작시에 기록된 누적 변형 히스토리를 토대로 고장 직전 마지막 상태 데이터를 재연산하여 복구하기 때문에 히스토리의 길이에 비례하여 복구 시간이 증가된다. 따라서 제한된 시간 이내에 고장 복구가 완료됨을 보장되지 않는다. 또한 초기 상태 데이터를 고장 감내 스토리지에서 읽는 시간이 수십 초에 달하여 초 단위고장 복구 시간을 달성할 수 없다. 본 논문에서는 언급된 문제들을 해결하기 위한 두 가지 기법들을 제안한다. 이를 Spark Streaming 1.6.2에 적용하고, 실험을 통해 고장 복구 시간이 제한 시간 이내에 완료되며 평균 약 41.57% 단축됨을 확인했다.

임베디드 시스템에서 실시간성과 결함허용을 보장하는 스케줄러 설계 (Design of Scheduler Considering Real-Time Characteristic and Fault-Tolerant in Embedded System)

  • 전태건;김창수
    • 한국멀티미디어학회논문지
    • /
    • 제14권1호
    • /
    • pp.76-84
    • /
    • 2011
  • 임베디드 시스템은 적용되는 분야에 따라 태스크의 완료에 대한 실시간성이 보장되어야 하는 경우가 있다. 또한 실시간성을 제공하는 시스템에서는 다양한 이유로 인해 태스크의 결함이 발생할 수 있다. 그러므로 본 논문에서는 단일 프로세서를 가지는 임베디드 시스템에서 주기적 태스크 집합의 마감시간을 보장하면서 결함이 발생한 태스크의 결함을 허용하는 태스크 스케줄러를 설계한다. 임베디드 시스템에서 실시간성을 제공하기 위해서 태스크를 주기적 및 비주기적 특성으로 분류한 후 주기적 태스크는 고정 우선순위 실시간 태스크 스케줄링 기법에서 최적의 알고리즘으로 알려진 RMS(Rate Monotonic Scheduling) 기법을 적용하여 실행한다. 주기적 태스크들의 실행 시간을 분석한 후, 결정되는 잉여 시간을 관리함으로써 비주기적 태스크들의 실행을 보장한다. 또한 일시적인 태스크의 단일 결함을 허용하기 위한 결함 허용 기법을 제공한다. 이를 위해 백업 시간을 관리하고 태스크에서 결함이 발생할 경우, 결함이 발생한 태스크를 재실행함으로써 복구 작업을 수행한다.

내장형 AVTMR 시스템의 하드웨어 및 소프트웨어 신뢰성 분석 (Hardware and Software Dependability Analysis of Embedded AVTMR(All Voting Triple Modular Redundancy) System)

  • 김현기
    • 한국통신학회논문지
    • /
    • 제34권7B호
    • /
    • pp.744-750
    • /
    • 2009
  • 본 논문에서는 신뢰성을 명가하는 데 있어서 소프트웨어 및 하드웨어 측면을 고려한 통합된 마코브 모델링(Markov modeling)으로 AVTMR(AlI Voting Triple Modular Redundancy) 시스템의 신뢰성을 분석한다. 본 시스템의 모델링은 하드웨어의 경우에 고장율이 시불변 특성을 가지며, 소프트웨어 경우에는 시 가변 특성으로 모델링되어 AVTMR 시스템과 단일 시스템에 대한 신뢰성 비교를 한다. 특히, 소프트웨어적인 특성은 G-O/NHPP 기법을 이용하여 분석이 되며, AVTMR 시스템의 전체적인 특성을 소프트웨어 및 하드웨어적인 관점에서 고장율 따른 특성을 이해할 수 있게 된다. 평가된 AVTMR 은 엄베디드 통신 시스템, 항공기 등의 결함 허용 시스댐에 요구되는 스팩에 맞도록 설계를 하기 위한 기반을 제시한다.

데이터베이스 시스템 신뢰도를 위한 페트리 네트 모델링 (Petri Net Modeling of Database System Reliability)

  • 노철우;김경민;김티나
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 춘계 종합학술대회 논문집
    • /
    • pp.315-319
    • /
    • 2005
  • 컴퓨터 시스템의 성능분석을 위하여 페트리 네트 기반 모델이 널리 사용되어 왔으나, 신뢰도와 가용도 분석을 위한 페트리 네트 모델링은 폭넓은 관심을 갖지 못했다. 본 논문에서는 페트리 네트를 이용한 데이터베이스 시스템의 신뢰도 분석과 모델링 기법에 대하여 논의한다. 공유 메모리(Shared Memory), 프로세서, 버스, 데이터베이스(디스크)의 구성요소를 갖는 고장감내형(fault-tolerant) 데이터 베이스 시스템의 신뢰도 분석을 위한 페트리 네트 모델을 개발한다. 각 구성요소에 대한 고장을 고려하며, 데이터베이스 시스템이 동작중일 조건은 데이터베이스가 동작하고 컴퓨터 구성요소인 프로세서, 메모리, 버스가 동작중인 경우로 한다. 각 구성요소는 개별적으로 고장이 날 수 있으며, 시스템이 동작하는 한 복구할 수 있다. 이러한 고장 및 복구 조건을 고려한 시스템의 신뢰도 분석을 페트리 네트의 확장 모델이며 모델링 기능이 풍부한 마르코프 reward 모델을 이용하여 수행한다. Stochastic Reward Net(SRN)이 갖고 있는 variable cardinality, enabling 함수, 시간천이 우선순위 등의 기능을 이용하여 신뢰도 모델을 개발하는 기법을 제시한다.

  • PDF