• 제목/요약/키워드: Software fault tolerance

검색결과 90건 처리시간 0.027초

A study on the Design Techniques and Analysis of Fault-Tolerant Computers

  • Cho, Jai-Rip
    • 품질경영학회지
    • /
    • 제21권1호
    • /
    • pp.78-95
    • /
    • 1993
  • The art of designing and analyzing fault-tolerant computers is surveyed with special emphasis on problems of analyzing the behavior of computers that have autonomous repair capability. The survey covers the following topics : (1) general issues in computer reliability, (2) fault-tolerance state relations and requirements, (3) computational hierarchy, (4) fault characteristics, (5) fault diagnosis, (6) fault-tolerance schemes for logic network and machines, (7) fault-coverage effects, and (8) fault-tree analysis of coverage. This paper does not include techniques for verifying nonredundant hardware or system software designs or for verifying the correctness of application programs.

  • PDF

임베디드 소프트웨어의 인터페이스 결함허용성 향상 기법 (A Method for Improving Interface Fault Tolerance in the Embedded Software)

  • 최인화;백종호;황준
    • 인터넷정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.31-39
    • /
    • 2013
  • 새롭게 개발되는 소프트웨어 컴포넌트와 재사용되는 하드웨어 컴포넌트를 결합할 때, 두 컴포넌트간 인터페이스 불일치현상이 발생할 수 있다. 인터페이스 불일치 현상은 다양한 형태의 결함을 야기할 수 있으며 인터페이스 결함허용성을 저하시키는 요인이 된다. 하지만 이러한 결함에 대한 테스트는 경험기반으로 수행되기 때문에 사람에 매우 의존적이라는 단점이 있다. 이에 본 논문에서는 경험기반 테스트를 구조적 방법으로 접근하여 임베디드 소프트웨어의 인터페이스 결함허용성을 향상시킬 수 있는 기법을 제안한다. 먼저, 기존에 정의된 인터페이스 결함유형에는 포함되지 않았던 경험기반으로 수행되었던 인터페이스 결함유형을 정의한다. 다음으로 새롭게 정의된 인터페이스 결함 유형을 고려한 테스트 수행 방법을 제시한다. 제안한 방법의 우수성을 입증하기위해 본 논문에서는 상용 방송 수신단말기를 대상으로 테스트 수행한 결과, 기존에 사용했던 방법보다 7.9%의 심각한 결함을 추가로 발견할 수 있었다. 또한, 제안한 방법은 소프트웨어 개발 주기상에서 초기에 테스트 경로를 생성하기 때문에 개발자들이 사전에 인터페이스 불일치 결함을 발견할 수 있어 보다 효과적인 테스트 계획 수립이 가능하다.

원전 디지털 제어계통을 위한 고장허용설계방법론에 관한 연구 (A Study on Fault-Tolerance Design Methods for Nuclear Digital Control Systems)

  • 고원석;최중인
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제49권1호
    • /
    • pp.1-9
    • /
    • 2000
  • In this paper, a design method of fault-tolerance is presented for the nuclear digital control systems composed of software and hardware. As a quantitative design method measure of fault-tolerance, we used Reliability, Availability and Safety. To implement the proposed fault-tolerance, a prototype system has been devised for the digital control systems and a quantitative method of 'Markovian Model' is applied. The results provide the appropriate degree of redundancy and diversity, and fail-safe.

  • PDF

Fault-Tolerance를 위한 시스템의 동작방식에 대한 비교 연구 (Comparative Study of the System Operational Method for Fault-Tolernace)

  • 양성현;이기서
    • 한국통신학회논문지
    • /
    • 제17권11호
    • /
    • pp.1279-1289
    • /
    • 1992
  • 고장 방지 시스템은 하드웨어나 소프트웨어의 여분 (Redundancy)을 이용하여 신뢰도(Reliability) 및 안전도(Safety)를 향상 시킨다. 시스템의 대상 영역(application areas)에 따라 고장 마스크(fault mask), 고장검출(fault detection), 고장 확인(fault identification)등의 기법을 선택하여 이용한다. 본 연구에서는 최소의 하드웨어와 소프트웨어의 여분을 이용하는 DMR(Double Modular Redundancy) 시스템을 대기 모듈(standby module)과 Fail-safe 모듈로 동작 시킬때 신뢰도와 안전도의 특성을 비교 제시한다. 또한 자기 진단 프로그램의 과도 오류 방지 능력에 대한 시스템의 MTTF를 비교함으로서 과도 오류를 취급하는 효과적인 방법을 제시하였다.

  • PDF

Design of a Fault-tolerant Embedded Controllerfor Rail-way Signaling Systems

  • Cho, Yong-Gee;Lim, Jae-Sik
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2002년도 ICCAS
    • /
    • pp.68.4-68
    • /
    • 2002
  • $\textbullet$ This report presents an implementation a set of reusable software components which use of fault-tolerance embedded controller for railway signalling systems. These components can be used in real-time applications without application reprogramming. $\textbullet$ This library runs under VxWorks operating system and is oriented on real-time embedded systems. The library includes fault detection, fault containment, checkpointing and recovery components. $\textbullet$ The library enables to support high-speed response to fault occurrence in application software. Garbage collector together with VxWorks Watchdog provides both dead tasks detection and useless resources removing to avoid an overflow. Control flow...

  • PDF

소프트웨어 재활기법에 기반한 주-여분 서버 시스템의 작업전이 시간 분석 (Switchover Time Analysis of Primary-Backup Server Systems Based on Software Rejuvenation)

  • 이재성;박기진;김성수
    • 정보처리학회논문지A
    • /
    • 제8A권2호
    • /
    • pp.81-90
    • /
    • 2001
  • 인터넷의 급속한 확산으로 인하여, 컴퓨터 시스템의 규모 및 복잡도가 점차 증가하고 있으며, 컴퓨터 시스템에 대한 높은 수준의 가용도 요구 조건을 충족시키기 위해, 하드웨어적.소프트웨어적 결함 허용 기법에 대한 연구가 활발하다. 소프트웨어 재활 기법은 서버에 탑재된 소프트웨어의 장시간 가동에 따른 소프트웨어 노화 현상을 다루고 있으며, 서버에서 실행중인 소프트웨어의 수행을 고의적으로 멈춘 후에 결함 발생 가능성이 낮은 초기 상태에서 이를 다시 가동시키는 소프트웨어적 결함 예방 방법의 일종이라 볼 수 있다. 본 연구에서는 주-여분 서버 시스템에서의 작업전이 시간이 소프트웨어 재활에 미치는 영향을 연구하였으며, 가용도 분석을 통해서 작업전이 시간이 재활 정책을 결정함에 있어서 중요한 요소임을 발견하였다.

  • PDF

SSR (Simple Sector Remapper) the fault tolerant FTL algorithm for NAND flash memory

  • Lee, Gui-Young;Kim, Bumsoo;Kim, Shin-han;Byungsoo Jung
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.932-935
    • /
    • 2002
  • In this paper, we introduce new FTL(Flash Translation Layer) driver algorithm that tolerate the power off errors. FTL driver is the software that provide the block device interface to the upper layer software such as file systems or application programs that using the flash memory as a block device interfaced storage. Usually, the flash memory is used as the storage devices of the mobile system due to its low power consumption and small form factor. In mobile system, the state of the power supplement is not stable, because it using the small sized battery that has limited capacity. So, a sudden power off failure can be occurred when we read or write the data on the flash memory. During the write operation, power off failure may introduce the incomplete write operation. Incomplete write operation denotes the inconsistency of the data in flash memory. To provide the stable storage facility with flash memory in mobile system, FTL should provide the fault tolerance against the power off failure. SSR (Simple Sector Remapper) is a fault tolerant FTL driver that provides block device interface and also provides tolerance against power off errors.

  • PDF

리눅스 기반 ARINC 653 헬스 모니터 (Linux-based ARINC 653 Health Monitor)

  • 윤영일;조현우;김형신
    • 대한임베디드공학회논문지
    • /
    • 제9권3호
    • /
    • pp.183-191
    • /
    • 2014
  • The software running on avionic system is required to be highly reliable and productive. The air transport industry has developed ARINC Specification 653(ARINC653) as a standardized software requirement of avionics computers. The document specifies the interface boundary between avionics application software and the core executive software. Dependability in ARINC 653 is provided by spatial and temporal partitioning whilst fault-tolerance is provided by health monitoring mechanism. Legacy real-time operating systems are used to support ARINC653 health monitor on integrated modular avionics(IMA). However, legacy real-time operating systems are costly and difficult to modify the kernel. In this paper, we suggest a Linux-based ARINC653 health monitor. Functionalities to support ARINC653 health monitor are implemented as a Linux kernel module and its performance is evaluated.

Fault Tolerance Design for Servo Manipulator System Operating in a Hot Cell

  • Jin, Jae-Hyun;Ahn, Sung-Ho;Park, Byung-Suk;Yoon, Ji-Sup;Jung, Jae-Hoo
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.2467-2470
    • /
    • 2003
  • In this paper, fault tolerant mechanisms are presented for a servo manipulator system designed to operate in a hot cell. A hot cell is a sealed and shielded room to handle radioactive materials, and it is dangerous for people to work in the hot cell. So, remote operations are necessary to handle radioactive materials in the hot cell. KAERI has developed a servo manipulator system to perform such remote operations. However, since electric components such as servo motors are weak to radiations, fault tolerant mechanisms have to be considered. For fault tolerance of the servo manipulator system, hardware and software redundancy have been considered. In case of hardware, radioactive resistant electric components such as cables and connectors have been adopted and motors driving a transport have been duplicated. In case of software, a reconfiguration algorithm accommodating one motor's failure has been developed. The algorithm uses redundant axis to recover the end effector's motion in spite of one motor's failure.

  • PDF

분산 멀티미디어에서의 결함 허용 시스템 (Fault Tolerance System running on Distributed Multimedia)

  • 홍성룡;고응남
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권1호
    • /
    • pp.123-126
    • /
    • 2015
  • 본 논문은 분산 멀티미디어에서의 결함 허용 시스템에 대해서 기술 하였다. 본 시스템은 분산 멀티미디어 공동 작업에 참여한 사용자들이 다른 참여자들에게 같은 뷰로써 동기화된 오류 객체들을 참조할 수 있도록 구축하였다. 분산 멀티미디어 환경은 IP-USN과 M2M에 기반을 두고 있다. 본 시스템은 축제를 여는 장소처럼 분산 멀티미디어 협동 작업 환경에서 소프트웨어 오류를 감지, 공유, 복구하기에 적합한 시스템이다. 이 시스템에 의해서 오류를 동기화 할 수 있다.