• Title/Summary/Keyword: 결함 포용

Search Result 155, Processing Time 0.024 seconds

디지털 고장포용 시스템의 개념 및 특성 - 컴퓨터 기술

  • 이대현;윤재영;김학배
    • 전기의세계
    • /
    • v.46 no.9
    • /
    • pp.15-22
    • /
    • 1997
  • 본 논문은 고장포용 시스템에서 고려되는 결함, 오류 및 고장의 개념과 특성을 살펴보고, 고장에 대한 강인성을 부가하기 위한 공간 여분(spatial redundancy) 및 시간 여분(time redundandy)을 바탕으로 다양한 고장포용의 설계 기법을 설명하며, 또한 고장포용 시스템의 성능을 평가하기 위한 다양한 기준중 확률적 접근방식에 바탕을 둔 신뢰도(reliability)와 가용성(availability), 그리고 유지성(maintainability)에 대해 설명한다. 또한, 고장포용기법의 연구용 목적으로 개발되어 일부는 실제 활용되고 있는 대표적인 고장포용 시스템들인 FTMP[3], STAR[4], SIEF[5], C.vmp[6] 등에 대해서 간단히 살펴보도록 하겠다.

  • PDF

Temporal Replication Based Fault Tolerant Scheme Providing A Cyclic Execution of Mobile Agent (이동 에이전트의 순환적 작업 수행을 지원하는 시간적 복제 기반 결함 포용 기법)

  • 박한석;백맹순;김홍수;환종선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10c
    • /
    • pp.469-471
    • /
    • 2004
  • 다중 지역 이동 에이전트 컴퓨팅 시스템에서는 단일 지역으로 구성된 시스템에 비해서 호스트의 결함이나 호스트 사이의 통신 결함 발생 확률이 높아, 안정된 시스템 설계에 있어서 이동 에이전트의 결함을 검출하고 이를 복구하는 결함 포용 기법은 매우 중요한 고려 사항이다. 이동 에이전트의 안정적인 연산 수행을 보장하기 위한 기존의 결함 포용 기법들은 크게 시간적 복제 기반 기법(Temporal Replication Based Approach: TRBA)와 공간적 복제 기반 기법(Spatial Replication Based Approach: SRBA)으로 구분 지을 수 있으나, 다중 지역으로 구성된 이동 에이전트 시스템과 같은 복잡한 시스템에서는 낮은 결함 포용 비용이 요구되는 TRBA가 보다 적합하다. 그러나 기존의 TRBA에서는 이동 에이전트의 비멱등(non-idempotent) 연산 수행을 지원하기 위해 단일 수행 (exactly-once execution) 특성을 보장했지만, 이동 에이전트가 순환적 작업 경로를 가지는 연산 수행 시에는 작업을 완결하지 못하는 복귀월산 문제(comeback-skip problem)가 발생한다. 본 논문에서는 플래그와, 히스토리 필드, 파손 길드를 도입하여 복귀월산 문제를 해결하는 시간적 복제 기반 결함 포용 기법을 제안한다. 이 기법은 이동 에이전트의 다양한 작업 수행을 지원함으로써 이동 에이전트의 작업 수행 영역을 확대한다.

  • PDF

Garbage Collection Protocol of Fault Tolerance Information in Multi-agent Environments (멀티에이전트 환경에서 결함 포용 정보의 쓰레기 처리 기법)

  • 이대원;정광식;이화민;신상철;이영준;유헌창;이원규
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.31 no.3_4
    • /
    • pp.204-212
    • /
    • 2004
  • Existing distributed systems have higher probability of failures occurrence than stand-alone system, so many fault tolerant techniques have been developed. Because of insufficient storage resulting from the increased fault tolerance information stored, the performance of system has been degraded. To avoid performance degradation, it needs delete useless fault tolerance information. In this paper, we propose a garbage collection algorithm for fault tolerance information. And we define and design the garbage collection agent for garbage collection of fault tolerance information, the information agent for management of fault tolerant data, and the facilitator agent for communication between agents. Also, we propose the garbage collection algorithm using the garbage collection agent. For rollback recovery, we use independent checkpointing protocol and sender based pessimistic message logging protocol. In our proposed garbage collection algorithm, the garbage collection, information, and facilitator agent is created with process, and the information agent constructs domain knowledge with its checkpoints and non-determistic events. And the garbage collection agent decides garbage collection time, and it deletes useless fault tolerance information in cooperation with the information and facilitator agent. For propriety of proposed garbage collection technique using agents, we compare domain knowledge of system that performs garbage collection after rollback recovery and domain knowledge of system that doesn't perform garbage collection.

A Garbage Collection based on Multi Agent Systems (멀티 에이전트 시스템 기반 쓰레기 처리 기법)

  • 이대원;정광식;이화민;이원규;유헌창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.88-90
    • /
    • 2002
  • 본 논문은 기존의 멀티 에이전트 기반의 결함 포용 기법에서 결함 포용 정보를 쓰레기 처리하는 쓰레기 처리 에이전트를 제안한다. 쓰레기 처리 에이전트는 정보 에이전트의 영역지식에서 불필요한 결함 포용 정보의 제거 시점을 찾아내고, 이를 정보 에이전트에 알린다. 쓰레기 처리기법에 멀티 에이전트 개념의 도입은 부가적인 메시지 전송을 하지 않고 쓰레기 처리 에이전트를 이용하여 운영체제에서 독립적인 쓰레기 처리를 가능하게 한다. 결함 포용 정보의 쓰레기 처리는 프로세스의 검사점 간격을 이용하여 쓰레기 처리 시점을 결정하기에 결함 발생 후 재수행시 손실메시지 발생으로 인한 불필요한 복귀를 막을 수 있고 에이전트를 사용함으로 쓰레기 처리 기법의 이식성과 확장성의 증대론 기대할 수 있다.

  • PDF

A Fault-Tolerant Distributed Location Management Method in Mobile Environments (이동 환경에서 결함 포용 분산 위치 관리 방법)

  • 이재경;오선진;배인한
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.649-651
    • /
    • 1999
  • 사용자들이 PCS에 의해 커버되는 영역내의 어느 곳이던지 이동할 수 있는 이동 환경에서 어떤 이동 단말기가 다른 이동 단말기와 통신하고자 할 경우, 먼저 목적지 이동 단말기의 위치를 찾아야 한다. 따라서, 이동 단말기의 위치 정도를 관리하는 것은 이동 환경에서 중요한 문제이다. 지금까지 제안된 대부분의 위치 관리 정책들은 이동 단말기의 위치를 관리하기 위해 주고 데이터베이스를 사용한다. 만약 위치 관리에 사용되는 데이터베이스들 중에서 어느 하나라도 결함이 발생할 경우, 전체 시스템은 제대로 동작할 수 없게 된다. 따라서, 이들 데이터베이스에 대한 결함 포용은 대단히 중요하다. 본 논문에서는 데이터베이스 고장에 대한 결함을 포용할 수 있는 결함 포용 분산 위치 관리 방법을 제안하고 성능을 평가한다.

  • PDF

Fault-Tolerant Parallel Applications in Java Message Passing Systems (자바 메시지 전달 시스템에서의 결함 포용 병렬 애플리케이션)

  • 안진호;김기범;김정훈;황종선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.768-770
    • /
    • 1998
  • 동기적 검사점(synchronous checkpoiting)기법, 인과적 메시지 로깅(causal message logging)과 향상된 회복 비동기성(improved asynchronism during recovery)을 제공하는 복귀회복(rollback recovery) 기법을 적용하여 자바 메시지 전달 시스템(java massage passing system)에서 수행하는 병렬 에플리케이션들에게 저 비용의 결함 포용성에 따라, 통신망으로 연결된 이질형 (fault-tolerance)(heterogeneous) 컴퓨터들을 이용하는 대규모 분산 시스템들은 아주 효율적인 병렬 컴퓨팅 환경을 제공해준다. 그러나, 이러한 분산 시스템들의 규모가 커짐에 따라 고장률 (failure rate)도 그 만큼 중요하게 된다. 따라서, 고장률이 높은 대규모 분산 시스템들에게 좀더 효율적인 결함 포용성을 제공하는 기법들이 필요하다. 또한, 대규모분산 시스템들은 이질형 컴퓨터들로 구성되어 있기 때문에, 결함 포용성을 제공하는 소프트웨어 패키지들은 플랫폼 독립적(platform independent)이어야 한다. 이러한 문제점은 높은 이식성(portability)을 가지고 있는 자바 언어로 구현함으로써 해결될 수 있다. 따라서, 본 논문은 자바 메시지 전달 시스템에서 수행되는 병렬 애플리케이션들에게 동기적 검사점 기법, 인과적 메시지 로깅과 향상된 비동기성을 제공하는 복귀회복 기법을 높은 이식성을 가진 자바언어로 구현하여 저 비용으로 결함 포용성을 제공하고자 한다.

  • PDF

System Reliability (시스템 信賴性)

  • 김동주
    • The Magazine of the IEIE
    • /
    • v.5 no.1
    • /
    • pp.31-37
    • /
    • 1978
  • The value of a system is highly dependent upon its reliability, Reliability means not merely correctness but means fault tolerance of the system. This paper emphasizes software fault tolerance in design stage especially in case of computer controlled system. The general method of fault tolerance design especially including dual computer system and its advantage and disadvantage was introduced. Finally for example of fault tolerance design we would like to present our GTK-500 EPABX.

  • PDF

The Implementation of Fault Tolerance Service for QoS in Grid Computing (그리드 컴퓨팅에서 서비스 품질을 위한 결함 포용 서비스의 구현)

  • Lee, Hwa- Min
    • The Journal of Korean Association of Computer Education
    • /
    • v.11 no.3
    • /
    • pp.81-89
    • /
    • 2008
  • The failure occurrence of resources in the grid computing is higher than in a tradition parallel computing. Since the failure of resources affects job execution fatally, fault tolerance service is essential in computational grids. And grid services are often expected to meet some minimum levels of quality of service (QoS) for desirable operation. However Globus toolkit does not provide fault tolerance service that supports fault detection service and management service and satisfies QoS requirement. Thus this paper proposes fault tolerance service to satisfy QoS requirement in computational grids. In order to provide fault tolerance service and satisfy QoS requirements, we expand the definition of failure, such as process failure, processor failure, and network failure. And we propose resource scheduling service, fault detection service and fault management service and show implement and experiment results.

  • PDF

A Recovery Technique Using Agent in Distributed Computing Systems (분산 컴퓨팅 시스템에서 에이전트를 이용한 회복 기법)

  • 이화민;정광식;윤태명;이원규;유헌창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.556-558
    • /
    • 2001
  • 분산 컴퓨팅 시스템은 단일 시스템보다 결함에 민감하기 때문에 기존의 많은 연구들에서 분산 시스템에서 결함이 발생할 경우 이룬 해결하기 위한 많은 복귀회복기법들이 연구되었다. 본 논문에서는 기존의 분산 컴퓨팅 시스템의 결함 포용 기법에 멀티 에이전트의 개념을 도입하여 운영체제에 독립적인 에이전트를 이용한 회복기법을 제안한다. 이를 위해 본 논문에서는 프로세스의 회복을 담당할 회복 에이전트, 결함 포용 규칙과 정보를 유지.관리하는 정보 에이전트, 전체 에이전트간의 통신 기능을 담당할 조정 에이전트를 정의 및 설계하고 회복 에이전트를 이용한 회복 알고리즘을 제안한다. 분산 컴퓨팅 시스템에서 회복 에이전트의 도입은 결함 발생 프로세스의 결함 회복 작업을 어플리케이션 계층과 독립적인 별도의 계층으로 계층화하여 결함 포용을 위한 메카니즘의 이식성 증대 및 확장성 증대를 가져온다.

  • PDF

A Stage Construction Scheme based on a Region for Fault-tolerant Execution of Mobile Agent (결함 포용적인 이동에이전트 수행을 위한 지역기반 단계군 구성기법)

  • 최성진;백맹순;안진호;김차영;황종선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10e
    • /
    • pp.331-333
    • /
    • 2002
  • 신뢰성 높은 이동 에이전트 시스템을 구성하는데 있어서 지속적인 이동 에이전트 연산을 보장하는 결함 포용기법은 중요한 고려사항이다. 이를 위해 많은 연구들이 단계군 구성에 기반한 이동 에이전트 수행에 대한 결함 포용 기법들을 제안하고 있다. 그러나 제안된 기법들은 단계군을 구성함으로써 에이전트 연산 실행에 대한 봉쇄 가능성을 감소시켰으나, 에이전트를 이주시키는 통신비용과 단계군 작업들에 대한 부하를 증가시켰다. 본 논문에서는 단계군내에 지역(region)적으로 다르게 분포한 실행장소(place)에 대해서 가짜 참여자(quasi-participant)를 두어 지역적으로 같은 곳에 모이게 하는 새로운 단계군 구성기법을 제안한다. 또한, 가짜 참여자와 실제 실행장소를 하나의 단계군으로 구성하기 위해 단계군내에 하위단계군(substage)을 두어 단계군을 구성하는 기법을 제안한다. 하위단계군은 가짜 참여자와 실제 실행장소의 작업을 분리하여 가짜 참여자로 인해 발생할 수 있는 추가 통신비용을 감소시킨다. 본 논문에서 제안하는 가짜 참여자와 하위단계군을 사용한 단계군 구성기법은 고장 자유(failure-free) 상태에서 단계군 작업들에 대한 수행시간을 단축시켜 단계군을 이용하여 결함을 포용하는 이동 에이전트의 전체 수행시간을 단축시킨다.

  • PDF