• Title/Summary/Keyword: 결함포용 정보

Search Result 42, Processing Time 0.028 seconds

Garbage Collection Protocol of Fault Tolerance Information in Multi-agent Environments (멀티에이전트 환경에서 결함 포용 정보의 쓰레기 처리 기법)

  • 이대원;정광식;이화민;신상철;이영준;유헌창;이원규
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.31 no.3_4
    • /
    • pp.204-212
    • /
    • 2004
  • Existing distributed systems have higher probability of failures occurrence than stand-alone system, so many fault tolerant techniques have been developed. Because of insufficient storage resulting from the increased fault tolerance information stored, the performance of system has been degraded. To avoid performance degradation, it needs delete useless fault tolerance information. In this paper, we propose a garbage collection algorithm for fault tolerance information. And we define and design the garbage collection agent for garbage collection of fault tolerance information, the information agent for management of fault tolerant data, and the facilitator agent for communication between agents. Also, we propose the garbage collection algorithm using the garbage collection agent. For rollback recovery, we use independent checkpointing protocol and sender based pessimistic message logging protocol. In our proposed garbage collection algorithm, the garbage collection, information, and facilitator agent is created with process, and the information agent constructs domain knowledge with its checkpoints and non-determistic events. And the garbage collection agent decides garbage collection time, and it deletes useless fault tolerance information in cooperation with the information and facilitator agent. For propriety of proposed garbage collection technique using agents, we compare domain knowledge of system that performs garbage collection after rollback recovery and domain knowledge of system that doesn't perform garbage collection.

Temporal Replication Based Fault Tolerant Scheme Providing A Cyclic Execution of Mobile Agent (이동 에이전트의 순환적 작업 수행을 지원하는 시간적 복제 기반 결함 포용 기법)

  • 박한석;백맹순;김홍수;환종선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10c
    • /
    • pp.469-471
    • /
    • 2004
  • 다중 지역 이동 에이전트 컴퓨팅 시스템에서는 단일 지역으로 구성된 시스템에 비해서 호스트의 결함이나 호스트 사이의 통신 결함 발생 확률이 높아, 안정된 시스템 설계에 있어서 이동 에이전트의 결함을 검출하고 이를 복구하는 결함 포용 기법은 매우 중요한 고려 사항이다. 이동 에이전트의 안정적인 연산 수행을 보장하기 위한 기존의 결함 포용 기법들은 크게 시간적 복제 기반 기법(Temporal Replication Based Approach: TRBA)와 공간적 복제 기반 기법(Spatial Replication Based Approach: SRBA)으로 구분 지을 수 있으나, 다중 지역으로 구성된 이동 에이전트 시스템과 같은 복잡한 시스템에서는 낮은 결함 포용 비용이 요구되는 TRBA가 보다 적합하다. 그러나 기존의 TRBA에서는 이동 에이전트의 비멱등(non-idempotent) 연산 수행을 지원하기 위해 단일 수행 (exactly-once execution) 특성을 보장했지만, 이동 에이전트가 순환적 작업 경로를 가지는 연산 수행 시에는 작업을 완결하지 못하는 복귀월산 문제(comeback-skip problem)가 발생한다. 본 논문에서는 플래그와, 히스토리 필드, 파손 길드를 도입하여 복귀월산 문제를 해결하는 시간적 복제 기반 결함 포용 기법을 제안한다. 이 기법은 이동 에이전트의 다양한 작업 수행을 지원함으로써 이동 에이전트의 작업 수행 영역을 확대한다.

  • PDF

A Garbage Collection based on Multi Agent Systems (멀티 에이전트 시스템 기반 쓰레기 처리 기법)

  • 이대원;정광식;이화민;이원규;유헌창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.88-90
    • /
    • 2002
  • 본 논문은 기존의 멀티 에이전트 기반의 결함 포용 기법에서 결함 포용 정보를 쓰레기 처리하는 쓰레기 처리 에이전트를 제안한다. 쓰레기 처리 에이전트는 정보 에이전트의 영역지식에서 불필요한 결함 포용 정보의 제거 시점을 찾아내고, 이를 정보 에이전트에 알린다. 쓰레기 처리기법에 멀티 에이전트 개념의 도입은 부가적인 메시지 전송을 하지 않고 쓰레기 처리 에이전트를 이용하여 운영체제에서 독립적인 쓰레기 처리를 가능하게 한다. 결함 포용 정보의 쓰레기 처리는 프로세스의 검사점 간격을 이용하여 쓰레기 처리 시점을 결정하기에 결함 발생 후 재수행시 손실메시지 발생으로 인한 불필요한 복귀를 막을 수 있고 에이전트를 사용함으로 쓰레기 처리 기법의 이식성과 확장성의 증대론 기대할 수 있다.

  • PDF

A Recovery Technique Using Agent in Distributed Computing Systems (분산 컴퓨팅 시스템에서 에이전트를 이용한 회복 기법)

  • 이화민;정광식;윤태명;이원규;유헌창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.556-558
    • /
    • 2001
  • 분산 컴퓨팅 시스템은 단일 시스템보다 결함에 민감하기 때문에 기존의 많은 연구들에서 분산 시스템에서 결함이 발생할 경우 이룬 해결하기 위한 많은 복귀회복기법들이 연구되었다. 본 논문에서는 기존의 분산 컴퓨팅 시스템의 결함 포용 기법에 멀티 에이전트의 개념을 도입하여 운영체제에 독립적인 에이전트를 이용한 회복기법을 제안한다. 이를 위해 본 논문에서는 프로세스의 회복을 담당할 회복 에이전트, 결함 포용 규칙과 정보를 유지.관리하는 정보 에이전트, 전체 에이전트간의 통신 기능을 담당할 조정 에이전트를 정의 및 설계하고 회복 에이전트를 이용한 회복 알고리즘을 제안한다. 분산 컴퓨팅 시스템에서 회복 에이전트의 도입은 결함 발생 프로세스의 결함 회복 작업을 어플리케이션 계층과 독립적인 별도의 계층으로 계층화하여 결함 포용을 위한 메카니즘의 이식성 증대 및 확장성 증대를 가져온다.

  • PDF

A Fault-Tolerant Distributed Location Management Method in Mobile Environments (이동 환경에서 결함 포용 분산 위치 관리 방법)

  • 이재경;오선진;배인한
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.649-651
    • /
    • 1999
  • 사용자들이 PCS에 의해 커버되는 영역내의 어느 곳이던지 이동할 수 있는 이동 환경에서 어떤 이동 단말기가 다른 이동 단말기와 통신하고자 할 경우, 먼저 목적지 이동 단말기의 위치를 찾아야 한다. 따라서, 이동 단말기의 위치 정도를 관리하는 것은 이동 환경에서 중요한 문제이다. 지금까지 제안된 대부분의 위치 관리 정책들은 이동 단말기의 위치를 관리하기 위해 주고 데이터베이스를 사용한다. 만약 위치 관리에 사용되는 데이터베이스들 중에서 어느 하나라도 결함이 발생할 경우, 전체 시스템은 제대로 동작할 수 없게 된다. 따라서, 이들 데이터베이스에 대한 결함 포용은 대단히 중요하다. 본 논문에서는 데이터베이스 고장에 대한 결함을 포용할 수 있는 결함 포용 분산 위치 관리 방법을 제안하고 성능을 평가한다.

  • PDF

A deadlock-Free Fault-Tolerant routing Method Using Partial-Adaptiveness in a N-Dimensional Meshed Network (N-차원 메쉬 네트워크에서의 부분적 적응성을 이용한 Deadlock-Free 결함포용 라우팅 기법)

  • Mun, Dae-Geun;Gam, Hak-Bae
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.4
    • /
    • pp.1090-1097
    • /
    • 1999
  • the multi computers operated in harsh environments should be designed to guarantee normal operations in the presence of the component faults. One solution for this is a fault-tolerant routing. In the paper, we consider n-dimensional meshed network for the basic topology and propose a simple fault-tolerant routing algorithm that can transfer messages to their destination as desired in the presence of some component faults. the built algorithms basically adopts a WormHole(WH) routing method and uses the virtual channels sharing a physical channel for deadlock-freedom. Consequently, we show that the suggested algorithm has a higher performance than the X-Y routing algorithm through simulation results.

  • PDF

Fault-Tolerant Parallel Applications in Java Message Passing Systems (자바 메시지 전달 시스템에서의 결함 포용 병렬 애플리케이션)

  • 안진호;김기범;김정훈;황종선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.768-770
    • /
    • 1998
  • 동기적 검사점(synchronous checkpoiting)기법, 인과적 메시지 로깅(causal message logging)과 향상된 회복 비동기성(improved asynchronism during recovery)을 제공하는 복귀회복(rollback recovery) 기법을 적용하여 자바 메시지 전달 시스템(java massage passing system)에서 수행하는 병렬 에플리케이션들에게 저 비용의 결함 포용성에 따라, 통신망으로 연결된 이질형 (fault-tolerance)(heterogeneous) 컴퓨터들을 이용하는 대규모 분산 시스템들은 아주 효율적인 병렬 컴퓨팅 환경을 제공해준다. 그러나, 이러한 분산 시스템들의 규모가 커짐에 따라 고장률 (failure rate)도 그 만큼 중요하게 된다. 따라서, 고장률이 높은 대규모 분산 시스템들에게 좀더 효율적인 결함 포용성을 제공하는 기법들이 필요하다. 또한, 대규모분산 시스템들은 이질형 컴퓨터들로 구성되어 있기 때문에, 결함 포용성을 제공하는 소프트웨어 패키지들은 플랫폼 독립적(platform independent)이어야 한다. 이러한 문제점은 높은 이식성(portability)을 가지고 있는 자바 언어로 구현함으로써 해결될 수 있다. 따라서, 본 논문은 자바 메시지 전달 시스템에서 수행되는 병렬 애플리케이션들에게 동기적 검사점 기법, 인과적 메시지 로깅과 향상된 비동기성을 제공하는 복귀회복 기법을 높은 이식성을 가진 자바언어로 구현하여 저 비용으로 결함 포용성을 제공하고자 한다.

  • PDF

A Design of QoS Fault Manager in Grid Computing System (그리드 컴퓨팅 시스템에서 QoS 결함 탐지 방법)

  • 이화민;정광식;진성호;이대원;정순영;유헌창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10e
    • /
    • pp.469-471
    • /
    • 2002
  • 그리드 컴퓨팅 시스템은 광범위한 지역에 분산된 고성능 자원, 대용량 정보 및 혁신적인 애플리케이션 등을 네트워크로 연결하여 마치 단일 컴퓨터를 사용하는 것처럼 자원을 상호공유하고 이용할 수 있도록 지원한다. 광범위 분산 컴퓨팅 시스템(wide area distributed computing systems)인 그리드 역시 분산 컴퓨팅 시스템과 같이 각 자원의 결함발생 가능성이 존재한다. 그리드 컴퓨팅 시스템에서도 결함은 작업수행에 있어서 치명적일 수 있기 때문에 결함 포용 기능은 필수적인 요소이다. 하지만 그리드 컴퓨팅 환경을 제공하는 글로버스(globus) 미들웨어에는 결함 포용 기능이 포함되어 있지 않다. 이에 본 연구에서는 그리드 컴퓨팅 시스템에서 QoS(quality of service)을 고려하여 프로세스, 프로세서, 네트워크 결함을 정의하고, 정의된 결함이 발생할 경우 결함을 탐지하고 해결하는 방법을 제안한다.

  • PDF

Fault Tolerant Static Shuffle-Exchange Network (결함 포용 정적 Shuffle-Exchange 네트워크)

  • Choi Hong In
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.30 no.3_4
    • /
    • pp.160-167
    • /
    • 2003
  • A static shuffle-exchange network is not only useful for several parallel applications but also use less hardware than the popular multi-stage network or hypercube. Even though it has a lot of advantages, it has never been used in any implemented parallel machine. One of the reasons is there has not been any techniques to make the network fault-tolerant. In this paper multiple fault-tolerant static shuffle-exchange networks are presented. In order to recover from k faulty processing elements, a network needs at least 2 k additional processing elements and at most 4 k additional shuffle ports for each processing elements. By decomposing the k fault-tolerant static shuffle-exchange network into m identical modules, this paper shows that the reliability of the network can be increased.