• 제목/요약/키워드: 고장 감내 시스템

검색결과 64건 처리시간 0.024초

서버 클러스터 시스템을 위한 고장 감내 소프트웨어 개발 환경 (Fault-Tolerant Software Development Environment for Server Cluster Systems)

  • 함명호;김진용;신현식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.298-300
    • /
    • 2003
  • 분산 시스템 환경에서 하드웨어나 소프트웨어 자원의 가용성이나 신뢰성을 높이기 위한 노력으로 가용성이 높은 클러스터 시스템이나 고장 감내 소프트웨어 개발 환경들이 연구되어 왔다. 본 연구에서는 하드웨어의 신뢰성을 높이기 위해 서버 클러스터 시스템을 구축하였고, 이 클러스터 시스템에 기반한 고장 감내 소프트웨어 개발 환경을 구축하였다. 사용자는 고장 감내 소프트웨어 개발 환경을 이용하여 쉽게 고장 감내 소프트웨어를 작성할 수 있고, 원하는 소프트웨어 고장 감내 기법을 간단하게 기술할 수 있다. 특히, 소프트웨어 개발과 소프트웨어 고장 감내 기법의 적용을 논리적으로 분리시켜 소프트웨어 개발 과정을 단순화 시켰고, 이미 개발된 소프트웨어 모듈의 변경 없이 다양한 고장 감내 기법을 적용할 수 있게 하였다. 이러한 개발상의 논리적인 분리, 소프트웨어 모듈의 동적 노드 결정, 그리고 작업 스케쥴링 둥의 일을 처리하기 위해 실행 시간 제공 요소(Run-time supports)들이 노드와 네트웍 고장을 감내 하기 위해 개발된 미들웨어 계층 위에서 구현되었다.

  • PDF

객체 지향 실시간 운영체계상에서의 고장감내 객체 서비스 (Fault Tolerant Object Service on the Object-Oriented Real Time OS)

  • 이은향;김형환;임동선;정연호;김영만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.209-211
    • /
    • 1999
  • 본 논문에서는 CORBA의 고장 감내(fault tolerance) 방식을 이용하여 교환기 시스템을 위한 객체 지향 실시간 운영체계상에서의 고장 감내 객체서비스 구현을 목표로 한다. 이를 위해 먼저 CORBA의 고장 감내 방식을 분석하고, 전자 교환기에 적합한 실시간 고장 감내 방식에 대하여 제안한다. 이 방식에서는 교환기내의 이중화 시스템을 이용하여 객체 단위에서 고장 감내 기능을 제공하게 된다.

  • PDF

신뢰성 있는 Java RMI 객체 설계 및 구현 (Fault-tolerant Java RMI Object Design and Implementation)

  • 윤태진;박양우;이채수
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2001년도 춘계학술대회논문집:21세기 신지식정보의 창출
    • /
    • pp.198-208
    • /
    • 2001
  • CORBA, DCOM, Java RMI 등과 같은 분산 객체 기술이 분산 응용의 신뢰성을 직접적으로 향상시키지는 못한다. 이러한 분산 객체 기술에 고장 감내성을 추가하여 신뢰성 있는 시스템을 구축하기 위해서 객체 단위의 복제 그룹 관리와 고장 탐지 및 회복 메커니즘이 필요하다. 본 논문에서는 신뢰성 있는 고장 감내성 Java RMI 객체를 개발하기 위하여 고장 탐지와 그룹 관리를 위한 그룹 관리자와 원격 인터페이스를 설계하고, 고장 감내성 클래스를 정의한다. 또한 고장 감내성 객체의 투명한 그룹 참여를 위하여 Naming 클래스와 RMIRegistry를 확장한다. 응용 개발자는 고장 감내성 클래스를 상속함으로써 외부의 도움 없이 간단히 고장 감내성 응용 객체를 개발하여 신뢰성을 높일 수 있다. 100M Ethernet으로 연결된 Linux kernel2.2.1의 PentiumIII머신 3대와 Solaris2,6의 Sun Spar치머신을 클라이언트한 시스템을 사용하고 JDK 1.2.2를 이용하여 설계한 객체를 구현하여 다양한 객체고장 에 대해 복구되는 것을 확인하였다. 성능 평가는 그룹크기에 따른 함수의 응답속도와 메시지 크기에 따른 응답속도를 비교하였다.

  • PDF

고장 감내 CORBA를 위한 로깅 및 회복 기법 (A Logging and Recovery Mechanism for Fault Tolerant CORBA)

  • 김홍식;구경이;김중한;김유성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.157-159
    • /
    • 2000
  • 분산 객체 시스템을 통합하기 위한 표준인 CORBA(Common Object Request Broker Atchitecture)는 분산 환경에서 더욱 더 자주 발생하는 고장에 대한 회복 수단을 제공하지 않기 때문에, 높은 신뢰성을 요구하는 상업용 어플리케이션에 도입되지 못하고 있다. 이에 따라, CORBA 구조 내에 자체적인 고장 감내 구조를 추가해 신뢰성 높은 서비스를 제공할 수 있는 고장 감내 CORBA에 대한 연구가 진행되고 있다. 그러나, 2000년 4월에 채택된 고장 감내 CORBA에 대한 명세서에서는 객체의 인터페이스를 정의하는 기술 언어인 CORBA IDL(Interface Definition Language)로 객체 단위의 중복과 이를 위한 시스템의 구조 및 각 모듈의 설계를 요약하고 있으나, 그 세부적인 메커니즘이 제시되지 않고 있다. 따라서 본 논문에서는 CORBA에 고장 감내성을 부여하기 위해 세부적인 고장 감내 CORBA를 위한 로깅 및 회복 기법을 제안한다.

  • PDF

파티션 컴퓨팅 기반의 무인기 고장 감내 관성 항법 시스템 (A Fault-tolerant Inertial Navigation System for UAVs Based on Partition Computing)

  • 정병용;김정국
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권1호
    • /
    • pp.29-39
    • /
    • 2015
  • 무인기 항법 시스템의 개발 및 실험에는 위험 요소가 많아 가벼운 하중을 유지하면서도 고장 감내를 지원하는 시스템이 요구된다. 본 논문에서는 CPU 시간과 메모리를 독립적으로 사용하는 파티션을 기반으로, 단일 및 복수 개의 FCC(Flight Control Computer)에서 항법용 주 및 보조 OFP(Operational Flight Program) 파티션들을 독립적으로 수행하는 고장 감내 무인기 항법 시스템에 대해 기술한다. 개발된 시스템은 이중화된 두 개의 FCC를 사용하고, 각 보드에서는 OFP 파티션을 이중화하여 개발 중인 OFP 및 검증된 OFP 시스템을 독립적으로 수행한다. 이러한 고장 감내 시스템은 감내 하중이 작은 무인기의 경우에 하나의 FCC만 사용하여도 S/W 이중화에 따른 고장 감내가 가능하며, H/W 고장 감내도 필요한 중대형 무인기의 경우, 이중화 파티션을 수행하는 보조 FCC까지 사용한다. 이와 같은 파티션 기반 고장 감내 항법 시스템은 그 개발 단계에서 실험의 많은 위험 요소를 제거할 것이다.

고장 감내형 CORBA를 위한 객체 그룹간 고장인지 및 회복 메커니즘의 설계 (Design of Fault Detection and Recovery Mechanism for Fault Tolerant CORBA)

  • 박종필;김유성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.267-269
    • /
    • 1999
  • 고장 감내형 CORBA*Fault Tolerant Common Object Broker Architecture)는 분산 객체 시스템 통합기술의 표준인 CORBA에 고장에 대한 회복수단을 제공하기 위해 제안되었다. CORBA에 고장 감내성을 추가하기 위해서는 객체단위의 중복그룹의 관리, 호출 구조 및 이에 따른 고장인지 및 회복기법이 필요하다. 기존에 제안된 분산 시스템 환경에서의 고장인지 및 회복기법들은 프로세스 단위의 동작, 실행시간에 생성된 객체의 동적 환경구성 기능의 부제 등의 문제로 고장 감내형 CORBA에 적용시키기에는 많은 문제점을 가지고 있다. 따라서, 본 논문에서는 사용자에게 고장투명성과 연속적인 서비스 제공을 보장하는 고장 가내형 CORBA에 필요한 핵심기술인 객체 그룹간 고장인지 방법 및 고장으로부터의 회복 메커니즘을 제안한다.

  • PDF

병렬 및 분산환경에서의 고장 감내 메시지 전달 인터페이스 (Fault-Tolerant Message Passing Interface on Parallel and Distributed Systems)

  • 송대기;김종훈;강용호;이철훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.732-734
    • /
    • 1998
  • 본 논문에서는 메시지 전달을 기반으로 하는 병렬 분산 시스템에 고장 감내 기능을 추가하기 위한 고장 감내 기법과, 고장 복구에 따른 프로세서들간의 일관성 유지방법을 제안하였다. 메시지 전달을 기반으로 하는 병렬 컴퓨터 시스템상에서 응용 프로그램들은 수많은 노드들에 분산 배치되어 수행이 되는데, 그중 어느 한 노드 또는 작업 중인 프로세서가 고장을 일으킨다면 이로 인하여 전체 응용 프로그램이 중단 될 것이다. 이러한 문제를 해결하기 위하여 고장 감내 기능 추가가 필요하며, 그 방법으로서 동일한 작업을 수행하는 프로세서를 서로 다른 노드상에 이중화하여 하나의 프로세서에 고장이 발생하더라도 계속 작업중인 예비 프로세서를 이용함으로써 전체 응용 프로그램이 아무런 영향을 받지 않도록 하였다. 그리고 이를 MPI상에 서브 모듈로써 설계하고 구현하였다.

  • PDF

고장감내를 고려한 순차기기반 방송통신 프로토콜 (A Sequencer-Based Fault tolerant Broadcasting Protocol)

  • 홍영식
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권2호
    • /
    • pp.155-163
    • /
    • 1999
  • 방송통신 프로토콜은 메시지들의 순서가 바뀌거나 메시지 손실이 발생하는 문제점을 갖는 비신뢰 통신 프로토콜이다. 아메바 시스템에서 사용하는 순차적 기반 방송통신 프로토콜은 신뢰성 있고 전송되는 모든 메시지들의 순서를 일정하게 유지할 수 있는 통신 방법중의 하나이다. 비록 아메바 시스템에서는 순차기의 고장이 발생하였을 경우 선출알고리즘을 사용하여 대처하지만, 대부분의 순차기기반 방송통신 프로토콜들은 단일 노드 고장이라는 한가지 단점을 가지고 있다. 이 단점은 순차기 고장으로 인해 전체 시스템에서의 방송통신을 사용할 수 없는 매우 치명적인 현상이 발생한다. 본 논문에서는 전송되는 모든 메시지들의 순서를 일정하게 유지하면서 순차기의 작업량을 줄이는 고장감내 방송통신 프로토콜 알고리즘을 제안한다. 제안된 알고리즘에서는 다수의 순차기를 사용하고 손실된 메시지를 재전송하기 위한 논리적 노드인 기록노드를 사용한다. 또한 순차기노드의 고장을 검출하기 위하여 순차기들간의 논리적 리스트를 구성한다. 제안된 알고리즘의 성능을 측정하기 위하여 시뮬레이션 하였고 실제 유닉스를 기반으로 하는 랜에서 실험했다. 시뮬레이션결과, 제안된 알고리즘은 기존의 순차기기반 알고리즘보다 빠르고, 고장감내 성격을 갖고 있음을 알 수있다.

로봇의 고장특성에 기반한 로봇 고장감내 접근법 (A Robot Fault-tolerance Approach Based on Fault Type)

  • 심빈구;백범호;김규래;김동선;박수용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.471-472
    • /
    • 2009
  • 로봇 서비스 분야가 점점 확대됨에 따라, 신뢰할 수 있는 로봇개발을 위한 방안연구가 시급하다. 고장감내에 대한 연구는 신뢰도를 높이기 위한 연구분야 중에서 가장 주목받는 분야중 하나이다. 오랜 기간 로봇에 고장감내 특성을 적용하기 위한 다양한 연구들이 진행되었지만, 대부분의 연구들이 제한된 환경을 대상으로 하는 단일 기법에 초첨을 맞추고 있다. 하지만, 이러한 기법들을 기반으로 신뢰도 높은 로봇을 개발할 수 있기 위해서는, 환경에 따라 적합한 고장감내기법들에 대한 복합적인 연구가 필요하다. 본 연구에서는 로봇이 대상으로 하는 환경과 분야에 적합한 고장감내기법들을 보다 효과적이고 정확하게 선정할 수 있는 시스템적 접근방법을 제안한다.

분산 시스템에서 고장 감내성의 향상을 위한 적응형 체크포인팅 프로토콜 (Adaptive Checkpointing Protocol for Improving of Fault Tolerance in Distributed System)

  • 이용호;장태무
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.90-92
    • /
    • 1999
  • 비동기 체크포인팅 프로토콜은 분산 시스템에서 고장 감내성을 제공하기 위한 방법중 하나다. 이 방법은 모든 프로세스가 독립적으로 자신의 지역 체크포인트를 두고 어느 한 프로세스에서의 고장 발생시 가장 최근의 체크포인트에서부터 롤백을 하는 것이다. 하지만 이 방법은 어느 한 프로세스에서의 고장 발생이 다른 프로세스의 롤백까지 유도하는 캐스캐이드 롤백을 발생시킬 수 있는 단점이 있다. 본 논문에서는 고장 감내성의 수준을 높이기 위하여 비동기 체크포인팅 프로토콜을 사용하면서도 캐스캐이드 롤백을 막을 수 있는 적응형 체크포인팅 프로토콜을 사용한다. 프로세스사이에 오고가는 모든 메시지의 복사본이 서버쪽의 중재자를 통하여 서버에 있는 기계 상태 테이블에 저장된다. 이렇게 하여 서버에는 무든 지역 기계의 상태가 저장되어 기계 고장이 발생했을 경우에 고장이 발생한 기계의 복구에 사용된다.

  • PDF