• 제목/요약/키워드: Cluster failure

검색결과 87건 처리시간 0.028초

리눅스 클러스터 화일 시스템 SANiqueTM의 오류 회복 기법 (Failure Recovery in the Linux Cluster File System SANiqueTM)

  • 이규웅
    • 정보처리학회논문지A
    • /
    • 제8A권4호
    • /
    • pp.359-366
    • /
    • 2001
  • This paper overviews the design of SANique$^{TM}$ -a shred file system for Linux cluster based on SAN environment. SANique$^{TM}$ has the capability of transferring user data from network-attached SAN disks to client applcations directly without the control of centralized file server system. The paper also presents the characteristics of each SANique$^{TM}$ subsystem: CFM(Cluster File Manager), CVM(Cluster Volume Manager), CLM(Cluster Lock Manager), CBM(Cluster Buffer Manager) and CRM(Cluster Recovery Manager). Under the SANique$^{TM}$ design layout, then, the syndrome of '||'&'||'quot;split-brain'||'&'||'quot; in shared file system environments is described and defined. The work first generalizes and illustrates possible situations in each of which a shared file system environment may split into two or more pieces of separate brain. Finally, the work describes the SANique$^{TM}$ approach to the given "split-brain"problem using SAN disk named "split-brain" and develops the overall recovery procedure of shared file systems.

  • PDF

Cluster and information entropy analysis of acoustic emission during rock failure process

  • Zhang, Zhenghu;Hu, Lihua;Liu, Tiexin;Zheng, Hongchun;Tang, Chun'an
    • Geomechanics and Engineering
    • /
    • 제25권2호
    • /
    • pp.135-142
    • /
    • 2021
  • This study provided a new research perspective for processing and analyzing AE data to evaluate rock failure. Cluster method and information entropy theory were introduced to investigate temporal and spatial correlation of acoustic emission (AE) events during the rock failure process. Laboratory experiments of granite subjected to compression were carried out, accompanied by real-time acoustic emission monitoring. The cumulative length and dip angle curves of single links were fitted by different distribution models and distribution functions of link length and directionality were determined. Spatial scale and directionality of AE event distribution, which are characterized by two parameters, i.e., spatial correlation length and spatial correlation directionality, were studied with the normalized applied stress. The entropies of link length and link directionality were also discussed. The results show that the distribution of accumulative link length and directionality obeys Weibull distribution. Spatial correlation length shows an upward trend preceding rock failure, while there are no remarkable upward or downward trends in spatial correlation directionality. There are obvious downward trends in entropies of link length and directionality. This research could enrich mathematical methods for processing AE data and facilitate the early-warning of rock failure-related geological disasters.

Bonded-cluster simulation of tool-rock interaction using advanced discrete element method

  • Liu, Weiji;Zhu, Xiaohua;Zhou, Yunlai;Li, Tao;Zhang, Xiangning
    • Structural Engineering and Mechanics
    • /
    • 제72권4호
    • /
    • pp.469-477
    • /
    • 2019
  • The understanding of tool-rock interaction mechanism is of high essence for improving the rock breaking efficiency and optimizing the drilling parameters in mechanical rock breaking. In this study, the tool-rock interaction models of indentation and cutting are carried out by employing the discrete element method (DEM) to examine the rock failure modes of various brittleness rocks and critical indentation and cutting depths of the ductile to brittle failure mode transition. The results show that the cluster size and inter-cluster to intra-cluster bond strength ratio are the key factors which influence the UCS magnitude and the UCS to BTS ratio. The UCS to BTS strength ratio can be increased to a more realistic value using clustered rock model so that the characteristics of real rocks can be better represented. The critical indentation and cutting depth decrease with the brittleness of rock increases and the decreasing rate reduces dramatically against the brittleness value. This effort may lead to a better understanding of rock breaking mechanisms in mechanical excavation, and may contribute to the improvement in the design of rock excavation machines and the related parameters determination.

A Token Based Protocol for Mutual Exclusion in Mobile Ad Hoc Networks

  • Sharma, Bharti;Bhatia, Ravinder Singh;Singh, Awadhesh Kumar
    • Journal of Information Processing Systems
    • /
    • 제10권1호
    • /
    • pp.36-54
    • /
    • 2014
  • Resource sharing is a major advantage of distributed computing. However, a distributed computing system may have some physical or virtual resource that may be accessible by a single process at a time. The mutual exclusion issue is to ensure that no more than one process at a time is allowed to access some shared resource. The article proposes a token-based mutual exclusion algorithm for the clustered mobile ad hoc networks (MANETs). The mechanism that is adapted to handle token passing at the inter-cluster level is different from that at the intra-cluster level. It makes our algorithm message efficient and thus suitable for MANETs. In the interest of efficiency, we implemented a centralized token passing scheme at the intra-cluster level. The centralized schemes are inherently failure prone. Thus, we have presented an intra-cluster token passing scheme that is able to tolerate a failure. In order to enhance reliability, we applied a distributed token circulation scheme at the inter-cluster level. More importantly, the message complexity of the proposed algorithm is independent of N, which is the total number of nodes in the system. Also, under a heavy load, it turns out to be inversely proportional to n, which is the (average) number of nodes per each cluster. We substantiated our claim with the correctness proof, complexity analysis, and simulation results. In the end, we present a simple approach to make our protocol fault tolerant.

On the Handling of Node Failures: Energy-Efficient Job Allocation Algorithm for Real-time Sensor Networks

  • Karimi, Hamid;Kargahi, Mehdi;Yazdani, Nasser
    • Journal of Information Processing Systems
    • /
    • 제6권3호
    • /
    • pp.413-434
    • /
    • 2010
  • Wireless sensor networks are usually characterized by dense deployment of energy constrained nodes. Due to the usage of a large number of sensor nodes in uncontrolled hostile or harsh environments, node failure is a common event in these systems. Another common reason for node failure is the exhaustion of their energy resources and node inactivation. Such failures can have adverse effects on the quality of the real-time services in Wireless Sensor Networks (WSNs). To avoid such degradations, it is necessary that the failures be recovered in a proper manner to sustain network operation. In this paper we present a dynamic Energy efficient Real-Time Job Allocation (ERTJA) algorithm for handling node failures in a cluster of sensor nodes with the consideration of communication energy and time overheads besides the nodes' characteristics. ERTJA relies on the computation power of cluster members for handling a node failure. It also tries to minimize the energy consumption of the cluster by minimum activation of the sleeping nodes. The resulting system can then guarantee the Quality of Service (QoS) of the cluster application. Further, when the number of sleeping nodes is limited, the proposed algorithm uses the idle times of the active nodes to engage a graceful QoS degradation in the cluster. Simulation results show significant performance improvements of ERTJA in terms of the energy conservation and the probability of meeting deadlines compared with the other studied algorithms.

수중 무선 센서 네트워크를 위한 클러스터 헤드 오류 복구 기법 (A Recovery Scheme of a Cluster Head Failure for Underwater Wireless Sensor Networks)

  • 허준영;민홍
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.17-22
    • /
    • 2011
  • 수중 환경은 육상 환경과 많은 차이를 보이며 무선 통신에 사용되는 자원과 제약 조건들도 다르다. 일반적으로 수중 통신 환경은 육상 통신 환경보다 열악하고, 파도, 조류와 같은 해수의 흐름으로 인한 노드의 이동성 때문에 오류 발생 가능성이 기존의 지상 무선 센서 네트워크 보다 높다. 따라서 수중 무선 센서 네트워크의 통신 환경을 고려하여 노드 간 데이터 전송률을 향상시키기 위한 기법들에 대한 요구가 높아지고 있다. 본 논문에서는 수중 무선 센서 네트워크의 통신 환경을 고려하여 클러스터 헤드 노드의 오류 발생 시 이를 빠른 시간 내에 복구하기 위한 체크포인팅 기법을 제안한다. 또한 실험을 통해 제안 기법이 네트워크 운영의 신뢰도를 향상 시킬 수 있을 뿐만 아니라, 에너지 소모량과 오류 복구 지연 시간 측면에서 제안 기법을 적용하지 않았을 때보다 좋은 성능을 보인다는 것을 검증한다.

리눅스 클러스터링 웹 서버의 고가용성에 대한 연구 (A study on high availability of the linux clustering web server)

  • 박지현;이상문;홍태화;김학배
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2000년도 제15차 학술회의논문집
    • /
    • pp.88-88
    • /
    • 2000
  • As more and more critical commercial applications move on the Internet, providing highly available servers becomes increasingly important. One of the advantages of a clustered system is that it has hardware and software redundancy. High availability can be provided by detecting node or daemon failure and reconfiguring the system appropriately so that the workload can be taken over bi the remaining nodes in the cluster. This paper presents how to provide the guaranteeing high availability of clustering web server. The load balancer becomes a single failure point of the whole system. In order to prevent the failure of the load balancer, we setup a backup server using heartbeat, fake, mon, and checkpointing fault-tolerance method. For high availability of file servers in the cluster, we setup coda file system. Coda is a advanced network fault-tolerance distributed file system.

  • PDF

기술기반기업의 지속적 성장을 위한 균형요인 연구: 대덕클러스터 성공실패 사례 중심으로 (A Study On Balance Factors for the Sustainable Growth of Technology-Based Companies: Focusing on the Case of Daedeok Cluster Successful and Unsuccessful Companies)

  • 유경식;강흥식;윤재만;김태근
    • 산업진흥연구
    • /
    • 제9권3호
    • /
    • pp.87-100
    • /
    • 2024
  • 본 연구는 기업이 창업 후 죽음의 계곡을 극복하여 지속가능한 성장에 영향을 미치는 요인을 기술, 시장, 입지, 클러스터, INC모델 관점에서 접근하였으며, 대덕클러스터 내 기술기반 기업을 대상으로 성공·실패기업에 대한 사례연구를 진행하여 선행연구의 주요 요인과의 적정성 및 적합성을 탐색하였다. 본 연구 결과는 클러스터 내 기업의 성장을 위해서는 혁신 주체 간 입지 접근성 기반 협업이 중요하며, 기업의 제품·서비스가 시장에서 혁신 가치를 창출하기 위해서는 혁신적인 아이디어(Idea), 시장의 요구(Needs), 요구를 충족할 수 있는 역량(Capability) 등 균형적 성장이 필요함을 제시한다. 대덕클러스터 내 기업 대상 성공·실패 사례분석으로 지속 가능한 기업 성장을 위한 요인을 제시했다는 점에서 연구의 가치가 있다. 그리고 클러스터 내 기업육성을 위해 기업 간 협업 기반 정책적 지원 방안을 제시했다는 점에서 연구의 성과가 있다.

고가용성 클러스터 파일 시스템 $\textrm{SANique}^{TM}$의 분할그룹 탐지 및 회복 기법 (Recovery Management of Split-Brain Group in Highly Available Cluster file System $\textrm{SANique}^{TM}$)

  • 이규웅
    • 한국멀티미디어학회논문지
    • /
    • 제7권4호
    • /
    • pp.505-517
    • /
    • 2004
  • 본 논문은 저장 장치 전용 네트워크인 SAN에 직접 연결된 저장장치들을 특정한 서버의 도움 없이 접근할수 있는 클러스터 파일시스템 $\textrm{SANique}^{TM}$의 설계 방법을 기술하며, 특히 회복 관리 기의 기능 및 특징을 설명 하고, 이를 위한 시스템 구성요소 및 오류 탐지 절차를 기술한다. 또한 클러스터 내의 오류 발생 상황 중에서 탐지하기 어려운 분할 그룹 문제를 정의하고 이 문제를 해결하기 위하여 $\textrm{SANique}^{TM}$ 회복 관리기에서 사용한 공유 디스크를 활용한 오류 탐지 및 회복 방법을 제안한다.

  • PDF

클러스터 VOD 서버의 부분적 장애에서 QoS 보장 (QoS Guarantee in Partial Failure of Clustered VOD Server)

  • 이좌형;정인범
    • 정보처리학회논문지C
    • /
    • 제16C권3호
    • /
    • pp.363-372
    • /
    • 2009
  • 대용량 VOD 서비스를 위한 서버로 높은 성능과 낮은 가격의 클러스터 서버가 주목받고 있다. 일반적으로 클러스터 서버는 하나의 front-end 노드와 여러 back-end 노드로 구성된다. back-end 노드 수를 증가시키면 더 많은 클라이언트들에게 QoS를 보장하는 스트리밍 서비스를 할 수 있지만, back-end 노드의 오류 가능성도 이와 비례하여 증가한다. 서버의 장애는 모든 스트리밍 서비스를 중단시킬 뿐 아니라 현재 재생 위치 정보도 잃어버린다. 본 논문에서는 back-end 노드가 오류 상태가 될 때, 끊이지 않는 스트리밍 서비스를 지원하기 위한 복구 방법을 제안한다. 실제 VOD 서비스 환경을 위해, 일반 PC로 구성된 클러스터 기반의 VOD 서버를 구현하였으며, MPEG 영화를 위한 병렬 처리 기법을 사용하였다. 구현된 VOD 서버에 패리티 연산을 이용한 비디오 블록 복구 방법을 설계하였다. 하지만, 클러스터 기반의 VOD 서버 구조를 고려하지 않으면 복구를 위한 내부 네트워크 성능의 병목현상과 back-end 노드들의 비효율적인 CPU 사용을 야기시킨다. 본 논문에서는 이러한 문제를 해결하기 위해, 파이프라인 개념을 이용한 새로운 장애 복구 방법을 제안한다.