크로스바 ATM 스위치에서의 장애 관리

Fault Management in Crossbar ATM Switches

  • 오민석 (경기대학교 전자공학부)
  • 발행 : 2005.02.01


다중채널 스위치는 ATM (Asynchronous Transfer Mode)로 널리 사용되는 스위치 구조이며, 스위치의 내부에 장애에 대한 내성(tolerance) 을 구현할 수 있는 것으로 알려져 있다. 예를 들어, 하나의 다중 채널 그룹에 속하는 링크에 장애가 있을 경우, 장애 링크로 통과하려는 트래픽을 여분의 링크가 책임을 질 수 있게 할 수 있다. 스위치 소자에 발생하는 장애는 ATM 셀을 잘못 라우팅하거나 출력단에 도달하는 셀의 순서를 뒤바꾸게 할 수 있다. 본 논문에서는 다중 채널 크로스바 ATM 스위치에 적용할 수 있는 두 가지의 장애 위치 확인 알고리즘을 제안한다. 첫 번째로 제안하는 최적 알고리즘은 시간적으로 최상의 성능을 보여주지만, 계산상으로는 복잡하게 되어 결과적으로 실제 구현이 어려울 수 있다. 이러한 문제점을 해결하기 위해 최적의 알고리즘보다는 계산상으로 보다 효율적인 온라인 알고리즘을 제안한다. 두 알고리즘의 성능은 시뮬레이션을 통해 검증한다. 온라인 알고리즘은 랜덤 트래픽 및 버스티(bursty) 트래픽에 대해 거의 최적에 가까운 성능을 보여 준다. 한편, 제안된 알고리즘으로 장애론 찾아낼 수 없는 경우가 있는데, 그에 대한 열거 및 원인을 제시한다. 끝으로 장애 위치 확인 알고리즘을 이용해서 찾은 장애를 우회하기 위해 행과 연을 추가하는 장애 복구 알고리즘을 제안하다.

The multichannel switch is an architecture widely used for ATM (Asynchronous Transfer Mode). It is known that the fault tolerant characteristic can be incorporated into the multichannel crossbar switching fabric. For example, if a link belonging to a multichannel group fails, the remaining links can assume responsibility for some of the traffic on the failed link. On the other hand, if a fault occurs in a switching element, it can lead to erroneous routing and sequencing in the multichannel switch. We investigate several fault localization algorithm in multichannel crossbar ATM switches with a view to early fault recovery. The optimal algorithm gives the best performance in terms of time to localization but it is computationally complex which makes it difficult to implement. We develop an on-line algorithm which is computationally more efficient than the optimal one. We evaluate its performance through simulation. The simulation results show that the Performance of the on-line algorithm is only slightly sub-optimal for both random and bursty traffic. There are cases where the proposed on-line algorithm cannot pinpoint down to a single fault. We enumerate those cases and investigate the causes. Finally, a fault recovery algorithm is described which utilizes the information provided by the fault localization algorithm The fault recovery algorithm providesadditionalrowsandcolumnstoallowcellstodetourthefaultyelement.



  1. A. Pattavina, 'Multichannel bandwidth allocation in a broadband packet switch,' IEEE Journal on Selected Areas in Communications, Vol.6, No.9, pp.1489-1499, Dec., 1988
  2. R. L. Cruz, 'The statistical data forkA class of broad-band multichannel switches,' IEEE Transactions on Computers, Vol.40, No.10, pp.1625-1634, Oct., 1992
  3. H. S. Kim, 'Multichannel ATM switch with preserved packet sequence,' IEEE International Conference on Communications. Vol.3, pp.1634-1638, 1992
  4. A. Y.-M. Lin and J. A. Silvester, 'On the performance of an ATM switch with multichannel transmission groups,' IEEE Transactions on Communications, Vol.41, No.5, pp.760-770, May, 1993
  5. P. S. Min, H. Saidi, and M. V. Hegde, 'Nonblocking architecture for broadband multi-channel switching,' IEEE/ACM Transactions on Networking, Vol.3, No.2, pp.181-198, 1995
  6. T.-H. Cheng, 'Design and analysis of a multichannel transmission scheme,' Computer Networks and ISDN Systems, Vol.29, No.2, pp.209-220, Jan., 1997
  7. P. Y. Yan, K. S. Kim, P. S. Min, and M. V. Hegde, 'Multi-channel deflection crossbar (MCDC)A VLSI optimized architecture for multichannel ATM switching,' in Proceedings of INFOCOM '97, Kobe, Japan, pp.12-19, Apr., 1997
  8. K.-B. Kim, P. Y. Yan, K. -S. Kim, O. Schmid, and P. S. Min, 'A growable ATM switch with embedded multi-channel multicasting property,' in IEEE GLOBECOM, pp.222-226, Nov., 1997
  9. D. Bertsekas and R. Gallager, Data Networks, 2nd ed. Prentice Hall, 1992
  10. T. Anderson, Fault TolerancePrinciple and Practice. Prentice Hall, 1981
  11. A. T. Bouloutas, S. Calo, and A. Finkel, 'Alarm correlation and fault identification in communication network,' IEEE Transactions on Communications, Vol.42, pp.523-533, 1994
  12. I. Katzela and M. Schwartz, 'Schemes for fault identification in communication networks,' IEEE/ACM Transactions on Networking, Vol.3, pp.753-764, 1995
  13. A. A. Lazar, W. Wang, and R. H. Deng, 'Models and algorithms for network fault detection and identificationA review,' Communications on the Move. ICCS/lSITA '92, Vol.3, 1992, pp.999-1003
  14. P. Y. Yan, 'Crossbar architectures for broadband switching,' D.Sc., Washington University, St. Louis, MO, 1997
  15. S. K. Hui, K. Seman, and J. Yunus, 'An augmented chained fault-tolerant ATM switch,' 5th IEEE International Conference on High Speed Networks and Multimedia Communications, pp.397-400, 2002
  16. J. T. Blake and K. S. Trivedi, 'Multistage interconnection network reliability,' IEEE Transactions on Computers, Vol.38, No.11, pp.1600-1604, Nov., 1989
  17. A. Itoh, 'A fault tolerant switching network for B-ISDN.' IEEE Journal on Selected Areas in Communications, Vol.9, No.8, pp.1218-1226, Oct., 1991
  18. M. Anan and M. Guizani, 'A fault tolerant ATM switching architecture,' IEEE International Conference on Performance, Computing, and Communications Conference, pp.295-301, 2000