DOI QR코드

DOI QR Code

MPMD 방식의 비동기 연산을 이용한 응용 수준의 무정지 선형 시스템의 해법

An Application-Level Fault Tolerant Linear System Solver Using an MPMD Type Asynchronous Iteration

  • 박필성 (수원대학교 IT대학 컴퓨터학과)
  • 발행 : 2005.10.01

초록

대규모 병렬 연산에 있어서, 계산 노드 혹은 이들을 연결한 통신 네트워크의 장애는 연산 실패로 끝나며, 소중한 계산 시간이 낭비된다. 그러나 현재의 MPI 표준은 이에 대한 대안을 제시하지 않고 있다. 본 논문에서는, 비표준의 무정지형 MPI 라이브러리가 아닌 MPI 표준 함수들만을 사용하여, MPMD 방식의 비동기 연산을 도입한 응용 수준의 무정지형 선형 시스템의 해법을 제안한다.

In a large scale parallel computation, some processor or communication link failure results in a waste of huge amount of CPU hours. However, MPI in its current specification gives the user no possibility to handle such a problem. In this paper, we propose an application-level fault tolerant linear system solver by using an MPMD-type asynchronous iteration, purely on the basis of the MPI standard without using any non-standard fault-tolerant MPI library.

키워드

참고문헌

  1. 박필성, 신순철, '비동기 알고리즘을 이용한 분산 메모리 시스템에서의 초대형 선형 시스템 해법의 성능 향상', 한국정보처리학회 논문지 8-A권, 제4호, pp.439-446, 2000
  2. R. Bru, V. Migallon, J. Penades, and D. B. Szyld, 'Parallel, synchronous and asynchronous two-stage multisplitting methods,' Electronic Transactions on Numerical Analysis, Vol.3, pp.24-38, 1995
  3. C. Chang, G. Czajkowski, T. von Eicken, and C. Kesselman, 'Evaluating the performance limitation of MPMD communication,' In Proceedings of SC '97, San Jose, CA, November, pp.15-91, 1997 https://doi.org/10.1109/SC.1997.10040
  4. D. Chazan and W. Miranker, 'Chaotic relaxation,' Linear Algebra and Its Applications, Vol.2, pp.199-222, 1969 https://doi.org/10.1016/0024-3795(69)90028-7
  5. R. Cole and Z. Ofer, 'An asynchronous parallel algorithm for undirected graph connectivity,' TR-546, Dept. of Computer Science, New York University, Feb., 1991
  6. G. E. Fagg, E. Gabriel, Z. Chen, T. Angskun, G. Bosilca, A Bukovsky, & J. J. Dongarra, 'Fault tolerant communication library and applications for high performance computing,' Proceedings of the Los Alamos Computer Science Institute Symposium 2003, Santa Fe, NM., http://icl.cs.utk.edu/news_pub/ submissions/lacsi2003-ftmpi-fagg .pdf
  7. MPI Forum. 1995. MPI: A Message-Passing Interface standard
  8. I. T. Foster, 'Designing and building parallel programs,' Addison-Wesley Publishing Company, Reading, Massachusetts, 1995
  9. Frommer, A., Schwandt, H. and Szyld, D. B. (1997). 'Asynchronous weighted additive Schwarz methods,' Electronic Transactions on Numerical Analysis, vol.5, pp.48-67
  10. Y. Su and A. Bhaya, 'Convergence of pseudocontractions and applications to two-stage and asynchronous multisplitting for singular M-matrices,' SIAM J. Matrix Analysis & Applications, Vol.22, pp.948-964, 2001 https://doi.org/10.1137/S0895479898339414
  11. D. B. Szyld, 'Different models of parallel asynchronous iterations with overlapping blocks,' Computational and Applied Mathematics, Vol.17, pp.101-115, 1998
  12. A. Uresin and M. Dubois, 'Parallel asynchronous algorithms for discrete data,' Journal of ACM, Vol.37, pp.588-606, 1990 https://doi.org/10.1145/79147.79162