대기시간 데드라인 조건을 고려한(n, k)-way 시스템의 가용 성능 분석

Analysis of Available Performance Satisfying Waiting Time Deadline for (n, k)-way Systems

  • 박기진 (안양대학교 컴퓨터학과) ;
  • 김성수 (아주대학교 정보통신전문대학원)
  • 발행 : 2003.10.01

초록

일정 수준의 시스템 성능을 제공하기 위해 다수의 서버를 클러스터로 연결하여 동시에 가동할 경우, 서버의 가동 대수가 증가함으로 인해 발생하는 가용도 저하 문제를 해결해야 하며, 이를 위해서는 시스템의 성능 변화를 반영할 수 있는 가용 성능에 대한 명확한 정의가 요구된다. 기존의 가용도에 관한 연구들은 시스템의 성능(대기시간, 응답시간 등)을 고려하지 않는 가용도 계산 모델이 주를 이루고 있으며, 또한 클러스터 시스템을 구성하는 주 서버의 결함 발생을 허용하기 위한 방안에 대한 연구가 부족하였다. 본 논문에서는 위와 같은 문제점들에 대한 해결 방안의 일환으로, 비용 효율적인 결함허용을 위해 n 대의 주 서버와 k 대의 여분서버로 구성된 클러스터 시스템에서 대기시간을 일정 수준이하로 만족시키는지에 근거한 새로운 가용도 척도를 제시하였으며, 다양한 시스템 운영 상태에 대한 실험을 통하여, 시스템의 대기 시간 데드라인 성능이 포함된 보다 현실적인 가용도 및 downtime을 계산하였다.

As cluster systems used for high performance computing consist of large number of running servers, one has to solve the low availability problems occurred by the high chance of the server failures. To handle the problems, it is necessary to have the precise definition of available performance of cluster systems that represents availability and performability of the systems simultaneously. Previous research results that mention availability issues lack for concerning system performance such as waiting time and response time in their availability definition. In this paper, we propose a new availability metric for (n, k)-way cluster systems which compose of n primary servers and k backup servers. With the metric, the change of system performance according to arrival rates is captured and the waiting time of a request can be kept below to a certain level. Using various system operating parameters, we calculate availability and downtime of cluster systems along with waiting tine deadline.

키워드

참고문헌

  1. V. Mainkar, 'Availability Analysis of Transaction Processing Systems Based on User-Perceived Performance,' Proceedings of the 16th Symposium on Reliable Distributed System(SRDS '97), 1997 https://doi.org/10.1109/RELDIS.1997.632791
  2. 박기진, 김성수, 김재훈, '소프트웨어 재활 기법을 적용한 다중계 시스템의 가용도 분석', 한국정보과학회논문지(시스템및이론), 제27권, 제8호, pp.730-740, 2000. 8
  3. R. Buyya, High Performance Cluster Computing Volume 1: Architectures and Systems, p. 849, Prentice-Hall, 1999
  4. 유찬수, '리눅스 클러스터링', 정보과학회지, 제18권, 제2호, pp. 33-39, 2000. 2
  5. 권세오, 김상식, 김동승, '리눅스 클러스터형 웹 서버 설계', 정보과학회지, 제18권, 제3호, pp. 48-56, 2000. 3
  6. 오수철, 정상화, '클러스터 시스템 기술 동향', 정보과학회지, 제18권, 제3호, pp. 4-10, 2000. 3
  7. M.S. Squillante, D.D. Yao and L. Zhang, 'Web Traffic Modeling and Web Server Performance Analysis,' Proc. of the 38th Conference on Decision & Control, Phoenix, Arizona, pp. 4432-4439, Dec. 1999 https://doi.org/10.1109/CDC.1999.833239
  8. B. Krishnamurthy and C.E. Wills, 'Analyzing Factors that Influence End-To-End Web Performance,' Computer Networks, Vol. 33, pp. 17-32, 2000 https://doi.org/10.1016/S1389-1286(00)00067-0
  9. M. Nabe, M. Murata and H. Miyahara, 'Analysis and Modeling of World Wide Web Traffic for Capacity Dimensioning of Internet Access Lines,' Performance Evaluation, Vol. 34, pp. 249-271, 1998 https://doi.org/10.1016/S0166-5316(98)00040-6
  10. O. Pentakalos, D. Menasce, M. Halem and Y. Yesha, 'Analytical Performance Modeling of Hierachical Mass Storage Systems,' IEEE Transcations on Computers, Vol. 46, No. 10, pp. 1103-1118, Oct. 1997 https://doi.org/10.1109/12.628395
  11. D. Anderson, T. Yang and O.H. Ibarra, 'Toward a Scalable Distributed WWW Server on Work-station Clusters,' Journal of Parallel and Distributed Computing, Vol. 42, pp. 91-100, 1997 https://doi.org/10.1006/jpdc.1997.1305
  12. A.T. Dahbura, K.K. Sabnani and W.J. Hery, 'Spare Capacity as a Means of Fault Detection and Diagnosis in Multiprocessor Systems,' IEEE Transactions on Computers, Vol. 38, No. 6, pp. 881-891, June 1989 https://doi.org/10.1109/12.24300
  13. F. Wang, K. Ramamritham and J.A. Stankovic, 'Determining Redundancy Levels for Fault Tolerant Real-Time Systems,' IEEE Transactions on Computers, Vol. 44, No. 2, pp. 292-301, Feb. 1995 https://doi.org/10.1109/12.364540
  14. B.W. Johnson, Design and Analysis of Fault-Tolerant Digital Systems, p. 584, Addison-Wesley Publishing Company, 1989
  15. H. Nabil and B. Sericola, 'Performability Analysis for Degradable Computer Systems,' Computers & Mathematics with Applications, Vol. 39, No. 3-4, pp. 217-234, Feb. 2000 https://doi.org/10.1016/S0898-1221(99)00347-8
  16. V. Sune, J. Domingo and J. Carrasco, 'Numerical Iterative Methods for Markovian Dependability and performability Models: New Results and a Comparison,' Performance Evaluation, Vol. 39, No. 1-4, pp. 99-125, Feb. 2000 https://doi.org/10.1016/S0166-5316(99)00060-7
  17. G. Rubino and B. Sericola, 'Interval Availability Analysis Using Denumerable Markov Process: Application to Multiprocessor Subject to Break downs and Repair,' IEEE Transactions on Computers, Vol. 44, No. 2, pp. 286-291, Feb. 1995 https://doi.org/10.1109/12.364539
  18. H. Nabli and B. Sericola, 'Performability Analysis: A New Algorithm,' IEEE Transactions on Computers, Vol. 45, No. 4, pp. 491-494, April. 1996 https://doi.org/10.1109/12.494108
  19. B. Sericola, 'Availability Analysis of Repairable Computer Systems and Stationarity Detection,' IEEE Transactions on Computers, Vol. 48, No. 11, pp. 1166-1172, Nov. 1999 https://doi.org/10.1109/12.811102
  20. L. Kleinrock, Queueing Systems Volume 1: Theory, p. 417, John Wiley & Sons Inc., 1975
  21. D. Gross and C.M. Haris, Fundamentals of Queueing Theory, p. 556, John Wiley & Sons Inc., 1974