DOI QR코드

DOI QR Code

계산과학 시뮬레이션을 위한 실시간 가상 클러스터 생성 및 I/O 성능 향상 기법

A Technique for Provisioning Virtual Clusters in Real-time and Improving I/O Performance on Computational-Science Simulation Environments

  • 최찬호 (한국과학기술정보연구원 첨단응용환경개발실) ;
  • 이종숙 (한국과학기술정보연구원 첨단응용환경개발실) ;
  • 김한기 (한국과학기술정보연구원 첨단응용환경개발실) ;
  • 진두석 (한국과학기술정보연구원 첨단응용환경개발실) ;
  • 유정록 (한국과학기술정보연구원 첨단응용환경개발실)
  • 투고 : 2014.09.17
  • 심사 : 2014.10.28
  • 발행 : 2015.01.15

초록

최근 시뮬레이션이 다양한 계산과학 및 산업 분야에서 널리 활용되면서, 컴퓨팅 자원에 대한 그 요구사항 또한 점점 다양해지고 있다. 특히 이러한 요구는 기존 슈퍼컴퓨터와 같은 CPU 중심의 자원에서 벗어나, 사용자 별 설정 및 활용이 쉬운 유연하고 효율적인 고성능 클라우드 컴퓨팅의 필요성이 커지고 있다. 클라우드 컴퓨팅을 이용해 시뮬레이션을 수행하기 위해서는 다수의 가상머신으로 이루어진 대규모의 가상 클러스터의 실시간 구축이 필연적이다. 이러한 대규모의 가상 클러스터 생성은 동시 다발적인 가상머신 요청을 야기시키고, 이 요청들에 의해 대기 시간이 매우 길어지는 문제가 발생할 수 있다. 이런 문제의 주요 원인은 각각의 가상머신에서 사용되는 가상 이미지를 생성, 복사하는 작업들간에 병목 현상 때문이다. 본 논문에서는 가상머신 이미지들의 생성 시간을 최소화하고, 가상 클러스터의 I/O 성능을 향상시킬 수 있는 방법을 제안한다. 또한 다양한 실험을 통해 제안한 방법의 우수성을 검증한다.

Computational science simulations have been used to enable discovery in a broad spectrum of application areas, these simulations show irregular demanding characteristics of computing resources from time to time. The adoption of virtualized high performance cloud, rather than CPU-centric computing platform (such as supercomputers), is gaining interest of interests mainly due to its ease-of-use, multi-tenancy and flexibility. Basically, provisioning a virtual cluster, which consists of a lot of virtual machines, in a real-time has a critical impact on the successful deployment of the virtualized HPC clouds for computational science simulations. However, the cost of concurrently creating many virtual machines in constructing a virtual cluster can be as much as two orders of magnitude worse than expected. One of the main factors in this bottleneck is the time spent to create the virtual images for the virtual machines. In this paper, we propose a novel technique to minimize the creation time of virtual machine images and improve I/O performance of the provisioned virtual clusters. We also confirm that our proposed technique outperforms the conventional ones using various sets of experiments.

키워드

과제정보

연구 과제 주관 기관 : 미래창조과학부, KISTI

참고문헌

  1. WU, Sitao, et al., "Large memory high performance computing enables comparison across human gut microbiome of patients with autoimmune diseases and healthy subjects," Proc. of the Conference on Extreme Science and Engineering Discovery Environment: Gateway to Discovery. ACM, p. 25, 2013.
  2. TOTH, David; FRANCO, Jimmy; BERKES, Charlotte, "Attacking HIV, tuberculosis and histoplasmosis with XSEDE resources," Proc. of the Conference on Extreme Science and Engineering Discovery Environment: Gateway to Discovery. ACM, p. 5, 2013.
  3. BRIAN COUGER, M., et al., "Enabling large-scale next-generation sequence assembly with Blacklight," Concurrency and Computation: Practice and Experience, 2014.
  4. EVANGELINOS, Constantinos; HILL, C., "Cloud computing for parallel scientific hpc applications: Feasibility of running coupled atmosphere-ocean climate models on amazon's ec2," ratio, 2.2.40: 2.34, 2008.
  5. SOUNDARARAJAN, Vijayaraghavan; ANDERSON, Jennifer M., "The impact of management operations on the virtualized datacenter, In: ACM SIGARCH Computer Architecture News," ACM, pp. 326-337, 2010.
  6. YU, Lei, et al., "SNPdisk: an efficient para-virtualization snapshot mechanism for virtual disks in private clouds," Network, IEEE, 25.4: 20-26, 2011.
  7. SATRAN, Julian; METH, Kalman, "Internet small computer systems interface (iSCSI)," 2004.
  8. MILOJICIC, Dejan; LLORENTE, Ignacio M.; MONTERO, Ruben S. Opennebula: A cloud management tool. IEEE Internet Computing, 15.2: 0011-14, 2011.
  9. KATCHER, Jeffrey, "Postmark: A new file system benchmark. Technical Report TR3022," Network Appliance, 1997. www. netapp.com/tech_library/3022.html, 1997.
  10. NORCOTT, William D., CAPPS, Don, "Iozone filesystem benchmark," URL: www. iozone. org, 2003, 55.