DOI QR코드

DOI QR Code

멀티쓰레드 워크로드를 위한 DVFS 기반 메모리 경합 인지 스케줄링 기법

DVFS based Memory-Contention Aware Scheduling Method for Multi-threaded Workloads

  • 남윤성 (서울대학교 컴퓨터공학과) ;
  • 강민규 (서울대학교 컴퓨터공학과) ;
  • 염헌영 (서울대학교 컴퓨터공학과) ;
  • 엄현상 (서울대학교 컴퓨터공학과)
  • 투고 : 2017.07.25
  • 심사 : 2017.11.14
  • 발행 : 2018.01.15

초록

비용절감을 위해 제한된 서버 워크로드를 통합하는 것은 데이터센터의 효율성에 중요하다. 하지만 더 많은 워크로드가 하나의 서버에 통합되면서, 워크로드들의 성능이 제한된 공유 자원에 대한 경합으로 인해 감소될 수 있다. 이러한 성능감소를 줄이기 위해서 공유자원에 대한 경합을 줄이는 스케줄이 필요하다. 본 논문에서는 이러한 공유자원, 특히 메모리 서브시스템에 대해서 경합을 줄일 수 있는 DVFS(Dynamic Voltage Frequency Scaling) 기반의 메모리 인지 쓰레드 스케줄링 방법을 제안한다. 제안한 알고리즘은 메모리 자원에 대한 경합을 줄이기 위해서, 메모리 자원에 대한 접근을 제한하는 방식으로 두 가지 방법을 사용한다. 메모리 인텐시브 쓰레드를 제한된 코어에서 수행하고, 메모리 인텐시브 쓰레드가 수행되는 코어의 주파수를 낮추어 경합을 완화한다. 제안한 알고리즘을 적용하여 쓰레드 스케줄링 시, 리눅스의 CFS(Completely Fair Scheduler) 대비 최대 43%의 성능향상을 이루고 파워소모를 38% 줄일 수 있었다.

The task of consolidating server workloads is critical for the efficiency of a datacenter in terms of reducing costs. However, as a greater number of workloads are consolidated in a single server, the performance of workloads might be degraded due to their contention to the limited shared resources. To reduce the performance degradation, scheduling for mitigating the contention of shared resources is necessary. In this paper, we present the Dynamic Voltage Frequency Scaling (DVFS) based memory-contention aware scheduling method for multi-threaded workloads. The proposed method uses two approaches: running memory-intensive threads on the limited cores to avoid concurrent memory accesses, and reducing the frequencies of the cores that run memory-intensive threads. With the proposed algorithm, we increased performance by 43% and reduced power consumption by 38% compared to the Completely Fair Scheduler(CFS), the default scheduler of Linux.

키워드

과제정보

연구 과제 주관 기관 : 정보통신기술진흥센터, 한국연구재단

참고문헌

  1. Jason Mars, Lingjia Tang, Robert Hundt, Kevin Skadron, and Mary Lou Soffa., "Bubble-Up: increasing utilization in modern warehouse scale computers via sensible co-locations," Proc. of the 44th Annual IEEE/ACM International Symposium on Microarchitecture, pp. 248-259, 2013.
  2. Boris Teabe, Alain Tchana, and Daniel Hagimont. "Application-specific quantum for multi-core platform scheduler" Proc. of the 11th European Conference on Computer Systems, Article No. 3, 2016.
  3. Seo, Dongyou, Hyeonsang Eom, and Heon Y.Yeom. "MLB: a memory-aware load balancing for mitigating memory contention," Conference on Timely Results in Operating Systems, pp. 2-2, 2014.
  4. Christian Bienia, Sanjeev Kumar, Jaswinder Pal Singh, and Kai Li, "The PARSEC benchmark suite: characterization and architectural implications," Proc. of the 17th International Conference on Parallel Architectures and Compilation Techniques, pp. 72-81, 2008.
  5. Shuai Che, Michael Boyer, Jiayuan Meng, David Tarjan, Jeremy W. Sheaffer, Sang-Ha Lee, and Kevin Skadron, "Rodinia: A benchmark suite for heterogeneous computing," Proc. of the 2009 IEEE International Symposium on Workload Characterization, pp. 44-54, 2009.