Efficient Schemes for Enhancing Performance of Disk I/O in Ring based NUMA Systems

링 구조 NUMA 시스템에서 디스크 입출력의 성능 향상을 위한 효율적인 방안

  • 김철홍 (서울대학교 컴퓨터공학부) ;
  • 김명주 (서울여자대학교 정보통신공학부) ;
  • 장성태 (수원대학교 전자계산학과) ;
  • 엄성용 (서울여자대학교 정보통신공학부) ;
  • 전주식 (서울대학교 컴퓨터공학부)
  • Published : 2001.04.01

Abstract

NUMA 구조 다중 프로세서 시스템에서는 상호 연결망으로서의 버스의 제약을 극복하기 위해 지점간 링크를 이용한 링 구조가 제안되었다. 링 구조 NUMA 시스템에서, 전송이 페이지 단위(2K 바이트 이상)로 이루어지는 디스크 입출력 요구는 지점간 링크에 대한 오랜 접근을 요구하여 지점간 링크의 트래픽을 증가시키는 원인으로 작용한다. 본 논문에서는 지점간 링크의 트래픽을 줄이기 위한 방안으로 입출력 전용 채널을 사용하는 세 가지 디스크 입출력 구조를 제시한다. 제시되는 디스크 입출력 구조를 사용하는 시스템은 디스크 입출력 요구로 인한 지점간 링크의 접근을 없앰으로써 기존 시스템에 비해 트랜잭션의 수행시간을 줄일 수 있다는 장점이 있다. 중앙집중형, 병렬형, 분산형의 세 가지 디스크 입출력 구조를 설계하기 위한 고려 사항과 구현 비용 등을 생각해 본 후, 노드수, 원격 디스크 접근 확률, 디스크 입출력 전송 데이터 크기 등을 달리한 여러 시스템 환경에서의 각 구조의 성능을 비교, 분석해 본다.

Keywords

References

  1. Kai Hwang and Zhiwei Xu, 'Scalable parallel Computing : Technology, Architecture, Programming,' McGraw-Hill, 1998
  2. Per Stenstrom, Truman Joe and Anoop Gupta, 'Comparative Performance Evaluation of Cache Coherent NUMA and COMA Architectures,' In the 19th Int'l Symp. on Computer Architecture, pp 80-91, 1992 https://doi.org/10.1145/139669.139705
  3. Daniel Lenoski, Anoop Gupta et. 'The Stanford Dash Multiprocessor,' IEEE Computer, Mar 1992 https://doi.org/10.1109/2.121510
  4. Zhang, Z. and J. Torrellas, 'Reducing Remote Conflict Misses : NUMA with Remote cache versus COMA,' In Proc. of the 3rd IEEE Symp. on High Performance Computer Architecture(HPCA-3), pp 272-281, Feb 1997 https://doi.org/10.1109/HPCA.1997.569686
  5. J.L. Hennessy and D.A. Patterson, 'Computer Architecture : A Quantitative Approach,' Second Edition, Morgan Kaufmann Publishers, 1996
  6. 김형호, '지점간 링크를 이용한 스누핑 버스의 설계 및 성능 분석', 서울대학교 석사학위 논문, 1996
  7. Sung Woo Chung, Seong Tae Jhang AND Chu Shik Jhon, 'PANDA : Ring-Based Multiprocessor System using New Snooping Protocol,' In the Proceeding of ICPADS'98, PP 10-17, Dec 1998 https://doi.org/10.1109/ICPADS.1998.741012
  8. 장병순, 'PANDA 시스템에서 링 대역폭 확장을 위한 효율적인 방안', 서울대학교 석사학위논문, 1999
  9. N. M. Aboulenein, S. Gjessing, J. R. Goodman and P. J. Woest, 'Hardware support for synchronization in the scalable coherent interface(SCI),' Technical Report CS-TR-92-1117, U of Wisconsin-Madison, Nov 1992
  10. L. Barroso and M. Dubois, 'The Performance of Cache-Coherent Ring-based Multiprocessors,' In Proceedings of the 20th Int'l Symp. on Computer Architecture, pp.268-277, May 1993
  11. Roy Clark, 'SCI Interconnect Chipset and Adapter : Building Large Scale Enterprise Servers with Pentium II Xeon SHV Nodes,' Jan 1999
  12. Chia Chao, Robert English, David Jacobson, Bart Sears, Alexander Stepanov, and John Wilkes, 'DataMesh architecture 1.0,' HP Laboratories Technical Report, Jun 1992
  13. 'SES/Workbench Technical Reference, Scientific and Engineering Software,' 1995
  14. 'Transaction Processing Performance Council, Overview of the TPC Benchmark A,' In http://www.tpc.org/adetail.html
  15. Chris Ruemmler, John Wilkes, 'An Introduction to Disk Drive Modeling,' IEEE Computer, Mar 1994 https://doi.org/10.1109/2.268881