DOI QR코드

DOI QR Code

A Study on a Declines in Performance by Memory Copy in CUDA

CUDA의 메모리 복사로 인한 성능 저하 연구

  • Kang, Jihun (Dept. of Computer Science Education, Korea University) ;
  • Lee, DaeWon (Seokyeong University) ;
  • Kang, InSung (Dept. of Computer Science Education, Korea University) ;
  • Yu, HeonChang (Dept. of Computer Science Education, Korea University)
  • 강지훈 (고려대학교 컴퓨터교육학과) ;
  • 이대원 (서경대학교) ;
  • 강인성 (고려대학교 컴퓨터교육학과) ;
  • 유헌창 (고려대학교 컴퓨터교육학과)
  • Published : 2013.11.08

Abstract

GPGPU(General Purpose Graphics Processing Unit) 병렬처리 시스템인 CUDA(Compute Unified Device Architecture)는 컴퓨터에서의 고속 연산 처리를 위해 많이 사용되어왔다. CUDA에서 연산 처리를 하기 위해서는 CUDA의 특성을 이해해야 한다. CUDA는 CPU(Central Processing Unit)가 처리하는 Host 영역과 GPU(Graphics Processing Unit)가 처리하는 영역인 Device 영역이 존재하며, 이 두 영역간의 데이터 복사를 통해 연산 처리를 진행한다. 이런 구조적인 특성상 메인 메모리에서 GPU 메모리로 입력 데이터를 전달해야 GPU를 이용해 연산을 처리할 수 있는 구조를 가지고 있다. 하지만 이러한 처리 구조로 인해 연산 시간과 별도로 메인 메모리와 GPU 메모리간의 데이터 복사시간이 존재하며, 추가적으로 발생하는 메모리 복사 시간으로 인해 오버헤드가 발생하게 된다. 본 논문에서는 실험을 통해 메모리 복사 시간, 연산의 반복 횟수 그리고 연산의 복잡성이 전체 성능에 어떤 영향을 미치는지 논하고자 한다.

Keywords