• 제목/요약/키워드: Graphics Processing Unit(GPU)

검색결과 153건 처리시간 0.027초

접근물체 선별 알고리즘 계산 효율성 향상 연구 (A study on the Computational Efficiency Improvement for the Conjunction Screening Algorithm)

  • 김형진;김해동;성재동
    • 한국항공우주학회지
    • /
    • 제40권9호
    • /
    • pp.818-826
    • /
    • 2012
  • 본 논문에서는 우주파편 충돌위험 분석 과정에 1차적으로 필요한 접근물체 선별 알고리즘의 계산 효율성 향상 방법을 제시하였다. 첫 번째 방법은 높은 연산 능력을 바탕으로 대량의 데이터를 빠르게 처리할 수 있는 GPU(Graphics Processing Unit)를 이용하는 것이고, 두 번째 방법은 접근 가능성이 없는 물체들을 최소 근접거리 계산 과정에서 제외하여 계산 수행 시간을 단축할 수 있는 원/근지점 필터(Apogee/Perigee filter)를 이용하는 것이며, 세 번째 방법은 앞서 언급한 두 가지 방법을 결합하여 이용하는 것이다. GPU만 적용하였을 경우 평균 34 배 정도 계산 효율성이 향상되었고, 원/근지점 필터만 적용하였을 때는 평균 3 배 정도 계산 효율성이 향상되었다. 마지막으로 GPU와 원/근지점 필터를 함께 적용하였을 때는 약 163 배 정도 계산 효율성이 향상됨을 확인할 수 있었다.

GPU 컨테이너 동시 실행에 따른 응용의 간섭 측정 프레임워크 설계 (A design of GPU container co-execution framework measuring interference among applications)

  • 김세진;김윤희
    • KNOM Review
    • /
    • 제23권1호
    • /
    • pp.43-50
    • /
    • 2020
  • 범용 그래픽 처리 장치(General Purpose Graphics Processing Unit, GPGPU)는 최근 고성능 컴퓨팅에서 중요한 역할을 함으로써, 여러 클라우드 서비스 공급업체들은 GPU 서비스를 제공하기 시작했다. 컨테이너를 사용하는 클라우드 환경에서 대부분의 클러스터 오케스트레이션 플랫폼은 정수 개의 GPU를 작업에 할당하고 다른 작업과 이를 공유하는 것을 허용하지 않는다. 이 경우 작업이 GPU에서 코어 및 메모리 등 자원이 집중적으로 필요하지 않다면 GPU 노드의 리소스 사용률이 저하될 수 있다. GPU 가상화는 응용의 동시 수행을 가능하게 하며 자원을 공유할 수 있는 기회를 제공한다. 하지만 응용의 동시 수행 성능은 동시 수행되는 응용의 특성과 노드 안에서 자원 경쟁으로 인한 간섭에 따라 달라질 수 있다. 본 논문은 컨테이너 오케스트레이션 플랫폼인 쿠버네티스(Kubernetes)를 기반으로 다중 서버 생성 및 실행을 통하여 GPU를 공유함으로써 발생할 수 있는 간섭을 측정하기 위한 프레임워크를 제안한다. 본 프레임워크를 통해 다양한 스케줄링 방법으로 GPU에서 여러 작업을 실행함으로써 이에 따른 성능 변화를 조사하였으며, 이를 통해 GPU 메모리 사용량 및 컴퓨팅 리소스만 고려해서는 최적의 스케줄링을 할 수 없음을 보인다. 마지막으로 해당 프레임워크를 사용하여 응용들의 동시 실행에 따라 발생한 간섭을 측정한다.

GPU를 이용한 신경망 구현 (Implementation of Neural Networks using GPU)

  • 오경수;정기철
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.735-742
    • /
    • 2004
  • 본 논문은 일반적인 그래픽스 하드웨어를 이용하여 더욱 빠른 신경망을 구현하고, 구현된 시스템을 영상 처리 분야에 적용함으로써 효용성을 검증한다. GPU의 병렬성을 효율적으로 사용하기 위하여, 다수의 입력벡터와 연결가중치벡터를 모아서 많은 내적연산을 하나의 행렬곱 연산으로 대체하였고, 시그모이드와 바이어스 항 덧셈 연산도 GPV 상에서 픽셀세이더로 구현하였다. ATI RADEON 9800 XT 보드를 이용하여 구현된 신경망 시스템은 CPU를 사용한 기존의 시스템과 비교하여 정확도의 차이 없이 30배 정도의 속도 향상을 얻을 수 있었다.

GPU 기반의 실시간 인터렉티브 광선추적법 구현 (Implementation of Real-time Interactive Ray Tracing on GPU)

  • 배성민;홍현기
    • 한국게임학회 논문지
    • /
    • 제7권3호
    • /
    • pp.59-66
    • /
    • 2007
  • 광선추적법(ray tracing)은 빛의 반사, 투과 등을 사실적으로 표현할 수 있는 대표적인 전역조명(global illumination) 기술이지만, 복잡한 계산과정으로 인해 실시간 활용에는 많은 제약이 존재한다. 이런 문제를 해결하기 위해 최근에는 GPU(Graphics Processing Unit) 기반의 광선추적법 알고리즘이 활발하게 개발되고 있으며, 본 논문에서는 J. Purcell 등이 제안한 광선추적법 기법을 구현하였다. 그리고 구현된 알고리즘을 인터렉티브 응용분야에 활용하기 위해 렌더링 성능을 개선하는 두가지 방법을 적용하였다. 먼저, 그래픽스 하드웨어에서 지원하는 래스터라이제이션(rasterization)을 적용해 초기 광선의 교차점을 효과적으로 구했다. 또한 대상 물체를 가속화(acceleration) 구조로 구성하여 광선과 물체간의 교차연산에 소요되는 계산시간을 단축하였다. GPU 기반의 광선추적법 렌더링에서 다양한 성능 개선 알고리즘을 적용하여 향상된 렌더링 결과를 구체적으로 분석한 기존 연구가 비교적 적었으며, 본 논문에서는 각 과정에 따른 개선 결과를 제시하였다. 구현된 렌더러와 GPU 기반의 환경 맵을 비교하였으며 이동형 개인 컴퓨터와 무선 센싱 장비를 이용한 무선 원격 렌더링 시스템을 구현하였다. 제안된 시스템은 실시간 합성, 증강현실(augmented reality), 가상현실 등의 다양한 분야에서 활용될 것으로 기대된다.

  • PDF

매니코어 프로세서를 이용한 SIFT 알고리즘 병렬구현 및 성능분석 (Parallel Implementation and Performance Evaluation of the SIFT Algorithm Using a Many-Core Processor)

  • 김재영;손동구;김종면;전희성
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.1-10
    • /
    • 2013
  • 본 논문에서는 대표적인 특징점 추출 알고리즘인 SIFT(Scale-Invariant Feature Transform)를 매니코어 프로세서를 이용하여 병렬 구현하고, 이를 실행 시간, 시스템 이용률, 에너지 효율 및 시스템 면적 효율 측면에서 분석하였다. 또한 기존의 고성능 CPU와 GPU(Graphics Processing Unit)와의 성능 비교를 통해 제안하는 매니코어의 잠재가능성을 입증하였다. 모의실험 결과, 매니코어를 이용한 SIFT 알고리즘 구현 결과는 기존의 OpenCV 구현 결과와 정확도면에서 동일하였고, 매니코어 구현은 고성능 CPU 및 GPU 구현보다 실행시간 측면에서 우수하였다. 또한 본 논문에서는 SIFT알고리즘의 옥타브 크기에 따른 에너지 효율 및 시스템 면적 효율을 분석하여 최적의 모델을 제시하였다.

GPU를 이용한 효율적인 비압축성 자유표면유동 해석 (AN EFFICIENT INCOMPRESSIBLE FREE SURFACE FLOW SIMULATION USING GPU)

  • 홍환의;안형택;명훈주
    • 한국전산유체공학회지
    • /
    • 제17권2호
    • /
    • pp.35-41
    • /
    • 2012
  • This paper presents incompressible Navier-Stokes solution algorithm for 2D Free-surface flow problems on the Cartesian mesh, which was implemented to run on Graphics Processing Units(GPU). The INS solver utilizes the variable arrangement on the Cartesian mesh, Finite Volume discretization along Constrained Interpolation Profile-Conservative Semi-Lagrangian(CIP-CSL). Solution procedure of incompressible Navier-Stokes equations for free-surface flow takes considerable amount of computation time and memory space even in modern multi-core computing architecture based on Central Processing Units(CPUs). By the recent development of computer architecture technology, Graphics Processing Unit(GPU)'s scientific computing performance outperforms that of CPU's. This paper focus on the utilization of GPU's high performance computing capability, and presents an efficient solution algorithm for free surface flow simulation. The performance of the GPU implementations with double precision accuracy is compared to that of the CPU code using an representative free-surface flow problem, namely. dam-break problem.

GPU를 이용한 다양한 해상도의 비디오기반 실시간 화재감지 방법 구현 및 성능평가 (Implementation and Performance Evaluation of a Video-Equipped Real-Time Fire Detection Method at Different Resolutions using a GPU)

  • 손동구;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권1호
    • /
    • pp.1-10
    • /
    • 2015
  • 본 논문에서는 기존에 많이 사용되는 복잡한 4단계 화재 감지 알고리즘의 성능을 향상시키기 위해 그래픽스 처리 장치 (GPU)를 이용한 효율적인 병렬 구현 방법을 제안하였고 성능을 분석하였다. 또한 현재 많이 사용되고 있는 7가지 서로 다른 해상도 (QVGA, VGA, SVGA, XGA, SXGA+, UXGA, QXGA)의 비디오를 입력으로 하여 성능을 분석하였다. 더불어 각 해상도별 GPU 기반 실행시간과 고성능 CPU에서의 실행시간을 비교 분석하였다. 각 해상도의 5가지 화재 및 비 화재 비디오를 이용하여 모의 실험한 결과, GPU는 CPU보다 실행시간에서 우수한 성능을 보이는 동시에 FULL HD급의 높은 해상도인 UXGA 영상에서도 프레임 당 25.11ms의 실행시간이 소요되어 초당 30 프레임의 실시간 처리가 가능함을 보였다.

CPU와 GPU 간의 병목현상 해결에 관한 연구 (A Study of solving the bottleneck between CPU and GPU)

  • 이진호;조한진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.3-4
    • /
    • 2020
  • 본 논문에서는 컴퓨팅 시스템에서 발생 할 수 있는, CPU와 GPU 간의 병목현상을 개선방안으로 통신 방식에 대해 비교 분석하였다. CPU와 GPU 간에 발생할 수 있는 병목현상의 해결방법으로, 두 구성 요소 간의 성능 구성 외의 통신방식을 개선 방법으로 PCIe와 NVLink를 비교하고, 성능 극대화 방안을 모색한다. NVLink 연결 방식의 통신 방식을 변경하였을 때 성능을 비교해 봄으로써 병목현상 해소 및 성능 향상에 우수한 결과를 낼 수 있다.

  • PDF

옷감 찢기 시뮬레이션을 표현하는 GPU기반 동적 재메쉬 (GPU-Based Dynamic Remeshing to Simulate Cloth Tearing)

  • 문성혁;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.353-356
    • /
    • 2023
  • 본 논문에서는 GPU 기반으로 옷감을 찢는 데 필요한 동적 재메쉬 기법에 대해서 제안한다. 일반적으로 메쉬를 파괴(Fracture)하거나 찢는 시뮬레이션에서는 안정적인 동역학 계산하는데 있어서 동적 재 메쉬과정에 매우 중요하며 이 과정이 계산양이 가장 크다. 본 논문에서는 GPU 친화적인 동적 메쉬 알고리즘을 새롭게 제안함으로써 옷감 찢기 시뮬레이션을 실시간으로 보여준다.

  • PDF

Analysis of Implementing Mobile Heterogeneous Computing for Image Sequence Processing

  • BAEK, Aram;LEE, Kangwoon;KIM, Jae-Gon;CHOI, Haechul
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권10호
    • /
    • pp.4948-4967
    • /
    • 2017
  • On mobile devices, image sequences are widely used for multimedia applications such as computer vision, video enhancement, and augmented reality. However, the real-time processing of mobile devices is still a challenge because of constraints and demands for higher resolution images. Recently, heterogeneous computing methods that utilize both a central processing unit (CPU) and a graphics processing unit (GPU) have been researched to accelerate the image sequence processing. This paper deals with various optimizing techniques such as parallel processing by the CPU and GPU, distributed processing on the CPU, frame buffer object, and double buffering for parallel and/or distributed tasks. Using the optimizing techniques both individually and combined, several heterogeneous computing structures were implemented and their effectiveness were analyzed. The experimental results show that the heterogeneous computing facilitates executions up to 3.5 times faster than CPU-only processing.