• 제목/요약/키워드: Graphics Processing Units

검색결과 85건 처리시간 0.024초

A Study of the Performance Prediction Models of Mobile Graphics Processing Units

  • Kim, Cheong Ghil
    • 반도체디스플레이기술학회지
    • /
    • 제18권1호
    • /
    • pp.123-128
    • /
    • 2019
  • Currently mobile services are on the verge of full commercialization ahead of 5G mobile communication (5G). The first goal could be to preempt the 5G market through realistic media services utilizing VR (Virtual Reality) and AR (Augmented Reality) technologies that users can most easily experience. Basically this movement is based on the advanced development of smart devices and high quality graphics processing computing power of mobile application processors. Accordingly, the importance of mobile GPUs is emerging and the most concern issue becomes a model for predicting the power and performance for smooth operation of high quality mobile contents. In many cases, the performance of mobile GPUs has been introduced in terms of power consumption of mobile GPUs using dynamic voltage and frequency scaling and throttling functions for power consumption and heat management. This paper introduces several studies of mobile GPU performance prediction model with user-friendly methods not like conventional power centric performance prediction models.

GPU를 이용한 R-tree에서의 범위 질의의 병렬 처리 (Parallel Range Query processing on R-tree with Graphics Processing Units)

  • 유보선;김현덕;최원익;권동섭
    • 한국멀티미디어학회논문지
    • /
    • 제14권5호
    • /
    • pp.669-680
    • /
    • 2011
  • R-tree는 데이터베이스 시스템에서 가장 많이 사용되는 색인 구조로 다차원의 데이터를 관리하는데 매우 효율적이다. 하지만 데이터베이스 시스템이 처리해야 하는 데이터의 용량이 증가함에 따라, 기존의 R-tree에서의 범위 질의의 처리는 디스크의 접근 지연 등의 이유로 인하여 수행 시간이 증가하게 되었다. 이러한 문제들을 해결하기 위하여 버퍼를 사용하거나 혹은 다수의 디스크와 프로세서를 사용하여 병렬로 질의를 수행하고자 하는 많은 연구들이 진행되었다. 이러한 연구들의 일환으로 최근 Graphics Processing Unit(GPU)을 이용한 병렬화 기법들에 대한 연구들이 진행되고 있다. 이러한 GPU의 적용을 통한 병렬화는 계산 속도의 증가와 디스크 접근 횟수의 감소를 통하여 수행 속도의 개선을 가능하게 하지만 GPU와 CPU사이의 메모리 교환 및 GPU 메모리의 접근 지연 등에 의한 오버헤드를 발생시킨다. 본 논문에서는 이러한 오버헤드를 해결하고 효과적으로 GPU를 적용하기 위하여 GPU를 버퍼로 사용하여 범위 질의를 병렬화하는 기법을 제안하였다. 버퍼 알고리즘을 통하여 메모리 교환 횟수를 줄이고, 동시 접근 가능한 메모리의 용량을 증가시켜 메모리의 접근 지연을 최소화 할 수 있었다. 제안 기법과 기존의 인덱스의 비교 실험에서 최대의 경우 5배 정도의 성능이 개선되는 것을 확인 할 수 있었다.

그래픽처리장치를 이용한 레이놀즈 방정식의 수치 해석 가속화 (Accelerating Numerical Analysis of Reynolds Equation Using Graphic Processing Units)

  • 명훈주;강지훈;오광진
    • Tribology and Lubricants
    • /
    • 제28권4호
    • /
    • pp.160-166
    • /
    • 2012
  • This paper presents a Reynolds equation solver for hydrostatic gas bearings, implemented to run on graphics processing units (GPUs). The original analysis code for the central processing unit (CPU) was modified for the GPU by using the compute unified device architecture (CUDA). The red-black Gauss-Seidel (RBGS) algorithm was employed instead of the original Gauss-Seidel algorithm for the iterative pressure solver, because the latter has data dependency between neighboring nodes. The implemented GPU program was tested on the nVidia GTX580 system and compared to the original CPU program on the AMD Llano system. In the iterative pressure calculation, the implemented GPU program showed 20-100 times faster performance than the original CPU codes. Comparison of the wall-clock times including all of pre/post processing codes showed that the GPU codes still delivered 4-12 times faster performance than the CPU code for our target problem.

GPGPU와 Combined Layer를 이용한 필기체 숫자인식 CNN구조 구현 (Implementation of handwritten digit recognition CNN structure using GPGPU and Combined Layer)

  • 이상일;남기훈;정준모
    • 문화기술의 융합
    • /
    • 제3권4호
    • /
    • pp.165-169
    • /
    • 2017
  • CNN(Convolutional Nerual Network)는 기계학습 알고리즘 중에서도 이미지의 인식과 분류에 뛰어난 성능을 보이는 알고리즘 중 하나이다. CNN의 경우 간단하지만 많은 연산량을 가지고 있어 많은 시간이 소요된다. 따라서 본 논문에서는 CNN 수행과정에서 많은 처리시간이 소모되는 convolution layer와 pooling layer, fully connected layer의 연산수행을 SIMT(Single Instruction Multiple Thread)구조의 GPGPU(General-Purpose computing on Graphics Processing Units)를 통하여 병렬로 연산처리를 수행했다. 또한 convolution layer의 출력을 저장하지 않고 pooling layer의 입력으로 바로 사용함으로 메모리 접근횟수를 줄여 성능 향상을 기대했다. 본 논문에서는 이 실험검증을 위하여 MNIST 데이터 셋을 사용하였고 이를 통하여 제안하는 CNN 구조가 기존의 구조보다 12.38% 더 좋은 성능을 보임을 확인했다.

가상환경에서의 실세계 물리적 길이 비교 (Real-World Physical Length Comparison in Virtual Environments)

  • 정철희;임창혁;이민근;이명원
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제13권3호
    • /
    • pp.19-24
    • /
    • 2007
  • 본 논문에서는 가상환경의 물체들을 정확하게 비교하기 위하여 실세계 모든 길이 단위를 이용하여 물체의 길이를 정의하는 방법을 기술한다. 본 연구에서 브라우저는 화면상에 물체를 보여줄 때 모델러가 정의한 물리적 길이 속성을 참조하여 제작자가 원하는 길이로 물체를 표현한다. 서로 다른 모델러에서 제작된 서로 관계없는 물체들이라도 길이 명세를 가지고 있으면 브라우저에 들어 올 때 그에 따라 스케일이 적용되어 정확한 크기 비교가 가능하게 된다. 본 논문에서의 길이 명세는 X3D 명세에 추가하여 정의되었으며 포함되는 길이 단위는 $10^{-24}(yotta)$부터 $10^{24}(yocto)$ 까지이다. 그리고 서로 다른 LOLD(Levels of Length Detail) 속성을 가진 물체를 동시에 불러 올 때의 LOD(Levels of Detail) 처리와 LOLD 속성을 적용하는 방법에 대해 기술한다.

  • PDF

컴퓨터 홀로그램의 생성 및 복원 (Computer Generated Hologram : Recoding and Reconstruction)

  • 양윤모;오병태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.261-263
    • /
    • 2014
  • 최근 영화 <아바타>를 필두로 영화, 방송 등 영상매체에서 다양하게 3 차원 영상기술을 적용하고 있는 추세이다. 본 논문에서는 여러 가지 3 차원 영상 기술 중에서 가장 현실감이 높은 기술인 홀로그래피 (Holography)기술에 대하여 다루고자 한다. 우선 간략하게 홀로그래피 기술에 대하여 소개하고 홀로그램(Hologram)의 기록 및 복원 원리와 컴퓨터를 이용하여 홀로그래피 이미지를 만드는 컴퓨터 홀로그램 (Computer-generated hologram)에 대하여 기술하였으며, 범용 컴퓨터와 GPU(Graphics processing units)통해 컴퓨터 홀로그램 패턴을 기록 및 복원하는 실험을 진행해 보고, 시간 복잡도를 측정, 비교해 본다.

  • PDF

적응순향 제어(ACC) 차량의 제어 알고리즘 및 실시간 수치실험 프로그램 개발 (Development of Control Algorithm and Real Time Numerical Simulation Program for Adaptive Cruise Control Vehicles)

  • 원문철;강연준;강병배
    • 한국자동차공학회논문집
    • /
    • 제7권7호
    • /
    • pp.202-213
    • /
    • 1999
  • Adaptive Cruise Control (ACC) is one of key features on intelligent Transportation System(ITS). In ACC, the steering is done by a driver, but the engine throttle valve and the brake are controlled electronically. The relative velocity and distance from the preceeding vehicle are measured by radars or image processing units and relevant vehicular spacing is maintained in ACC control systems. In this study, vehicle longitudinal dynamics are modeled to simulate vehicle longitudinal maneuver and to design longtitudinal controllers for ACC vehicles. The control algorithm is designed based on the modeled vehicle longitudinal dynamics using a non-linear sliding mode control method. To verity the performance of the control algorithm, a real time numerical simulation program is developed on a Silicon Graphics workstation using C-language . A real time graphic program is alos develpe and integrated with the numerical simulation program.

  • PDF

GPU-based Monte Carlo Photon Migration Algorithm with Path-partition Load Balancing

  • Jeon, Youngjin;Park, Jongha;Hahn, Joonku;Kim, Hwi
    • Current Optics and Photonics
    • /
    • 제5권6호
    • /
    • pp.617-626
    • /
    • 2021
  • A parallel Monte Carlo photon migration algorithm for graphics processing units that implements an improved load-balancing strategy is presented. Conventional parallel Monte Carlo photon migration algorithms suffer from a computational bottleneck due to their reliance on a simple load-balancing strategy that does not take into account the different length of the mean free paths of the photons. In this paper, path-partition load balancing is proposed to eliminate this computational bottleneck based on a mathematical formula that parallelizes the photon path tracing process, which has previously been considered non-parallelizable. The performance of the proposed algorithm is tested using three-dimensional photon migration simulations of a human skin model.

유사가능도 기반의 네트워크 추정 모형에 대한 GPU 병렬화 BCDR 알고리즘 (BCDR algorithm for network estimation based on pseudo-likelihood with parallelization using GPU)

  • 김병수;유동현
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권2호
    • /
    • pp.381-394
    • /
    • 2016
  • 그래피컬 모형은 변수들 사이의 조건부 종속성을 노드와 연결선을 통하여 그래프로 나타낸다. 변수들 사이의 복잡한 연관성을 표현하기 위하여 그래피컬 모형은 물리학, 경제학, 생물학을 포함하여 다양한 분야에 적용되고 있다. 조건부 종속성은 공분산 행렬의 역행렬의 비대각 성분이 0인 것과 대응하는 두 변수의 조건부 독립이 동치임에 기반하여 공분산 행렬의 역행렬로부터 추정될 수 있다. 본 논문은 공분산 행렬의 역행렬을 희박하게 추정하는 유사가능도 기반의 CONCORD (convex correlation selection method) 방법에 대하여 기존의 BCD (block coordinate descent) 알고리즘을 랜덤 치환을 활용한 갱신 규칙과 그래픽 처리 장치 (graphics processing unit)의 병렬 연산을 활용하여 고차원 자료에 대하여 보다 효율적인 BCDR (block coordinate descent with random permutation) 알고리즘을 제안하였다. 두 종류의 네트워크 구조를 고려한 모의실험에서 제안하는 알고리즘의 효율성을 수렴까지의 계산 시간을 비교하여 확인하였다.

인공지능프로세서 기술 동향 (Trends in AI Processor Technology)

  • 이미영;정재훈;이주현;한진호;권영수
    • 전자통신동향분석
    • /
    • 제35권3호
    • /
    • pp.66-75
    • /
    • 2020
  • As the increasing expectations of a practical AI (Artificial Intelligence) service makes AI algorithms more complicated, an efficient processor to process AI algorithms is required. To meet this requirement, processors optimized for parallel processing, such as GPUs (Graphics Processing Units), have been widely employed. However, the GPU has a generalized structure for various applications, so it is not optimized for the AI algorithm. Therefore, research on the development of AI processors optimized for AI algorithm processing has been actively conducted. This paper briefly introduces an AI processor especially for inference acceleration, developed by the Electronics and Telecommunications Research Institute, South Korea., and other global vendors for mobile and server platforms. However, the GPU has a generalized structure for various applications, so it is not optimized for the AI algorithm. Therefore, research on the development of AI processors optimized for AI algorithm processing has been actively conducted.