• 제목/요약/키워드: Graphics Processing Unit(GPU)

검색결과 154건 처리시간 0.027초

실시간 탄도 궤적 목표물 추적을 위한 GPU 기반 병렬적 입자군집최적화 기법 (Parallelized Particle Swarm Optimization with GPU for Real-Time Ballistic Target Tracking)

  • 한윤호;이헌철;권혁훈;최원석;정보라
    • 대한임베디드공학회논문지
    • /
    • 제17권6호
    • /
    • pp.355-365
    • /
    • 2022
  • This paper addresses the problem of real-time tracking a high-speed ballistic target. Particle filters can be considered to overcome the nonlinearity in motion and measurement models in the ballistic target. However, it is difficult to apply particle filters to real-time systems because particle filters generally require much computation time. This paper proposes an accelerated particle filter using graphics processing unit (GPU) for real-time ballistic target tracking. The real-time performance of the proposed method was tested and analyzed on a widely-used embedded system. The comparison results with the conventional particle filter on CPU (central processing unit) showed that the proposed method improved the real-time performance by reducing computation time significantly.

GPGPU에 의한 음장의 가시화에 관한 연구 (A study on the visualization of the sound field by using GPGPU)

  • 이채봉
    • 한국전자통신학회논문지
    • /
    • 제5권5호
    • /
    • pp.421-427
    • /
    • 2010
  • 본 연구에서는 음파전달의 가시화를 위해 고속 연산장치인 GPU(Graphics Processing Unit)를 이용하여 실시간 처리를 하였으며 이산 호이겐스 모델법을 사용하여 시뮬레이션 하였다. 실시간 처리와 2차원 가상 음장내의 반사물이나 음원의 상태를 변경하여 실재 음장과 같은 음파전달의 가시화를 하였다. 그 결과, 음파가 반사물에 의해 반사되는 형태나 반사물에서 회절하는 형태가 확인되었다.

GPU를 공유하는 컨테이너 기반 클라우드 환경에서 다수의 사용자를 위한 원격 VR 서비스의 성능 관리 기법 (Performance Management Technique of Remote VR Service for Multiple Users in Container-Based Cloud Environments Sharing GPU)

  • 강지훈
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권1호
    • /
    • pp.9-22
    • /
    • 2022
  • VR(Virtual Reality) 기술은 사용자에게 컴퓨터 그래픽으로 구성된 가상 세계를 보여줌으로써 다양한 시청각 기반 응용에 적극적으로 활용되는 인터페이스 기술이다. VR 기반 응용은 그래픽 처리 기반 응용이기 때문에 그래픽 처리를 위해 GPU(Graphics Processing Unit)가 장착된 고가의 컴퓨팅 장치가 필수적으로 요구된다. 이는 VR 응용 사용자에게 컴퓨팅 장치의 유지, 관리에 대한 비용 부담을 발생시키며, 이를 해결하는 방법의 하나로써 서비스를 클라우드 환경에서 운용하는 방법이 사용되고 있다. 본 논문에서는 다수의 컨테이너가 VR 응용을 실행하기 위해 GPU를 공유하는 컨테이너 기반 고성능 클라우드 환경에서 GPU 자원 경쟁으로 인해 발생하는 컨테이너 사이의 성능 간섭 문제를 해결하기 위한 성능 관리 기법을 제안한다. 제안하는 기법은 성능 간섭으로 인한 성능 편차를 감소시켜 사용자에게 균일한 성능의 클라우드 기반 원격 VR 서비스를 제공할 수 있도록 지원한다. 또한, 본 논문에서는 실험을 통해 제안하는 기법의 효율성을 검증한다.

주행로봇을 위한 GPU 기반의 고속 인공표식 인식 (GPU based Fast Recognition of Artificial Landmark for Mobile Robot)

  • 권오성;김영균;조영완;서기성
    • 한국지능시스템학회논문지
    • /
    • 제20권5호
    • /
    • pp.688-693
    • /
    • 2010
  • 주행 로봇 환경에서 비전 기반의 물체 인식은 물체의 주변 요소와 동적인 환경에 대한 다양한 영상처리 문제를 포함한다. SURF(Speeded Up Robust Features)는 영상의 크기와 회전변화에 강인하게 물체를 인식하는 알고리즘으로 많은 연구자에 의해 사용되고 있다. 하지만 SURF 기반의 영상처리 방법은 고차원의 벡터 성분을 사용하기 때문에 연산 과정에서 많은 시간을 소비하며, 그로 인해 실시간 시스템에서 수행의 어려움을 가지고 있다. 본 연구에서는 이러한 문제점을 해결하기 위해서, 연산량이 많은 SURF 처리 과정을 GPU(Graphics Processing Unit)에서 수행하도록 하여, 보다 빠른 영상 인식을 구현하고자 한다. NVIDIA의 CUDA 라이브러리를 이용하여 GPU 상의 수행 프로그램을 구현하고, 실험을 통해 이동 로봇의 속도와 영상의 크기변화에 따른 표식의 인식률 및 수행시간에 대해서 CPU와 성능을 비교한다.

블렌딩 곡면의 GPU 기반 렌더링 (GPU-based Rendering of Blending Surfaces)

  • 고대현
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제13권1호
    • /
    • pp.1-6
    • /
    • 2007
  • 곡면은 다각형 메쉬에 비해 간결한 표현을 가지고 부드러운 형상을 표현할 수 있지만, 현재 그래픽스 하드웨어는 곡면 렌더링을 지원하고 있지 않다. 최근의 GPU를 이용하여 프로그래밍 가능한 그래픽스 파이프라인은 기존의 다양한 그래픽스 알고리즘들을 가속화시키는 데 이용될 수 있기 때문에, 이 논문에서는 GPU 하드웨어를 이용하여 블렌딩을 기반으로 생성된 임의의 위상을 가진 곡면을 빠르게 렌더링 하는 방법을 제시한다. 제어 메쉬상에서 샘플링된 매개변수와 지역 곡면을 표현하는 정보들을 그래픽스 파이프라인으로 전달하여, 정점 프로세서에서 이러한 정보들을 가지고 블렌딩된 곡면상의 위치 정보와 노말 벡터를 계산한다. 이러한 방법은 CPU에서 블렌딩 곡면을 계산하는 것보다 훨씬 빠르게 수행된다.

  • PDF

GPGPU를 이용한 Grabcut의 수행 속도 개선 방법에 관한 연구 (A Study of How to Improve Execution Speed of Grabcut Using GPGPU)

  • 김지훈;박영수;이상훈
    • 디지털융복합연구
    • /
    • 제12권11호
    • /
    • pp.379-386
    • /
    • 2014
  • 본 논문에서는 Grabcut 알고리즘의 수행 속도를 효율적으로 개선시키기 위하여 GPU(Graphics Processing Unit)에서 데이터를 처리하는 방법을 제안한다. Grabcut 알고리즘은 뛰어난 성능의 객체 추출 알고리즘으로 기존의 Grabcut 알고리즘은 전경 영역과 배경 영역을 분할한 후 배경 K-클러스터와 전경 K-클러스터로 할당한다. 그리고 할당 된 결과를 점진적으로 개선될 때까지의 과정을 반복한다. 하지만 Grabcut 알고리즘은 반복된 클러스터링 작업으로 인하여 수행 시간이 오래 걸리는 단점이 존재한다. 따라서 GPGPU(General-Purpose computing on Graphics Processing Unit)를 이용해 반복되는 작업을 병렬적으로 처리하여 Grabcut 알고리즘의 수행 속도를 효율적으로 개선시키는 방법을 제안한다. 제안하는 방법으로 Grabcut 알고리즘의 수행시간을 평균 약 90.668% 감소시켰다.

Benchmark Results of a Radio Spectrometer Based on Graphics Processing Unit

  • Kim, Jongsoo;Wagner, Jan
    • 천문학회보
    • /
    • 제40권2호
    • /
    • pp.44.1-44.1
    • /
    • 2015
  • We set up a project to make spectrometers for single dish observations of the Korean VLBI Network (KVN), a new future multi-beam receiver of the ASTE (Atacama Submillimeter Telescope Experiment), and the total power (TP) antennas of the Atacama Large Millimeter/submillimeter Array (ALMA). Traditionally, spectrometers based on ASIC (Application-Specific Integrated circuit) and FPGA (Field-Programmable Gate Array) have been used in radio astronomy. It is, however, that a Graphics Processing Unit (GPU) technology is now viable for spectrometers due to the rapid improvement of its performance. A high-resolution spectrometer should have the following functions: poly-phase filter, data-bit conversion, fast Fourier transform, and complex multiplication. We wrote a program based on CUDA (Compute Unified Device Architecture) for a GPU spectrometer. We measured its performance using two GPU cards, Titan X and K40m, from NVIDIA. A non-optimized GPU code can process a data stream of around 2 GHz bandwidth, which is enough for the KVN spectrometer and promising for the ASTE and ALMA TP spectrometers.

  • PDF

RPC 기반 GPU 가상화 환경에서 가상머신의 GPGPU 작업 성능 향상을 위한 GPU 메모리 관리 기법 (GPU Memory Management Technique to Improve the Performance of GPGPU Task of Virtual Machines in RPC-Based GPU Virtualization Environments)

  • 강지훈
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권5호
    • /
    • pp.123-136
    • /
    • 2021
  • RPC(Remote Procedure Call) 기반 GPU(Graphics Processing Unit) 가상화 기술은 다수의 사용자 가상머신에게 GPU를 공유하기 위한 기술 중 하나이다. 하지만 클라우드 환경에서 일반적인 GPU는 CPU나 메모리와는 다르게 가상머신의 자원 사용량을 제한할 수 있는 자원 격리(Isolation) 기술을 제공하지 않는다. 특히 RPC 기반 가상화 환경에서는 각 가상머신에서 실행되는 GPU 작업은 멀티 프로세스 형태로 수행되기 때문에 자원격리 기술의 부재는 자원 경쟁으로 인한 성능 저하 문제를 발생시킨다. 그리고 GPU 메모리 경쟁은 가상머신들의 자원 요구량이 많을수록 성능저하를 가속화하고 가상머신 사이의 균등한 성능을 보장하지 못하기 때문에 공평성이 저하되는 문제를 발생시킨다. 본 논문에서는 RPC 기반 GPU 가상화 환경에서 사용자 가상머신들의 GPU 메모리 요구량이 가용 GPU 메모리 용량을 초과했을 때 발생하는 자원 경쟁으로 인한 성능 저하 문제 분석하고 이를 해결하기 위한 GPU 메모리 관리 기법을 제안한다. 또한, 실험을 통해 본 논문에서 제안한 GPU 메모리 관리 기법이 GPGPU 작업의 성능을 향상시킬 수 있다는 것을 보여준다.

GPU를 이용한 DWT 및 JPEG2000의 고속 연산 (Fast Computation of DWT and JPEG2000 using GPU)

  • 이만희;박인규;원석진;조성대
    • 대한전자공학회논문지SP
    • /
    • 제44권6호
    • /
    • pp.9-15
    • /
    • 2007
  • 본 논문에서는 GPU (Graphics Processing Unit)를 이용하여 JPEG2000 정지영상 압축 알고리즘의 DWT (Discrete Wavelet Transform) 연산을 고속으로 수행하기 위한 효율적인 구조와 방법을 제안한다. DWT 연산은 JPEG2000에서 EBCOT (embedded block coding with optimized truncation)과 더불어 많은 계산 량을 소모하는 부분이기 때문에, 본 논문에서는 DWT 알고리즘을 GPU의 화소 쉐이더에서 고속으로 수행하기 위하여 Render-To-Texture (RTT)를 활용한 구조를 설계하였다. 실제 구현을 통해 비슷한 등급의 CPU에서의 처리에 비해 DWT 자체는 10배 이상의 수행 속도의 향상을, 기존의 JPEG2000 참조 소프트웨어인 JasPer의 DWT를 대치하였을 때 2$\sim$16배의 수행 속도의 향상을 보였으며 해상도가 증가할수록 향상 폭이 크다. 본 논문에서 제시된 프레임 버퍼 객체(Frame Buffer Object)를 이용한 render-to-texture 수행 구조는 GPU 기반 영상처리의 기본 틀을 제공하며, 이를 응용하여 일반적인 영상처리와 컴퓨터 비전 처리를 GPU 상에서 고속 수행할 수 있다.

A Tool for On-the-fly Repairing of Atomicity Violation in GPU Program Execution

  • Lee, Keonpyo;Lee, Seongjin;Jun, Yong-Kee
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권9호
    • /
    • pp.1-12
    • /
    • 2021
  • 본 논문은 GPU 프로그램의 메모리의 상태 및 접근사건과 배리어 위치 정보를 감시하고, 실제 메모리 쓰기를 배리어 영역 종료 직전에 발생시키거나 배리어 영역을 재수행시켜 원자성 위배를 수행 중에 수리하는 도구인 ARCAV (Atomatic Recovery of CUDA Atomicity violation)를 제시한다. 기존의 연구들은 Lock과 Sleep 명령어를 사용하여 원자성 위배를 진단 및 수리하도록 구현되었기 때문에 지원되는 명령어와 동기화 기법이 CPU (Central Processing Unit) 프로그램과 다른 GPU (Graphics Processing Unit) 프로그램에는 적용될 수 없었고, GPU 프로그램에서는 원자성 위배의 탐지에 대한 연구만 수행되었다. 제안하는 ARCAV는 GPU 프로그램의 실행모델에서 수행될 수 있도록 설계되어 스레드 구성과 메모리 계층에 무관하게 실세계에서 발생한 원자성 위배를 대표하는 네 가지 패턴의 원자성 위배를 실시간으로 탐지하고 수리할 수 있다. 실험 결과 동시에 실행되는 스레드 개수와 구성에 무관하게 일정한 오버헤드를 보였다. 원자성 위배를 프로그램 수행 중에 실시간으로 탐지하고 수리하기 위해 소요되는 오버헤드는 네 개의 실세계 GPU 커널에서 실험되었고, 원본 프로그램 대비 평균 2.1배의 수행시간으로 동작하였다.