• 제목/요약/키워드: Mobile GPU

검색결과 56건 처리시간 0.028초

멀티코어형 모바일 GPU의 작업 분배 및 효율성 분석 (Analysis of Job Scheduling and the Efficiency for Multi-core Mobile GPU)

  • 임효정;한동건;김형신
    • 한국산학기술학회논문지
    • /
    • 제15권7호
    • /
    • pp.4545-4553
    • /
    • 2014
  • 모바일 GPU가 발전함에 따라 멀티코어 GPU를 효과적으로 최적화하는 것은 스마트폰의 성능을 높이는데 있어 중요한 문제가 되고 있다. 하지만 대부분의 모바일 GPU에 관한 연구는 싱글코어 모바일 GPU에 대해 다루고 있거나, GPU 공급자에 의한 제한적인 연구만을 다루고 있다. 따라서 본 논문에서는 멀티코어 GPU의 작업 분배 패턴과 효율성 분석을 통해 성능향상의 가능성에 대한 분석을 수행하였다. 실험은 DS-5 Streamline을 사용하여 시스템 사용자 인터페이스를 조작하였을 때, GPU의 코어 수의 변화에 따른 그래픽 처리 소요 시간을 측정한 실험과 GPU의 코어 수에 따른 작업 분배 패턴에 대한 실험을 수행하였다. 프로파일링 결과, GPU의 코어수가 더 증가했음에도 불구하고 그래픽 애플리케이션을 실행하는데 요구되는 전체 소요시간이 증가하는 경우를 발견하였다. 또한 GPU가 그래픽을 처리할 때, 약 4ms의 오버헤드가 CPU와 GPU 사이의 통신에서 발생하고, GPU 내부 드라이버의 활동으로 인한 지연이 발생했음을 확인하였다. 따라서 본 논문에서 GPU 동작의 비효율성에 대한 분석결과는 앞으로의 모바일 멀티코어 GPU의 연구에 있어 참고가 될 수 있을 것이라 예상한다.

모바일 GPU 동향 (Trends of Mobile GPU)

  • 한진호;변경진;엄낙웅
    • 전자통신동향분석
    • /
    • 제28권2호
    • /
    • pp.50-57
    • /
    • 2013
  • 스마트폰 및 태블릿 PC에 들어가는 핵심 부품인 AP(Application Processor)는 모두 GPU(Graphics Processing Unit)를 내장하고 있다. 이는 칩 면적의 제약과 사용 가능한 전력의 한계로 데스크톱의 그래픽 카드에 탑재된 고성능 GPU와는 다른 설계 제약을 받는다. 본고에서는 고성능 GPU와 다른 설계 조건을 갖는 mobile GPU 기술에 대해서 알아보았고 대표적인 commercial mobile GPU인 Imagination, ARM, Qualcomm, NVidia사의 mobile GPU의 특징 및 성능에 대해서 알아보았다.

  • PDF

GPU 기반 SIFT 방법과 가상의 힘을 이용한 이동 로봇의 위치 인식 및 자율 주행 제어 (Localization and Autonomous Navigation Using GPU-based SIFT and Virtual Force for Mobile Robots)

  • 탁명환;주영훈
    • 전기학회논문지
    • /
    • 제65권10호
    • /
    • pp.1738-1745
    • /
    • 2016
  • In this paper, we present localization and autonomous navigation method using GPU(Graphics Processing Unit)-based SIFT(Scale-Invariant Feature Transform) algorithm and virtual force method for mobile robots. To do this, at first, we propose the localization method to recognize the landmark using the GPU-based SIFT algorithm and to update the position using extended Kalman filter. And then, we propose the A-star algorithm for path planning and the virtual force method for autonomous navigation of the mobile robot. Finally, we demonstrate the effectiveness and applicability of the proposed method through some experiments using the mobile robot with OPRoS(Open Platform for Robotic Services).

GP-GPU를 이용한 H.264/AVC 디코더의 IQ/IDCT구현 (Implementation of IQ/IDCT in H.264/AVC Decoder Using GP-GPU)

  • 정준모;이광엽
    • 전기전자학회논문지
    • /
    • 제14권2호
    • /
    • pp.76-81
    • /
    • 2010
  • 모바일 CPU의 성능이 향상됨에 따라 전용 하드웨어의 필요성이 줄어 들고 있다. 그러나 아직까지 모바일 CPU의 성능은 한계가 있다. 이러한 제약 조건을 병렬처리와 실수 연산이 뛰어난 GP-GPU(General-Purpose computing on Graphics Processing Units)를 이용함으로써 다른 전용 하드웨어의 추가 없이 성능을 향상 시킬 수 있다. 본 논문에서는 모바일 환경에 적합하게 설계된 GP-GPU를 이용하여 H.264 디코더의 Inverse Quantization, Inverse DCT, Color Space Conversion 모듈을 구현하였다. G-PGPU를 이용한 전체 시스템 동작 시 40%의 성능 향상이 있었다.

임베디드 GPU에서의 병렬처리를 이용한 모바일 기기에서의 다중뷰 스테레오 정합 (Multiview Stereo Matching on Mobile Devices Using Parallel Processing on Embedded GPU)

  • 전윤배;박인규
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.1064-1071
    • /
    • 2019
  • 다중뷰 스테레오 정합 알고리즘은 시점이 다른 복수의 2차원 영상으로부터 3차원 형상을 복원하기 위해 사용된다. 기존의 다중뷰 스테레오 정합 알고리즘은 단계별로 많은 계산량을 포함하는 복잡한 구조 때문에 고성능 하드웨어에서만 주로 구현되어왔다. 그러나 최근에 모바일 그래픽 프로세서가 발전하면서 충분한 부동소수점 계산 성능이 확보됨에 따라 기존의 PC 환경에서만 수행되었던 복잡한 컴퓨터 비전 알고리즘들이 모바일 GPU에서 구현되고 있다. 본 논문에서는 임베디드 보드의 모바일 GPU에서의 병렬처리를 기반으로 다중뷰 스테레오 알고리즘의 병렬처리를 구현하고 자원이 제한적인 하드웨어에서의 성능 최적화 기법을 제안한다.

안드로이드 폰에서의 모바일 GPU 성능 분석 및 최적화 (Performance Analysis and Optimization of mobile GPU in Android Phone)

  • 조창우;;김신덕
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제48차 하계학술발표논문집 21권2호
    • /
    • pp.1-4
    • /
    • 2013
  • 본 논문에서는 최신 안드로이드 기반 상용 스마트폰의 모바일 GPU 성능 향상을 위한 방법론을 제안한다. 동일 하드웨어를 가지고 스마트폰을 개발하더라도 제조사의 역량에 따라 소프트웨어 최적화의 정도가 달라서 그래픽 성능 차이가 날 수 있다. 그러므로 우리는 시스템 소프트웨어 레벨에서 그래픽 품질에 아무런 영향을 주지 않고 성능 향상을 이끌어낼 수 있는 기법에 대해 소개한다. 이를 위해 A사, B사 안드로이드 스마트폰을 대상으로 안드로이드 커널에 따른 분석을 수행하였고, GPU 디바이스 드라이버에 따른 분석을 수행하였으며, 마지막으로 타사 휴대폰과의 성능 비교를 통해 이 결과를 비교 분석하였다. 결과적으로 GPU 디바이스 드라이버 변경과 안드로이드 커널 변경을 시도함으로써 B사 대비 68%의 성능을 보인 A사 스마트폰의 성능을 96%까지 향상시킬 수 있었다.

  • PDF

저연산량의 효율적인 콘볼루션 신경망 (Efficient Convolutional Neural Network with low Complexity)

  • 이찬호;이중경;호콩안
    • 전기전자학회논문지
    • /
    • 제24권3호
    • /
    • pp.685-690
    • /
    • 2020
  • 휴대용 기기나 에지 단말을 위한 CNN인 MobileNet V2를 기반으로 연산량을 크게 줄이면서도 정확도는 증가시킨 효율적인 인공신경망 네트워크 구조를 제안한다. 제안하는 구조는 Bottleneck 층 구조를 유지하면서 확장 계수를 증가시키고 일부 층을 제거하는 등의 변화를 통해 연산량을 절반 이하로 줄였다. 설계한 네트워크는 ImageNet100 데이터셋을 이용하여 분류 정확도와 CPU 및 GPU에서의 연산 시간을 측정하여 그 성능을 검증 하였다. 또한, 현재 딥러닝 가속기로 널리 이용하는 GPU에서 네트워크 구조에 따라 동작 성능이 달라짐도 보였다.

주행로봇을 위한 GPU 기반의 고속 인공표식 인식 (GPU based Fast Recognition of Artificial Landmark for Mobile Robot)

  • 권오성;김영균;조영완;서기성
    • 한국지능시스템학회논문지
    • /
    • 제20권5호
    • /
    • pp.688-693
    • /
    • 2010
  • 주행 로봇 환경에서 비전 기반의 물체 인식은 물체의 주변 요소와 동적인 환경에 대한 다양한 영상처리 문제를 포함한다. SURF(Speeded Up Robust Features)는 영상의 크기와 회전변화에 강인하게 물체를 인식하는 알고리즘으로 많은 연구자에 의해 사용되고 있다. 하지만 SURF 기반의 영상처리 방법은 고차원의 벡터 성분을 사용하기 때문에 연산 과정에서 많은 시간을 소비하며, 그로 인해 실시간 시스템에서 수행의 어려움을 가지고 있다. 본 연구에서는 이러한 문제점을 해결하기 위해서, 연산량이 많은 SURF 처리 과정을 GPU(Graphics Processing Unit)에서 수행하도록 하여, 보다 빠른 영상 인식을 구현하고자 한다. NVIDIA의 CUDA 라이브러리를 이용하여 GPU 상의 수행 프로그램을 구현하고, 실험을 통해 이동 로봇의 속도와 영상의 크기변화에 따른 표식의 인식률 및 수행시간에 대해서 CPU와 성능을 비교한다.

GPU를 이용한 물 표면 실시간 렌더러 구현 (Realtime Rendering of Water Surface using GPU)

  • 이재성;권덕호;성만규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.1008-1009
    • /
    • 2017
  • 본 연구는 게임을 비롯한 많은 콘텐츠에서 활용하기 위한 GPU기반 사실적 물 애니메이션 기법을 제안한다. 물 표면은 반사 및 투사와 같은 물리적 현상이 일어나며, 시점에 따른 반사와 투사의 정도가 자동적으로 조절되어야 한다. 본 논문에서는 GPU 프레임 버퍼를 이용한 렌더투텍스처 방법을 이용하여 반사 및 투사결과를 텍스처로 저장하였으며, 이 저장된 데이터에 대한 UV좌표 값을 변경함으로서, 자연스러운 물결의 모습을 표현하였다. 또한 투사 및 반사의 정도가 프레넬(Fresnel) 공식을 통해 자동적으로 계산되도록 하였다.

Earliest Virtual Deadline Zero Laxity Scheduling for Improved Responsiveness of Mobile GPUs

  • Choi, Seongrim;Cho, Suhwan;Park, Jonghyun;Nam, Byeong-Gyu
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제17권1호
    • /
    • pp.162-166
    • /
    • 2017
  • Earliest virtual deadline zero laxity (EVDZL) algorithm is proposed for mobile GPU schedulers for its improved responsiveness. Responsiveness of user interface (UI) is one of the key factors in evaluating smart devices because of its significant impacts on user experiences. However, conventional GPU schedulers based on completely fair scheduling (CFS) shows a poor responsiveness due to its algorithmic complexity. In this letter, we present the EVDZL scheduler based on the conventional earliest deadline zero laxity (EDZL) algorithm by accommodating the virtual laxity concept into the scheduling. Experimental results show that the EVDZL scheduler improves the response time of the Android UI by 9.6% compared with the traditional CFS scheduler.