• 제목/요약/키워드: 이기종 컴퓨팅

검색결과 141건 처리시간 0.023초

임베디드 기기를 위한 이기종 멀티코어 프로세서 및 소프트웨어 기술 동향 (Heterogeneous Multi-Core Processor and Software Technology Trend for Embedded Devices)

  • 나갑주;백웅기;정영준
    • 전자통신동향분석
    • /
    • 제28권2호
    • /
    • pp.1-10
    • /
    • 2013
  • 1980년대와 1990년대가 서버와 데스크톱 중심 컴퓨팅의 시대였다고 한다면 2000년대 들어 모바일 분야를 포함하는 임베디드 프로세서 시장이 급격히 확장되며 임베디드 중심 시대로 산업구조가 재편되고 있다. 그리고, 2010년대에는 임베디드 프로세서 시장이 더욱 확대되고 기술도 더불어 발전되고 있는데, 최근 기술을 주도하고 있는 뜨거운 용어 중의 하나가 이기종 멀티코어 컴퓨팅이라 할 수 있다. 시장이 요구하는 고성능 컴퓨팅을 수용하고 임베디드 기기의 특성상 저전력을 실현해야 하는 현실적 문제를 해결하기 위한 이기종 멀티코어 하드웨어가 임베디드 기기에도 적용을 앞다투고 있는 상황이며, 적절한 응용 콘텐츠에 맞춰 이기종 멀티코어 하드웨어를 활용하기 위한 소프트웨어에 대한 관심과 발전도 발 맞춰 진행되고 있다. 이에 본고에서는 임베디드 기기 분야에 한정하여 이기종 멀티코어 하드웨어와 소프트웨어의 기술 동향을 살펴보고자 한다.

  • PDF

이기종 컴퓨팅 환경에서 OpenCL을 사용한 포토모자이크 응용의 효율적인 작업부하 분배 (Efficient Workload Distribution of Photomosaic Using OpenCL into a Heterogeneous Computing Environment)

  • 김희곤;사재원;최동휘;김혜련;이성주;정용화;박대희
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권8호
    • /
    • pp.245-252
    • /
    • 2015
  • 최근 고성능 컴퓨팅과 모바일 컴퓨팅에서 성능가속기를 사용하는 병렬처리 방법들이 소개되어왔다. 포토모자이크 응용은 내재된 데이터 병렬성을 활용하고 성능가속기를 사용하여 병렬처리가 가능하다. 본 논문에서는 CPU와 GPU로 구성된 이기종 컴퓨팅 환경에서 포토모자이크 수행 시 작업부하 분배 방법을 제안한다. 즉, 포토모자이크 응용을 비동기 방식으로 병렬화하여 CPU와 GPU 자원을 동시에 활용하고, 각 처리기에 할당할 최적의 작업부하량을 예측하기 위해 CPU-only와 GPU-only 작업 분배 환경에서 수행시간을 측정한다. 제안 방법은 간단하지만 매우 효과적이고, CPU와 GPU로 구성된 이기종 컴퓨팅 환경에서 다른 응용을 병렬화하 데에도 적용될 수 있다. 실험 결과, 이기종 컴퓨팅 환경에서 최적의 작업 분배량으로 수행한 경우, GPU-only의 방법과 비교하여 141%의 성능이 개선되었음을 확인한다.

OpenCL을 사용한 돈사 감시 응용의 효율적인 태스크 분배 (Efficient Task Distribution of Pig Monitoring Application using OpenCL)

  • 김진성;최윤창;김재학;정연우;정용화;박대희;김학재
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.54-57
    • /
    • 2017
  • 돈사 감시 응용은 내재된 데이터 병렬성을 활용하고 성능가속기를 사용하여 병렬처리가 가능하다. 본 논문에서는 multicore-CPU와 manycore-GPU로 구성된 이기종 컴퓨팅 환경에서 돈사 감시 응용 수행 시 태스크 분배 방법을 제안한다. 즉, 각 태스크별로 OpenCL로 작성된 병렬 프로그램을 deviceCPU와 deviceGPU 각각에서 수행시켜 측정된 수행시간을 기준으로 가장 적합한 처리기를 결정한다. 제안 방법은 간단하지만 매우 효과적이고, CPU와 GPU로 구성된 이기종 컴퓨팅 플랫폼에서 다른 응용을 병렬화하는데에도 적용될 수 있다. 실험 결과, 상이한 이기종 컴퓨팅 플랫폼에서 최적의 태스크 분배로 수행 한 경우가 전체 태스크들을 deviceGPU에서 수행한 방법에 비교하여 각각 2배, 11배 성능 개선이 되었음을 확인하였다.

모바일 이기종 컴퓨팅 시스템에서 영상처리 고속화를 위한 CPU측 병렬처리 방법 (Parallel Processing Method on CPU for Image Processing on Mobile Heterogeneous Computing System)

  • 백아람;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.181-182
    • /
    • 2015
  • 모바일 기기의 보급률과 성능이 급속도로 성장하면서 모바일 기기에서의 비디오 소비 또한 크게 증가하였다. 하지만, 전력과 공간을 줄이기 위해 설계된 모바일 플랫폼은 데스크톱 플랫폼과 비교하여 성능의 한계가 존재한다. 따라서 대용량 비디오 처리를 위해 SIMD 아키텍쳐를 이용하는 임베디드 GPU를 활용하여 이와 같은 한계를 극복하기 위한 고속화 연구가 많이 진행되고 있다. 저장된 데이터를 활용하는 영상처리는 GPU 뿐만 아니라 CPU가 반드시 함께 이용되어야 하며, 모바일 환경에서의 이기종 컴퓨팅 시스템은 프로세서 사이의 낮은 전송속도와 이로 인한 대기시간, 모바일 운영체제가 지원하는 데이터 형태의 필수적인 사용 등의 구조적 단점이 존재한다. 본 논문에서는 임베디드 GPU를 활용한 영상처리 고속화를 위해 임베디드 CPU측에서 병렬처리를 이용하여 앞서 설명한 단점들을 극복하고 실험결과로 모바일 이기종 컴퓨팅 구조에서 임베디드 CPU 활용이 전체적인 연산 효율을 증가시키는 결과를 보였다.

  • PDF

NAAL: 뉴로모픽 아키텍처 추상화 기반 이기종 IoT 기기 제어용 소프트웨어 (NAAL: Software for controlling heterogeneous IoT devices based on neuromorphic architecture abstraction)

  • 조진성;김봉재
    • 스마트미디어저널
    • /
    • 제11권3호
    • /
    • pp.18-25
    • /
    • 2022
  • 뉴로모픽 컴퓨팅은 일반적으로 CPU와 GPU를 이용하여 신경망 연산을 하는 것보다 전력, 면적, 속도 측면에서 매우 뛰어난 성능을 보여준다. 이러한 특성은 에너지 사용량이 중요시되는 자원 제약적인 IoT 환경에 매우 적합하다. 하지만 뉴로모픽 컴퓨팅을 지원하는 이기종 IoT 기기에 따라 환경설정 및 응용 프로그램 동작을 위한 소스코드의 수정이 필요하다는 문제점을 가지고 있다. 이러한 문제점을 해결하고자 본 논문에서는 NAAL을 제안하고 구현하였다. NAAL은 공통의 API를 기반으로 다양한 이기종 IoT 기기 환경에서 IoT 기기의 제어와 뉴로모픽 아키텍처의 추상화 및 추론 모델 동작에 필요한 기능을 제공한다. NAAL은 향후 새로운 이기종 IoT 기기 및 뉴로모픽 아키텍처와 컴퓨팅 장치의 추가적인 지원이 가능하다는 장점을 가진다.

분산 이기종 컴퓨팅 시스템에서 효율적인 리스트 스케줄링 알고리즘 (An Efficient List Scheduling Algorithm in Distributed Heterogeneous Computing System)

  • 윤완오;윤정희;이창호;김효기;최상방
    • 전자공학회논문지CI
    • /
    • 제46권3호
    • /
    • pp.86-95
    • /
    • 2009
  • 이기종 컴퓨팅 환경에서 방향성 비순환 그래프(directed acyclic graph DAG)의 효율적인 스케줄링은 시스템의 성능을 높게 만드는데 매우 중요한 역할을 한다. 이기종의 컴퓨팅 환경에서 DAG로 표현되는 프로그램의 최적 스케줄링 방법을 찾는 것은 잘 알려진 '정해진 시간 내에 해결하기 어려운 문제(NP-complete)' 이다. 본 논문은 분산 이기종 컴퓨팅 시스템에서 병렬로 실행 가능한 프로그램을 위한 새로운 리스트 스케줄링 알고리즘인 HRPS(Heterogeneous Rank-Path Scheduling)를 제안하였다. HRPS의 가장 궁극적인 목적은 프로그램의 실행시간을 최소화하는 것이다. 알고리즘의 성능을 위해 DAG 입력 그래프를 이용하여 기존에 제안되어진 CPOP, HCPT, FLB 알고리즘과 스케줄의 길이를 비교한 결과 성능 향상의 결과를 얻을 수 있었다.

OpenCL을 이용한 돈사 감시 응용의 효율적인 태스크 분배 (Efficient Task Distribution for Pig Monitoring Applications Using OpenCL)

  • 김진성;최윤창;김재학;정연우;정용화;박대희;김학재
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제6권10호
    • /
    • pp.407-414
    • /
    • 2017
  • 다수의 태스크로 구성된 돈사 감시 응용은 내재된 데이터 병렬성을 활용하고 성능가속기를 사용하여 병렬 처리가 가능하다. 본 논문에서는 멀티코어 CPU와 매니코어 GPU로 구성된 이기종 컴퓨팅 플랫폼에서 돈사 감시 응용 수행 시 태스크 분배 방법을 제안한다. 즉, 각 태스크별로 OpenCL을 이용한 병렬 프로그램을 작성한 뒤, deviceCPU와 deviceGPU 각각에서 수행시켜 측정된 수행시간을 기준으로 가장 적합한 처리기를 결정한다. 제안 방법은 간단하지만 매우 효과적이고, CPU와 GPU로 구성된 이기종 컴퓨팅 플랫폼에서 다수의 태스크로 구성된 다른 응용을 병렬화하는 경우에도 적용될 수 있다. 실험 결과, 상이한 이기종 컴퓨팅 플랫폼에서 최적의 태스크 분배로 수행한 경우 가 전체 태스크들을 deviceGPU에서 수행한 GPU-only 방법에 비교하여 각각 2.7배, 8.7배, 2.7배 성능 개선이 되었음을 확인하였다.

액체 시뮬레이션의 얇은 특징을 빠르게 표현하기 위한 CPU와 GPU 이기종 컴퓨팅 기술 (A CPU and GPU Heterogeneous Computing Techniques for Fast Representation of Thin Features in Liquid Simulations)

  • 김종현
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제24권2호
    • /
    • pp.11-20
    • /
    • 2018
  • 우리는 유체의 얇은 막을 명시적으로 표현하고 보존할 수 있는 CPU-GPU 이기종 컴퓨팅 기반의 유체 시뮬레이션 기법을 소개한다. 본 논문에서 가장 큰 기여는 얇은 유체표면에서 쪼개지거나 밀도가 높은 지점에서 붕괴되어 유체표면에 나타나는 Hole을 방지하는 입자 기반 프레임워크를 GPU를 활용한다는 것이다. 유체표면을 추적하는 기존의 방법과는 달리, 제안된 프레임워크는 CPU-GPU 프레임워크상에서 수치적 확산이나 꼬임문제 없이 안정적으로 토폴로지 변화를 처리할 수 있다. 얇은 표면의 특징은 이방성 커널(Anisotropic kernel)과 주성분 분석(Principal component analysis; PCA)을 GPU상에서 수행하여 유체의 방향성을 빠르게 찾고, 새로운 유체입자의 위치를 결정하기 위해 계산하는, 후보위치 추출 과정의 효율성을 CPU-GPU 이기종 컴퓨팅 기술 기반으로 빠르게 계산한다. 제안된 알고리즘은 직관적으로 구현되며, 병렬화가 쉽고 시각적으로 디테일한 액체의 얇은 표면을 빠르게 애니메이션 할 수 있다.

자바를 기반으로 한 글로벌 인터넷 컴퓨팅 환경 (Global Internet Computing Environment based on Java)

  • 김희철;신필섭;박영진;이용두
    • 한국정보처리학회논문지
    • /
    • 제6권9호
    • /
    • pp.2320-2331
    • /
    • 1999
  • 본 연구에서는 한정된 자원만을 사용하는 기존의 워크스테이션 클러스터링 환경의 제한성을 극복하기 위하여 인터넷에 연결된 혼합 이기종 컴퓨터들을 병렬 컴퓨팅 플랫폼으로 활용하고자 하는 인터넷 컴퓨팅 환경의 구축 기법을 제안한다. 제안하는 글로벌 인터넷 컴퓨팅 환경(Global Internet Computing Environment)은 프로그램의 용이성, 이기종 지원의 효율성, 시스템의 확장성, 그리고 시스템 성능에 초점을 두고 자바를 프로그래밍 및 수행 환경으로 채택하여 인터넷 컴퓨팅 구축에 있어 필수적인 동적 자원 중계 및 관리, 효율적인 병렬 테스크 수행 기법을 제시한다. 본 논문에서는 제안하는 글로벌 인터넷 컴퓨팅 환경의 구성모델 및 동작모델 그리고 시험시스템 구축 내용 및 벤치마킹을 통한 성능 평가 결과를 제시하며 이를 바탕으로 인터넷 컴퓨팅 환경의 구축 개념, 복잡성, 성능의 문제에 대한 분석결과를 기술한다.

  • PDF