• 제목/요약/키워드: multi-core architecture

검색결과 158건 처리시간 0.023초

프로세싱 인 메모리 시스템에서의 PolyBench 구동에 대한 동작 성능 및 특성 분석과 고찰 (Performance Analysis and Identifying Characteristics of Processing-in-Memory System with Polyhedral Benchmark Suite)

  • 김정근
    • 반도체디스플레이기술학회지
    • /
    • 제22권3호
    • /
    • pp.142-148
    • /
    • 2023
  • In this paper, we identify performance issues in executing compute kernels from PolyBench, which includes compute kernels that are the core computational units of various data-intensive workloads, such as deep learning and data-intensive applications, on Processing-in-Memory (PIM) devices. Therefore, using our in-house simulator, we measured and compared the various performance metrics of workloads based on traditional out-of-order and in-order processors with Processing-in-Memory-based systems. As a result, the PIM-based system improves performance compared to other computing models due to the short-term data reuse characteristic of computational kernels from PolyBench. However, some kernels perform poorly in PIM-based systems without a multi-layer cache hierarchy due to some kernel's long-term data reuse characteristics. Hence, our evaluation and analysis results suggest that further research should consider dynamic and workload pattern adaptive approaches to overcome performance degradation from computational kernels with long-term data reuse characteristics and hidden data locality.

  • PDF

고해상도 SAR 영상처리 고속화를 위한 병렬 성능 최적화 기법 연구 (A Study on Parallel Performance Optimization Method for Acceleration of High Resolution SAR Image Processing)

  • 이규범;김규빈;안솔보름;조진연;임병균;김동현;김정호
    • 한국항공우주학회지
    • /
    • 제46권6호
    • /
    • pp.503-512
    • /
    • 2018
  • SAR(Synthetic Aperture Radar)는 레이더를 이용하여 얻은 신호를 처리해 영상을 획득하는 기술로서, SAR 영상의 활용도와 고해상도 영상에 대한 요구가 증가하고 있는 상황이다. 따라서 본 연구에서는 고해상도 영상 데이터의 고속 처리를 위해 SAR 영상처리 알고리즘을 다중코어 기반의 컴퓨터 구조에서 최적의 성능을 낼 수 있도록 구현하기 위한 연구를 수행했다. 고해상도 영상에 따른 방대한 양의 입출력에 의한 성능 저하를 개선시키기 위해 메모리를 최대한 활용하는 성능 최적화 기법을 적용하고 OpenMP의 동적 스케쥴링 기법과 중첩 병렬성(nested parallelism)을 사용해 코드의 병렬화 비율을 높였다. 그 결과 전체 계산시간을 줄일 뿐만 아니라 병렬 성능의 최대 한계치를 크게 높일 수 있었으며, 제안된 기법을 10개 코어를 가진 다중코어 시스템에 적용한 결과 기존 대비 8배 이상의 성능 향상이 있었다. 본 연구 결과는 대용량 메모리를 가진 다중코어 시스템을 대상으로 하는 고해상도 SAR 영상처리 소프트웨어 개발에 효과적으로 활용될 수 있을 것으로 기대된다.

디지털 컨트롤러 공유 및 Pseudo Relaxation Oscillating 기법을 이용한 원-칩 다중출력 SMPS (One-Chip Multi-Output SMPS using a Shared Digital Controller and Pseudo Relaxation Oscillating Technique)

  • 박영균;임지훈;위재경;이용근;송인채
    • 전자공학회논문지
    • /
    • 제50권1호
    • /
    • pp.148-156
    • /
    • 2013
  • 본 논문에서는 디지털 제어부를 공유하며, 회로 동작시간의 분배 방식을 통해 다중 출력을 지원하는 SMPS를 제안한다. 제안된 회로는 Pseudo Relaxation Oscillating 기법의 DPWM 발생기를 사용한다. 제안된 SMPS는 회로의 동작시간 분배 방식을 사용하여 기존의 DPWM 발생기에서 문제가 되는 큰 면적의 디지털 로직 컨트롤러를 공유하는 형태이기 때문에 칩 면적과 효율 측면에서 큰 이점을 가지지만, 각 DPWM 발생기의 실시간 제어가 어려우며 불안정한 출력 전압을 공급할 수 있다는 단점을 가진다. 이를 해결하기 위해 본 논문에서는 동작시간 분배 방식으로 인해 동작클록이 인가되지 않은 DPWM 발생기들의 출력전압을 실시간으로 피드백 받아 안정된 출력 전압을 공급할 수 있는 실시간 전류 보정 기법을 제안한다. 제안된 SMPS를 100MHz의 내부 제어 동작 주파수와 10MHz 스위칭 주파수로 동작시킬 시, 소모되는 내부 코어 회로의 최대 전류는 4.9mA이며, 출력 버퍼를 포함한 전체 시스템의 전력 소모는 30mA이다. 또한 800mA, 100KHz의 load current regulation 조건으로 시뮬레이션 시, 3.3V 출력전압에 대한 최대 리플 전압은 11mV, Over/Undershoot voltage는 각각 10mV, 19.6mV 이다. 코어 회로의 크기는 $700{\mu}m{\times}800{\mu}m$의 작은 면적으로 구현가능하다. 제안된 회로는 Dong-bu Hitek BCD $0.35{\mu}m$ 공정을 이용한 시뮬레이션을 통해 검증되었다.

CUDA 프레임워크 상에서 스카이라인 질의처리 알고리즘 최적화 (Optimizing Skyline Query Processing Algorithms on CUDA Framework)

  • 민준;한환수;이상원
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권5호
    • /
    • pp.275-284
    • /
    • 2010
  • GPU는 대용량 데이터 처리를 위해 특화된 멀티 코어 기반의 스트림 프로세서로서 빠른 데이터 처리 속도 및 높은 메모리 대역 동의 장점을 가지며, CPU에 비해 가격이 저렴하다. 최근 이러한 GPU의 특성용 활용하여 범용 컴퓨팅 분야에 활용하고자 하는 시도가 계속되고 있다. 엔비디아에서 발표한 범용 병렬 컴퓨팅 아키텍처인 쿠다(CUDA) 프로그래밍 모델의 경우 프로그래머가 GPU 상에서 동작하는 범용 어플리케이션을 보다 손쉽게 개발할 수 있도록 지원한다. 본 논문에서는 쿠다 프로그래밍 모델을 이용하여 기본적인 중첩-반복 스카이라인 알고리즘을 병렬화시킨다. 그리고 스카이라인 알고리즘의 특성을 고려하여 GPU 자원용 효율적으로 사용할 수 있도록 GPU의 메모리 및 명령어 처리율에 중점을 두고 단계적인 최적화를 진행한다. 최적화 단계에 따라 각각 다른 성능 개선이 나타나는 것을 확인하였으며, 그 결과 기본 병렬 중첩-반복 알고리즘에 비해 평균 80%의 성능이 향상됨을 확인하였다.

개방형 네트워크 환경을 위한 멀티쓰레드 기반 코바 설계 및 구현 (Design and Implementation of CORBA based on Multi-Threaded in Open Network Environments)

  • 장종현;이동길;한치문
    • 정보처리학회논문지C
    • /
    • 제9C권2호
    • /
    • pp.213-220
    • /
    • 2002
  • 분산컴퓨팅 시스템은 서로 이질적인 시스템간 상호 연동성 문제를 해결하기 위한 새로운 시스템 아키텍쳐를 제시한다. 본 논문에서는 개방형 통신시스템에서 물리적으로 분리된 시스템에서 실행되는 소프트웨어 블록간 분산 처리를 위한 멀티쓰레드 기반의 통신 시스템용 미들웨어를 개발하기 위한 요구 기능 분석, 프로토콜 구현 및 벤치마킹을 통한 시스템의 성능을 분석을 통한 최적의 미들웨어 플랫폼 구현에 활용하고자 한다. 통신 시스템용 미들웨어의 주요 기능으로는 제한적인 서비스 품질(QoS)을 제공하기 위한 우선순위 기반의 서비스 처리 및 타임아웃 기능과 예외 상황이 발생하는 경우 관련 블록으로 상태 정보를 통보할 수 있는 통지(Notification) 서비스의 제공이 필수 요구 조건이라 할 수 있다. 아울러, 최적의 성능을 만족할 수 있는 고속의 멀티 쓰레드 기반으로 확장성, 유연성 및 플랫폼의 견고성이 요구되는 미들레어의 설계 및 구현에 그 목적을 두고 있다.

임베디드 소프트웨어 개발을 위한 제품계열 중심의 개발프로세스 모델 설계 (A Design of Development Process Model of Product Lines for Developing Embedded Software)

  • 홍기삼;윤희병
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권11호
    • /
    • pp.915-922
    • /
    • 2006
  • 최근 임베디드 소프트웨어가 다양한 분야에서의 개발이 두드러지면서 그 요구사항들도 다양해지고 있다. 그 중 이슈화되고 있는 것 중 하나가 하드웨어와의 종속성을 반영한 체계적인 개발방법을 제시하는 것이다. 기존의 개발방법들은 하드웨어와의 밀접한 관계, 여러 유사 도메인에 대한 고수준의 재사용성 요구 등 임베디드 소프트웨어가 갖고 있는 특성들을 효과적으로 반영하지 못하고 있다. 따라서 본 논문에서는 제품계열적 접근방법을 통해 효율적인 임베디드 소프트웨어 개발방법을 제시하기 위한 개발프로세스 모델 설계방법을 제안한다. 개발프로세스 모델의 설계 중점은 먼저 효율적 요구사항 도출기법으로 디렉토리 방식의 도메인 스코핑 방식과 IDEF0 기반 비즈니스 모델을 제안한다. 다음으로 서비스 구조 기반의 컴포넌트 도출방식과 하드웨어 종속성을 고려한 아키텍처 설계 방식을 제안한다. 마지막으로 제안한 개발프로세스 설계모델이 어떻게 임베디드 소프트웨어 개발에 적용되는지를 보이기 위해 다중센서데이터 융합시스템에 적용한 결과를 설계과정마다 제시한다.

다계층 광네트워크에서 계층간 경로설정 시스템 구조 연구 (A Inter-layer Path Provisioning System Architecture in Multi-layer Networks)

  • 김현철
    • 융합보안논문지
    • /
    • 제13권3호
    • /
    • pp.25-31
    • /
    • 2013
  • 최근 네트워크 사용자들이 네트워크를 사용하는 방식이나 가치의 변화를 살펴보면 간단한 웹 정보와 같은 단방향 정보만을 제공받는 형태에서 자유로운 이동성을 기반으로 보안과 개인화가 보장된 대용량 정보 전송 형태로 바뀌고 있다. 이처럼 다양한 요구사항들의 변화에 따라 개별적으로 서비스를 제공하던 형태에서 하나의 형태로 통합되는 추세에 있다. 아울러 네트워크 또한 개별적인 네트워크를 통합하는 형태로 발전하고 있으며 이러한 여러 네트워크를 통합적으로 제어할 수 있는 네트워크 제어 기술이 핵심 요소로 등장하였다. 이러한 사용자들의 요구사항을 반영하여 차세대 네트워크는 WDM/IP 전송기술을 기반으로 동적 재구성을 지원하는 다계층 네트워크가 대세를 이루고 있다. 이처럼 패킷-광전달 시스템(P-OTS)은 SONET/SDH와 Ethernet, DWDM, OTN, 그리고 ROADM과 같은 기술들을 통합한 플랫폼이라고 할 수 있다. 본 논문에서는 다계층 광 네트워크 제어 시스템에서 PCE 기반 광 및 패킷전달계층 경로계산엔진 알고리즘을 제안하였다.

타일 및 프레임 수준의 HEVC 병렬 부호화 (Tile-level and Frame-level Parallel Encoding for HEVC)

  • 김연희;석진욱;정순흥;김휘용;최진수
    • 방송공학회논문지
    • /
    • 제20권3호
    • /
    • pp.388-397
    • /
    • 2015
  • 고화질 비디오에 대한 시장의 요구가 높아짐에 따라 고화질 비디오를 기존 보다 낮은 데이터 량으로 압축할 수 있는 새로운 비디오 부호화 표준 기술인 HEVC(High Efficiency Video Coding)가 최근에 개발 완료되었다. 즉 HEVC로 압축한 데이터의 양은 기존 비디오 부호화 표준인 AVC/H.264로 압축한 데이터의 양의 동일 화질 대비 약 50%로 보고되고 있다. 압축 성능이 개선된 새로운 부호화 표준에 대한 시장의 관심은 뜨겁지만 시장에 바로 활용되기 위하여서는 응용 서비스에서 요구하는 수준의 처리속도를 만족시켜야 한다. 다수의 코어가 탑재된 컴퓨터 시스템이 널리 보급된 오늘날의 개발 환경에서 부호화 처리 속도를 개선시키기 위해서 여러 각도의 병렬 부호화 적용이 필수이다. 본 논문에서는 HEVC 부호화기에 화면 분할 병렬화와 프레임 수준의 병렬화를 조합하여 적용할 때 코딩 효율 대비 병렬화로 인한 더 높은 속도 향상 결과를 가져올 수 있는 방법을 제안하였다. 즉 시스템 자원과 병렬로 처리할 프레임에 따라 화면을 적응적으로 분할하게 함으로써 코딩 효율 대비 속도 향상을 개선시킬 수 있었다. 한 화면 안에서는 다수의 타일(Tile) 단위로 병렬처리하고, 참조되지 않는 프레임(Frame)들을 병렬로 부호화하도록 본 논문을 통해 구현하였으며 Full-HD 및 4K UHD 영상을 이용하여 제안하는 방법이 코딩 효율 대비 병렬화로 인한 속도 향상이 개선되었음을 보여주었다.

미얀마 네피도 지역의 도시개발로 인한 토지피복변화 탐지 및 산림파편화 분석 (Land cover change and forest fragmentation analysis for Naypyidaw, Myanmar)

  • 공인혜;백경혜;이동근
    • 환경영향평가
    • /
    • 제22권2호
    • /
    • pp.147-156
    • /
    • 2013
  • Myanmar(Burma) has been preserved valuable environmental resources because of its political isolation. But recently, Myanmar has moved a capital city(Naypyidaw) at central forest area and it has been urbanized radically since 2005. In this paper, we built multi-temporal land cover map from Landsat images of 1970s to 2012 with ENVI 4.5 software. For a broad approach, administrative district Yamethin which includes Naypyidaw is classified into 3 classes and with only Naypyidaw region is classified with 4-5 classes to analyse specific changes. And with forest cover extracted by Object Oriented Classification, we evaluated forest fragmentation before and after the development using Patch Analyst(FRAGSTATs 3.3) at Yamethin area. For Yamethin area, there were significant forest cover change, 51% in 1999 to 48% in 2012, and for Naypyidaw area, 67% in 1999 to 57% in 2012 respectively. Also landscape indices resulted from Patch Analyst concluded that the total edge, edge density and mean shaped index of forest patches increased and total core area is decreased. It is attributed from land cover change with urbanization and agricultural land expansion.

TLB 구조에 따른 3차원 멀티코어 프로세서의 성능, 온도 분석 (Analysis on the Performance and Temperature of 3D Multi-core Processors according to TLB Architecture)

  • 손동오;최홍준;김철홍
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.5-8
    • /
    • 2011
  • 3차원 멀티코어 프로세서는 기존의 멀티코어 프로세서에서 문제가 되던 연결망 지연시간과 전력문제를 해결할 수 있는 새로운 프로세서 설계기술이다. 하지만, 전력밀도의 증가로 인해 발생하는 열섬현상은 3차원 멀티코어 프로세서의 새로운 문제점으로 두드러지고 있다. 이러한 문제를 해결하기 위해서 동적 온도 관리 기법이 사용되지만, 동적 온도 관리 기법을 적용하면 시스템에 성능 저하가 발생하게 된다. 따라서 본 논문에서는 3차원 멀티코어 프로세서에서 문제가 되는 열섬현상을 해결하기 위해 고온의 유닛을 대상으로 동적 온도 관리 기법을 적용하고자 한다. 실험대상으로는 시스템 성능에 많은 영향을 미치고 높은 접근 때문에 고온이 발생하는 TLB 유닛을 사용하고자 한다. 특히, 시스템의 성능 저하를 줄이기 위해서 기존의 시스템보다 낮은 성능을 보이는 마이크로 TLB 구조를 적용해 보고자 한다. 성능이 낮은 구조의 경우 일반적으로 더 낮은 온도 분포를 보이며 동적 온도 관리 기법에 영향을 덜 받기 때문에 동적 온도 관리 기법만 적용한 구조보다 더 낮은 성능 저하를 보일 수 있다. 실험결과 동적 온도 관리 기법을 적용한 경우 기존의 시스템에 비해 23.4%의 성능 저하가 발생하고 마이크로 TLB 구조를 적용한 경우 27.1%의 성능 저하가 발생함을 알 수 있다.