• 제목/요약/키워드: Reconfigurable Processor

검색결과 56건 처리시간 0.031초

범용 신경망 연산기(ERNIE)를 위한 학습 모듈 설계 (Design of Learning Module for ERNIE(ERNIE : Expansible & Reconfigurable Neuro Informatics Engine))

  • 정제교;위재우;동성수;이종호
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제53권12호
    • /
    • pp.804-810
    • /
    • 2004
  • There are two important things for the general purpose neural network processor. The first is a capability to build various structures of neural network, and the second is to be able to support suitable learning method for that neural network. Some way to process various learning algorithms is required for on-chip learning, because the more neural network types are to be handled, the more learning methods need to be built into. In this paper, an improved hardware structure is proposed to compute various kinds of learning algorithms flexibly. The hardware structure is based on the existing modular neural network structure. It doesn't need to add a new circuit or a new program for the learning process. It is shown that rearrangements of the existing processing elements can produce several neural network learning modules. The performance and utilization of this module are analyzed by comparing with other neural network chips.

소프트 CPU 내장형 FPGA 기반의 소형 전장품 개발 (Development of a small avionics unit based on FPGA with soft CPU)

  • 전상운
    • 항공우주기술
    • /
    • 제12권2호
    • /
    • pp.131-139
    • /
    • 2013
  • 본 논문은 소프트 CPU 기반의 소형 전장품 설계 및 개발에 대한 것을 다루고 있다. 소프트 CPU는 소프트웨어를 이용한 로직 합성을 통해서 FPGA 내부에 구성되는 마이크로 프로세서이다. 소형 전장품 개발을 위해 소프트 CPU중 Nios-II 프로세서를 적용하여 다양하고, 다시 구성할구 있고, 다시 조립 가능한 하부 모듈로 설계하고 개발하였다. 모듈 구조로 구성하기 위해서 메인 보드와 하부 보드 모두 전원과 데이터 버스가 공통으로 사용할 수 있도록 구성하였고, 선택적으로 사용할 수 있도록 하였다.

Low-Power-Adaptive MC-CDMA Receiver Architecture

  • Hasan, Mohd.;Arslan, Tughrul;Thompson, John S.
    • ETRI Journal
    • /
    • 제29권1호
    • /
    • pp.79-88
    • /
    • 2007
  • This paper proposes a novel concept of adjusting the hardware size in a multi-carrier code division multiple access (MC-CDMA) receiver in real time as per the channel parameters such as delay spread, signal-to-noise ratio, transmission rate, and Doppler frequency. The fast Fourier transform (FFT) or inverse FFT (IFFT) size in orthogonal frequency division multiplexing (OFDM)/MC-CDMA transceivers varies from 1024 points to 16 points. Two low-power reconfigurable radix-4 256-point FFT processor architectures are proposed that can also be dynamically configured as 64-point and 16-point as per the channel parameters to prove the concept. By tailoring the clock of the higher FFT stages for longer FFTs and switching to shorter FFTs from longer FFTs, significant power saving is achieved. In addition, two 256 sub-carrier MC-CDMA receiver architectures are proposed which can also be configured for 64 sub-carriers in real time to prove the feasibility of the concept over the whole receiver.

  • PDF

재구성 가능한 DCT/DWT 프로세서 설계 (The Reconfigurable Processor Design of DCT/DWT)

  • 김영진;이현수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.730-732
    • /
    • 2005
  • 최근 이미지 압축, 워터마킹 또는 스케일러블 비디오 코딩 분야에서 DCT와 DWT 연산을 선택적으로 사용하거나, 혼합하여 사용하는 경우가 늘어나고 있다. 이러한 두개의 연산을 사용하는 방법은 소프트웨어적인 프로그램을 사용하거나 하드웨어를 따로 구현하여 사용하였다. 본 연구에서는 하나의 모듈로 두개의 연산을 수행할 수 있는 재구성 하드웨어를 제안한다. 또한 DCT와 DWT연산에 있어서, 가장 많은 연산을 수행하는 부분은 계수(Coefficient)값과 입력 값의 내적 연산(Inner Product)을 수행하는 것인데, 이 내적연산을 하는데 있어서 곱셈기를 사용하지 않는 분산연산을 사용함으로써 연산의 복잡도를 줄이고, 하드웨어의 속도를 빠르게 하였다. 실험 환경은 Altera FPGA를 사용한 Excalibur_ARM (EPXA10F1020Cl) 보드를 이용하여 구현하였으며, 동작속도는 47.85MHz이다.

  • PDF

Efficient Use of On-chip Memory through Profile-Driven Array Reorganization

  • Cho, Doosan;Youn, Jonghee
    • 대한임베디드공학회논문지
    • /
    • 제6권6호
    • /
    • pp.345-359
    • /
    • 2011
  • In high performance embedded systems, the use of multiple on-chip memories is an essential architectural feature for exploiting inherent parallelism in multimedia applications. This feature allows multiple data accesses to be executed in parallel. However, it remains difficult to effectively exploit of multiple on-chip memories. The successful use of this architecture strongly depends on how to efficiently detect and exploit memory parallelism in target applications. In this paper, we propose a technique based on a linear array access descriptor [1], which is generated from profiled data, to detect and exploit memory parallelism. The proposed technique tackles an array reorganization problem to maximize memory parallelism in multimedia applications. We present preliminary experiments applying the proposed technique onto a representative coarse grained reconfigurable array processor (CGRA) with multimedia kernel codes. Our experimental results demonstrate that our technique optimizes data placement by putting independent data on separate storage. The results exhibit 9.8% higher performance on average compared to the existing method.

분할 SIMD 재구성형 병렬 프로세서를 위한 컴파일러 설계 (A Design of compiler for partitioned SIMD reconfigurable parallel processor)

  • 권용인;김용주;윤종희;안민욱;최영규;백윤흥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.11-12
    • /
    • 2009
  • 본 논문에서는 휴대용 단말기의 실시간 서비스 제공을 위한 재구성형 병렬 프로세서를 소개 하고, 그 기능인 분할 SIMD를 표현하기 위한 새로운 프로그래밍 언어와 컴파일러를 설계한다. 이 방식을 이용하여 빠른 어플리케이션 개발과 각 어플리케이션의 성능 향상에 용이하다.

Hybrid 내장형 시스템의 설계공간탐색을 위한 시간분석 시뮬레이터의 설계 및 구현 (A Design and Implementation of a Timing Analysis Simulator for a Design Space Exploration on a Hybrid Embedded System)

  • 안성용;심재홍;이정아
    • 정보처리학회논문지A
    • /
    • 제9A권4호
    • /
    • pp.459-466
    • /
    • 2002
  • 최근의 내장형 시스템은 유연성을 유지하고 시간 제약사항을 만족하기 위해서 일반적인 프로세서와 FPGA와 같은 재구성 가능한 부품을 결합하는 Hybrid 시스템을 사용하는 추세이다. 이러한 내장형 시스템은 구축하는 설계 시간을 단축하여 짧은 시간 안에 시장에 진입하는 것이 아주 중요하다. 새로이 주목받고 있는 연구분야인 설계공간탐색은 실제 시스템을 제작하지 않고도 시스템 수준에서 어플리케이션의 성능을 분석하여 최소의 비용으로 시스템에서 요구하는 제약사항을 만족하는 구조를 예측하는 것을 가능하게 한다. 본 논문에서는 Hybrid 내장형 시스템의 설계공간탐색을 위한 시간분석 시뮬레이터를 선계하고 구현하였다. 시스템 설계변수를 변화하면서 정량적인 성능 데이타를 이용하여 설계공간 탐색을 가능하게 하는 Y-Chart 방법을 Hybrid 시스템의 경우에 적용하여 시뮬레이터를 확장 구현하였으며, 기존의 소프트웨어 시간 분석 도구 및 하드웨어 시간분석도구를 활용한다. 본 논문에서 제시하는 시간분석 시뮬레이터는 Hybrid 내장형 시스템의 설계 비용과 시간을 현저하게 줄이면서, 최적의 하드웨어 구성을 찾는 설계공간탐색의 핵심 모듈로 활용될 것으로 기대된다.

OpenRISC 프로세서와 WISHBONE 버스 기반 SoC 플랫폼 개발 및 검증 (Development and Verification of SoC Platform based on OpenRISC Processor and WISHBONE Bus)

  • 빈영훈;류광기
    • 대한전자공학회논문지SD
    • /
    • 제46권1호
    • /
    • pp.76-84
    • /
    • 2009
  • 본 논문에서는 교육적 활용과 어플리케이션 개발에 응용 가능한 SoC 플랫폼을 제안한다. 플랫폼 하드웨어는 OpenRISC 프로세서, 범용 입출력장치, 범용 직렬 인터페이스, 디버그 인터페이스, VGA/LCD 제어기 등의 주변장치와 온 칩 SRAM 및 WISHBONE 인터커넥터로 구성되며 전체 합성 가능하도록 설계 되었다. 모든 하드웨어 구조는 재구성 가능하여 매우 유연한 구조로 되어있다. 또한 개발된 SoC 플랫폼의 하드웨어/소프트웨어 디버깅과 플랫폼 상에서 구현될 소프트웨어 개발을 위해 컴파일러, 어셈블러, 디버거, 운영체제 등의 SW 개발환경이 구현 및 검증되었다. 설계된 IP와 SoC는 Verilog HDL로 기술된 테스트벤치를 이용한 모듈 수준 기능검증, 최상위 블록 수준 기능검증, ISS를 이용한 구조적, 명령어 수준 검증, FPGA 프로토타입을 이용한 시스템 수준 에뮬레이션 방법을 통해 검증되었다. 검증된 플랫폼을 이용한 멀티미디어 SoC를 Magnachip 0.18 um CMOS 라이브러리를 이용하여 ASIC으로 구현하여 91MHz의 클록 주파수에서 동작을 확인하였다.

SRP 를 기반으로 하는 8K 프로그래머블 멀티미디어 플랫폼 (8K Programmable Multimedia Platform based on SRP)

  • 이원창;김민수;송준호;김재현;이시화
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.163-165
    • /
    • 2014
  • In this paper, we propose a world's first programmable video processing platform for video quality enhancement of 8K ($7680{\times}4320$) UHD (Ultra High Definition) TV at 60 frames per second. To support huge computation and memory bandwidth of video quality enhancement for 8K resolution, the proposed platform has unique features like symmetric multi-cluster architecture for data partitioning, ring data-path between clusters to support data pipelining, on-the-fly processing architecture to reduce DDR bandwidth, flexible hardware to accelerating common kernel in video enhancement algorithms. In addition to those features, general programmability of SRP (Samsung reconfigurable processor) as main core of the proposed platform makes it possible to upgrade continuously video enhancement algorithm even after the platform is fixed. This ability is very important because algorithms for 8K DTV is under development. The proposed sub-system has been embedded into SoC (System on Chip) and new 8K UHD TV using the programmable SoC is expected at CES2015 for the first time in the world.

  • PDF

다중채널 시스템을 위한 SDR 기술기반의 디지털 필터 기법 설계 및 구현 (Design and Implementation of SDR-based Digital Filter Technique for Multi-Channel Systems)

  • 유봉국;방영조;나성웅
    • 한국통신학회논문지
    • /
    • 제33권5A호
    • /
    • pp.494-499
    • /
    • 2008
  • 본 논문은 SDR(Software Defined Radio) 기술을 기반으로 CDMA(Code Division Multiple Access) 방식의 이동전화 시스템과 같은 다중 채널 처리 시스템에서 특정 FA(frequency Assignment)만을 여파하여 처리하는 다양한 응용에 적용될 수 있는 디지털 필터 기법을 제안한다. 이 기법은 마이크로 프로세서를 이용하여 사용자가 선택하는 특정 시스템 정보에 따라 소프트웨어적으로 필터 계수(Filter Coefficients)를 재설계하여 한 개의 디지털 FIR(Finite Impulse Response) 대역통과 필터(BPF: Band Pass Filter)를 재구성함으로써 여러 개의 대역통과 필터를 갖는 효과를 얻는다. 본 논문에서 제안하는 기법을 적용하여 다중채널 신호 발생기를 구현하고, 동일한 하드웨어 상에서 WCDMA(Wideband Code Division Multiple Access) 시스템 혹은 CDMA 시스템으로 재구성하는 시험을 통하여 본 알고리즘의 구현 가능성을 검증하였다.