• 제목/요약/키워드: hardware optimization

검색결과 210건 처리시간 0.023초

Gradient Optimized Gradient-Echo Gradient Moment Nulling Sequences for Flow Compensation of Brain Images

  • Jahng, Geon-Ho;Stephen Pickup
    • Investigative Magnetic Resonance Imaging
    • /
    • 제4권1호
    • /
    • pp.20-26
    • /
    • 2000
  • Gradient moment nulling techniques require the introduction of an additional gradient on each axis for each order of motion correction to be applied. The additional gradients introduce new constraints on the sequence design and increase the demands on the gradient system. The purpose of this paper is to demonstrate techniques for optimization of gradient echo gradient moment nulling sequences within the constraints of the gradient hardware. Flow compensated pulse sequences were designed and implemented on a clinical magnetic resonance imaging system. The design of the gradient moment nulling sequences requires the solution of a linear system of equations. A Mathematica package was developed that interactively solves the gradient moment nulling problem. The package allows the physicist to specify the desired order of motion compensation and the duration of the gradients in the sequence with different gradient envelopes. The gradient echo sequences with first, second, and third order motion compensation were implemented with minimum echo time. The sequences were optimized to take full advantage of the capabilities of the gradient hardware. The sequences were used to generate images of phantoms and human brains. The optimized sequences were found to have better motion compensation than comparable standard sequences.

  • PDF

실시간 데이터 압축을 위한 Lempel-Ziv 압축기의 효과적인 구조의 제안 (An efficient Hardware Architecture of Lempel-Ziv Compressor for Real Time Data Compression)

  • 진용선;정정화
    • 대한전자공학회논문지TE
    • /
    • 제37권3호
    • /
    • pp.37-44
    • /
    • 2000
  • 본 논문에서는 실시간 데이터 압축을 위한 Lempel-Ziv 압축기의 효과적인 하드웨어 구조를 제안한다. 일반적으로 Lempel-Ziv 알고리즘의 구현에서는 matching 바이트 탐색과 dictionary 버퍼의 누적된 shift 동작이 처리 속도에 가장 중요한 문제이다. 제안하는 구조에서는 dictionary 크기를 최적화하는 방법과 복수개의 바이트를 동시에 비교하는 matching 바이트 처리 방법, 그리고 회전 FIEO 구조를 이용하여 shift 동작 제어 방법을 이용함으로써 효과적인 Lempel-Ziv 알고리즘의 처리 구조를 제안하였다. 제안된 구조는 상용 DSP를 사용하여 하드웨어적으로 정확하게 동작함을 검증하였으며, VHDL로 기술한 후 회로 합성을 수행하여 상용 FPGA 칩에 구현하였다. 제안된 구조는 시스템 클락 33㎒, 비트율 256Kbps 전용선에서 오류 없이 동작함을 확인하였다.

  • PDF

금형 냉각 최적화를 위한 기체 보조 냉각 (Gas cooling for optimization of mold cooling)

  • 임동욱;김지훈;신봉철
    • Design & Manufacturing
    • /
    • 제12권1호
    • /
    • pp.18-25
    • /
    • 2018
  • Both injection and injection molding dies have evolved into advanced technology. Product quality is also evolving day after day. Therefore, the conditions of the injection mold and the injection conditions are becoming important. In order to improve the quality of the product, the Hardware part of the mold has developed as an advanced technology, and the Software part has also developed with advanced technology. This study deals with the cooling part, which is part of the hardware. In addition to fluid cooling, which is commonly used in the industry, by using gas cooling identify the phenomena that appear on the surface of the product and the critical point strain of the product to find the optimal cooling. Electronic parts and automobile parts whose surface condition is important, the cooling process is important to such a degree that they are divided with good products and defective products according to the cooling process at the time of injection. By controlling this important cooling and reducing the injection time with additional cooling, the product quality can be increased to the highest production efficiency. In addition, high efficiency can be achieved without additional investment costs. This study was conducted to apply these various advantages in the field.

학습된 신경망 설계를 위한 가중치의 비트-레벨 어레이 구조 표현과 최적화 방법 (Bit-level Array Structure Representation of Weight and Optimization Method to Design Pre-Trained Neural Network)

  • 임국찬;곽우영;이현수
    • 대한전자공학회논문지SD
    • /
    • 제39권9호
    • /
    • pp.37-44
    • /
    • 2002
  • 학습된 신경망(Pre-trained neural network)은 고정된 가중치(weight)를 갖는다. 이 논문에서는 이러한 특성을 이용하여 신경망의 효과적인 디지털 하드웨어의 설계방법을 제안한다. 이를 위해 신경망의 PEs(Processing Elements)연산은 행렬-벡터 곱셈으로 표하고 고정된 가중치와 입력 데이터의 관계를 비트-레벨 어레이(array) 구조로 표현하여, 노드 소거와 가중치 비트 패턴에 따른 공유 노드 설정을 통한 최적화로 연산에 필요한 노드를 최소화한다. FPGA 시뮬레이션 결과, 완전한 정확성에 기반한 하드웨어를 설계하는 경우, 하드웨어 비용을 상당부분 줄였고 동작 주파수가 높다는 것을 확인하였다. 또한, 제안한 설계방법은 한정된 공간 내에서 많은 수의 PEs 구현이 가능함으로, 큰 신경망 모델에 대한 온-칩(on-chip) 구현이 가능하다.

FPGA-based Centralized Controller for Multiple PV Generators Tied to the DC Bus

  • Ahmed, Ashraf;Ganeshkumar, Pradeep;Park, Joung-Hu;Lee, Hojin
    • Journal of Power Electronics
    • /
    • 제14권4호
    • /
    • pp.733-741
    • /
    • 2014
  • The integration of photovoltaic (PV) energy sources into DC grid has gained considerable attention because of its enhanced conversion efficiency with reduced number of power conversion stages. During the integration process, a local control unit is normally included with every power conversion stage of the PV source to accomplish the process of maximum power point tracking. A centralized monitoring and supervisory control unit is required for monitoring, power management, and protection of the entire system. Therefore, we propose a field-programmable gate array (FPGA) based centralized control unit that integrates all local controllers with the centralized monitoring unit. The main focus of this study is on the process of integrating many local control units into a single central unit. In this paper, we present design and optimization procedures for the hardware implementation of FPGA architecture. Furthermore, we propose a transient analysis and control design methodology with consideration of the nonlinear characteristics of the PV source. Hardware experiment results verify the efficiency of the central control unit and controller design.

임베디드 GPU에서의 병렬처리를 이용한 모바일 기기에서의 다중뷰 스테레오 정합 (Multiview Stereo Matching on Mobile Devices Using Parallel Processing on Embedded GPU)

  • 전윤배;박인규
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.1064-1071
    • /
    • 2019
  • 다중뷰 스테레오 정합 알고리즘은 시점이 다른 복수의 2차원 영상으로부터 3차원 형상을 복원하기 위해 사용된다. 기존의 다중뷰 스테레오 정합 알고리즘은 단계별로 많은 계산량을 포함하는 복잡한 구조 때문에 고성능 하드웨어에서만 주로 구현되어왔다. 그러나 최근에 모바일 그래픽 프로세서가 발전하면서 충분한 부동소수점 계산 성능이 확보됨에 따라 기존의 PC 환경에서만 수행되었던 복잡한 컴퓨터 비전 알고리즘들이 모바일 GPU에서 구현되고 있다. 본 논문에서는 임베디드 보드의 모바일 GPU에서의 병렬처리를 기반으로 다중뷰 스테레오 알고리즘의 병렬처리를 구현하고 자원이 제한적인 하드웨어에서의 성능 최적화 기법을 제안한다.

ARM-Excalibur를 이용한 H.264/AVC 디코더의 HW/SW 병행 설계 (HW/SW co-design of H.264/AVC Decoder using ARM-Excalibur)

  • 정준모
    • 한국산학기술학회논문지
    • /
    • 제10권7호
    • /
    • pp.1480-1483
    • /
    • 2009
  • 본 논문에서는 H.264 및 AVC 디코더를 ARM-Excalibur를 이용하여 하드웨어(HW:Hardware)와 소프트웨어 (SW:Software)로 병행설계(co-design)하는 방법에 대해서 제안한다. 내장형 프로세서, 메모리, 주변장치 및 논리 회로들을 하나의 칩으로 집적한 SoC(System On-a-Chip)를 하드웨어와 소프트웨어로 분할하여 병행 설계(co-design)하는 방식이 새로운 설계 방법으로 대두되고 있다. 최적화된 분할 방법을 찾는 것이 매우 어렵기 때문에 설계 초기단계에서 빠르게 검증할 필요가 있는데 본 논문에서는 H.264 및 AVC 디코더를 알테라사의 ARM-Excalibur라는 칩을 이용하여 효율적으로 병행 설계하였으며 시스템의 동작속도가 크게 향상되는 것을 확인할 수 있었다.

Optimization of Pipelined Discrete Wavelet Packet Transform Based on an Efficient Transpose Form and an Advanced Functional Sharing Technique

  • Nguyen, Hung-Ngoc;Kim, Cheol-Hong;Kim, Jong-Myon
    • Journal of Information Processing Systems
    • /
    • 제15권2호
    • /
    • pp.374-385
    • /
    • 2019
  • This paper presents an optimal implementation of a Daubechies-based pipelined discrete wavelet packet transform (DWPT) processor using finite impulse response (FIR) filter banks. The feed-forward pipelined (FFP) architecture is exploited for implementation of the DWPT on the field-programmable gate array (FPGA). The proposed DWPT is based on an efficient transpose form structure, thereby reducing its computational complexity by half of the system. Moreover, the efficiency of the design is further improved by using a canonical-signed digit-based binary expression (CSDBE) and advanced functional sharing (AFS) methods. In this work, the AFS technique is proposed to optimize the convolution of FIR filter banks for DWPT decomposition, which reduces the hardware resource utilization by not requiring any embedded digital signal processing (DSP) blocks. The proposed AFS and CSDBE-based DWPT system is embedded on the Virtex-7 FPGA board for testing. The proposed design is implemented as an intellectual property (IP) logic core that can easily be integrated into DSP systems for sub-band analysis. The achieved results conclude that the proposed method is very efficient in improving hardware resource utilization while maintaining accuracy of the result of DWPT.

스크래치패드 메모리를 위한 데이터 관리 기법 리뷰 (A Review of Data Management Techniques for Scratchpad Memory)

  • 조두산
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.771-776
    • /
    • 2023
  • 스크래치패드 메모리는 소프트웨어 제어 온칩 메모리로서 기존의 캐시 메모리의 단점을 완화할 수 있게 설계되어 이용되고 있다. 기존의 캐시 메모리는 태그 관련 하드웨어 제어 로직이 있어 캐시 미스를 사용자가 직접 제어할 수 없으며, 사이즈가 크고 에너지 소모량이 상대적으로 많다. 스크래치패드 메모리는 이러한 하드웨어 오버헤드를 제거하였기 때문에 사이즈, 에너지 소모량에서 장점이 있으나 데이터 관리를 소프트웨어가 해야하는 부담이 존재한다. 본 연구에서는 스크래치패드 메모리의 데이터 관리 기법들을 분류하여 살펴보고 그 장점을 극대화할 수 있는 방안에 대하여 논의하였다.

Design of Projection Optical System for Target Imaging Simulator with Long Exit Pupil Distance

  • Xueyuan Cao;Lingyun Wang;Guangxi Li;Ru Zheng
    • Current Optics and Photonics
    • /
    • 제7권6호
    • /
    • pp.745-754
    • /
    • 2023
  • In order to test the recognition ability and accuracy of a target imaging simulator under the irradiation of solar stray light in a laboratory environment, it needs to be fixed on a five-axis turntable during a hardware-in-the-loop simulation test, so the optical system of the simulator should have a long exit pupil distance. This article adopts a secondary imaging method to design a projection optical system suitable for thin-film-transistor liquid crystal displays. The exit pupil distance of the entire optical system is 1,000 mm, and the final optimization results in the 400 nm-850 nm band show that the modulation transfer function (MTF) of the optical system is greater than 0.8 at the cutoff frequency of 72 lp/mm, and the distortion of each field of view of the system is less than 0.04%. Combined with the design results of the optical system, TracePro software was used to model the optical system, and the simulation of the target imaging simulator at the magnitude of -1 to +6 Mv was analyzed and verified. The magnitude error is less than 0.2 Mv, and the irradiance uniformity of the exit pupil surface is greater than 90%, which meets the requirements of the target imaging simulator.