• 제목/요약/키워드: Interleaved Memory

검색결과 8건 처리시간 0.02초

인터리빙 구조를 갖는 메모리의 스크러빙 기법 적용에 따른 신뢰도 해석 (Reliability Analysis of Interleaved Memory with a Scrubbing Technique)

  • 류상문
    • 제어로봇시스템학회논문지
    • /
    • 제20권4호
    • /
    • pp.443-448
    • /
    • 2014
  • Soft errors in memory devices that caused by radiation are the main threat from a reliability point of view. This threat can be commonly overcome with the combination of SEC (Single-Error Correction) codes and scrubbing technique. The interleaving architecture can give memory devices the ability of tolerating these soft errors, especially against multiple-bit soft errors. And the interleaving distance plays a key role in building the tolerance against multiple-bit soft errors. This paper proposes a reliability model of an interleaved memory device which suffers from multiple-bit soft errors and are protected by a combination of SEC code and scrubbing. The proposed model shows how the interleaving distance works to improve the reliability and can be used to make a decision in determining optimal scrubbing technique to meet the demands in reliability.

다중의 Add-compare-select 모듈을 갖는 병렬 비터비 알고리즘의 메모리 관리 방법 (A memory management scheme for parallel viterbi algorithm with multiple add-compare-select modules)

  • 지현순;박동선;송상섭
    • 한국통신학회논문지
    • /
    • 제21권8호
    • /
    • pp.2077-2089
    • /
    • 1996
  • In this paper, a memory organization and its control method are proposed for the implementation of parallel Virterbi decoders. The design is mainly focused on lowering the hardware complexity of a parallel Viterbi decoder which is to reduce the decoding speed. The memories requeired in a Viterbi decoder are the SMM(State Metric Memory) and the TBM(Traceback Memory);the SMM for storing the path metrics of states and the TBM for storing the survial path information. A general parallel Viterbi decoder for high datarate usually consists of multiple ACS (Add-Compare-Select) units and their corresponding memeory modules.for parallel ACS units, SMMs and TBMs are partitioned into smaller independent pairs of memory modules which are separately interleaved to provide the maximum processing speed. In this design SMMs are controlled with addrss generators which can simultaneously compute addresses of the new path metrics. A bit shuffle technique is employed to provide a parallel access to the TBMs to store the survivor path informations from multiple ACS modules.

  • PDF

Cycle-accurate NPU 시뮬레이터 및 데이터 접근 방식에 따른 NPU 성능평가 (Cycle-accurate NPU Simulator and Performance Evaluation According to Data Access Strategies)

  • 권구윤;박상우;서태원
    • 대한임베디드공학회논문지
    • /
    • 제17권4호
    • /
    • pp.217-228
    • /
    • 2022
  • Currently, there are increasing demands for applying deep neural networks (DNNs) in the embedded domain such as classification and object detection. The DNN processing in embedded domain often requires custom hardware such as NPU for acceleration due to the constraints in power, performance, and area. Processing DNN models requires a large amount of data, and its seamless transfer to NPU is crucial for performance. In this paper, we developed a cycle-accurate NPU simulator to evaluate diverse NPU microarchitectures. In addition, we propose a novel technique for reducing the number of memory accesses when processing convolutional layers in convolutional neural networks (CNNs) on the NPU. The main idea is to reuse data with memory interleaving, which recycles the overlapping data between previous and current input windows. Data memory interleaving makes it possible to quickly read consecutive data in unaligned locations. We implemented the proposed technique to the cycle-accurate NPU simulator and measured the performance with LeNet-5, VGGNet-16, and ResNet-50. The experiment shows up to 2.08x speedup in processing one convolutional layer, compared to the baseline.

Efficient Interleaving Schemes of Volume Holographic memory

  • Lee, Byoung-Ho;Han, Seung-Hoon;Kim, Min-Seung;Yang, Byung-Choon
    • Journal of the Optical Society of Korea
    • /
    • 제6권4호
    • /
    • pp.172-179
    • /
    • 2002
  • Like the conventional digital storage systems, volume holographic memory can be deteriorated by burst errors due to its high-density storage characteristics. These burst errors are used byoptical defects such as scratches, dust particles, etc. and are two-dimensional in a data page. To deal with these errors, we introduce some concepts for describing them and propose efficient two- dimensional interleaving schemes. The schemes are two-dimensional lattices of an error-correction code word and have equilateral triangular and square structures. Using these structures, we can minimize the number of code words that are interleaved and improve the efficiency of the system. For large size burst errors, the efficient interleaving structure is an equilateral triangular lattice. However, for some small size burst errors, it is reduced to a square lattice.

메모리 전송 효율을 개선한 programmable Fragment 쉐이더 설계 (A Design of Programmable Fragment Shader with Reduction of Memory Transfer Time)

  • 박태룡
    • 한국정보통신학회논문지
    • /
    • 제14권12호
    • /
    • pp.2675-2680
    • /
    • 2010
  • 3D 그래픽을 처리하는 연산 과정에는 고정적인 연산만을 수행하는 영역과 Shader 등과 같은 명령어에 의한 프로그래밍이 요구되는 영역이 구분되어 있다. 이러한 3D 파이프라인의 특성을 고려하여 fixed 구조로 설계한 graphics hardware와 명령어 기반의 programmable hardware를 혼합한 구조로 설계하면 효율적인 그래픽 처리가 가능하다. 본 논문에서는 이러한 혼합 구조에 적합한 OpenGL ES(Open Graphics Library Embedded System) 2.0을 지원하는 Fragment Shader를 설계하였다. fixed hardware와 Shader간 데이터 입출력으로 인해 발생할 수 있는 전체 파이프라인의 지연을 줄일 수 있도록 내부 인터페이스를 최적화하였으며 Shader 내부 레지스터 그룹을 interleaved 구조로 설계하여 레지스터 면적과 처리 속도를 개선하였다.

단순전력분석에 안전한 Signed Left-to-Right 리코딩 방법 (SPA-Resistant Signed Left-to-Right Receding Method)

  • 한동국;김태현;김호원;임종인;김성경
    • 정보보호학회논문지
    • /
    • 제17권1호
    • /
    • pp.127-132
    • /
    • 2007
  • 본 논문에서는 주어진 기수 ${\gamma}$ 표현법을 SPA에 안전하게 리코딩 하는 방법을 제안한다. 제안된 알고리즘들은 기존의 것들과는 달리, Left-to-Right 리코딩이 가능하도록 구성되어져 있기 때문에 최상위 비트부터 스캔하면서 스칼라 곱셈을 계산하는 알고리즘과 연동이 되어 질 경우, 추가 메모리 없이 쉽게 구현된다는 장점이 있다. 따라서 Left-to-Right리코딩 기법들은 메모리의 제약을 받는 장비인 스마트 카드, 센서 노드에 적합하다.

채널 등화기를 내장한 2.0GS/s 5비트 전류 모드 ADC 기반 수신기 (A 2.0-GS/s 5-b Current Mode ADC-Based Receiver with Embedded Channel Equalizer)

  • 문종호;정우철;김진태;권기원;전영현;전정훈
    • 전자공학회논문지
    • /
    • 제49권12호
    • /
    • pp.184-193
    • /
    • 2012
  • 본 논문에서는 고속 직렬 링크에 사용할 수 있는 5비트 2.0GS/s 2-way time interleaved 파이프라인 ADC 기반의 수신기를 소개한다. 샘플링 주파수를 높이기 위해, ADC 각 단은 트랙킹과 증폭이 동시에 수행되는 전류 모드 구조를 사용하였다. 또한 ADC 각단에 1-tap FIR 등화기를 탑재하여 별도의 디지털 후처리 없이 채널의 ISI를 감소시켰다. 제안한 수신기는 110nm 공정을 사용하여 설계하였다. 메모리를 제외한 수신기는 $0.58{\times}0.42mm^2$의 크기를 갖고, 동작전압 1.2V에서 91mW의 전력을 소모한다. 시뮬레이션 결과 2.0GS/s 샘플링 주파수에서 20MHz의 입력 주파수와 Nyquist 주파수인 1.0GHz 입력신호에 대하여 동일하게 26.0dB의 SNDR과 4.0비트의 ENOB특성을 확보하였다.

큐 분리 및 패킷 분할을 이용한 효율적인 점보패킷 스케쥴링 방법 (Effective Scheduling Algorithm using Queue Separation and Packet Segmentation for Jumbo Packets)

  • 윤빈영;고남석;김환우
    • 한국통신학회논문지
    • /
    • 제28권9A호
    • /
    • pp.663-668
    • /
    • 2003
  • 고속 네트워킹 기술 발전과 더불어 대용량의 데이터 처리는 컴퓨터의 CPU 사이클을 많이 소모하므로 컴퓨터의 성능을 저하시킨다. 따라서 고속의 네트워크 환경에서 컴퓨터 성능을 향상시키기 위해서는 데이터 처리로 소모되는 컴퓨터의 CPU 사이클을 최대한 억제해야 한다. 이러한 방법 중의 하나가 점보그램과 점보프레임 같은 패킷 길이가 긴 점보패킷을 사용하는 것이다. 그러나 점보패킷이 전달 지연에 민감한 VoIP 패킷들과 동시에 처리되는 경우 이 들 서비스에 질적인 저하를 가져올 수 있다. 뿐만 아니라, 심각한 패킷 손실이 발생된다. 본 고에서는 점보패킷을 수용하는 경우에도 기존의 일반 패킷 전단 지연 및 손실을 거의 동일하게 유지시킬 수 있는 스케쥴링 방법을 제안한다.