A Novel Globally Asynchronous, Locally Dynamic System Bus Architecture Based on Multitasking Bus

다중처리가 가능한 새로운 Globally Asynchronous, Locally Dynamic System 버스 구조

  • Published : 2008.05.25

Abstract

In this paper, we propose a novel Globally Asynchronous, Locally Dynamic System(GALDS) bus and demonstrate its performance. The proposed GALDS bus is the bidirectional multitasking bus with the segmented bus architecture supporting the concurrent operation of multi-masters and multi-slaves. By analyzing system tasks, the bus architecture chooses the optimal frequency for each If among multiples of bus frequency and thus we can reduce the overall power consumption. For efficient data communications between IPs operating in different frequencies, we designed an asynchronous and bidirectional FIFO based on an asynchronous wrapper with hand-shaking interface. In addition, since systems can be easily expandable by inserting bus segments, the proposed architecture has advantages in IP reusability and structural flexibility As a test example, a four-segment bus haying four masters and four slaves were designed by using Verilog HDL. We demonstrate multitasking operations with read/write data transfers by simulation when the ratios of operation frequency are 1:1, 1:2, 1:4 and 1:8. The data transfer mode is a 16 burst increment mode compatible with Advanced Microcontroller Bus Architecture(AMBA). The maximum operation latency of the proposed GALDS bus is 22 clock cycles for the bus write operation, and 44 clock cycles for read.

본 논문에서는 새로운 On-Chip 버스로 다중처리 기반의 GALDS 버스 구조를 제안하였고 성능을 검증하였다. 제안된 GALDS 버스 구조는 멀티 마스터 멀티 슬레이브의 다중 처리를 지원하는 세그먼트(segment) 기반의 고성능의 양방향 다중처리 버스 구조(bi-direction multitasking bus architecture)이다. 또한, 시스템의 태스크(task) 분석에 의해서, 버스는 버스 동작 주파수의 배수 값을 갖는 주파수 사이에서 각각의 IP에 최적화된 동작 주파수를 선택하기 때문에 전체 전력 소모를 줄일 수 있다. 서로 다른 동작 주파수를 입력받은 IP들 간의 효율적인 데이터 통신을 위하여, 본 구조에서는 비동기 양방향 FIFO를 기반으로 하는 비동기 Wrapper 설계하였다. 또한, 버스 세그먼트의 추가만으로 시스템의 쉬운 확장이 가능하기 때문에, 제안된 구조는 IP 재사용 및 구조적 변경이 용이한 장점을 갖는다. 제안된 버스의 검증을 위해 4-마스터/4-슬레이브를 가지는 4-세그먼트의 버스와 비동기 Wrapper를 Verilog HDL을 이용하여 구현하였다. 버스의 다중처리동작 검증은 버스와 IP의 동작 주파수 비가 1:1, 1:2, 1:4, 1:8인 경우를 기준으로 시뮬레이션을 통해 마스터 IP에서 슬레이브 IP 사이의 데이터 읽기 및 쓰기 전송 동작을 확인하였다. 데이터 전송은 Advanced Microcontroller Bus Architecture(AMBA)과 호환 가능한 16 Burst Increment 모드로 하였다. 제한된 GALDS 버스의 최대 동작 지연시간은 쓰기 동작 시 22 클럭, 읽기 동작 시 44 클럭으로 확인되었다.

Keywords

References

  1. Krstic, M.; Grass, E.; Gurkaynak, F.K.; Vivet, P, 'Globally Asynchronous, Locally Synchronous Circuits: Overview and Outlook', IEEE Design & Test of Computers, vol 24, no 5, pp430 - 441, Sept.-Oct. 2007 https://doi.org/10.1109/MDT.2007.164
  2. P. Teehan, M. Greenstreet, and G. Lemieux, 'A Survey and Taxonomy of GALS Design Styles', IEEE Design & Test of Computers, Volume 24, Issue 5, pp418 - 428, Sept.-Oct. 2007 https://doi.org/10.1109/MDT.2007.151
  3. T. Seceleanu, J. Plosila, P. Liljeberg, 'On-Chip Segmented Bus: A Self-Timed Approach', 15th Annual IEEE International ASIC/SOC Conference, pp216 - 220, 25-28 Sept. 2002
  4. G. Magkilis, G. Semeraro, D. Albonesi, S. Dropsho, S. Dwarkadas, and M. Scott, 'Dynamic Frequency and Voltage Scaling for a Multiple- clock-domain Microprocessor,' IEEE Micro, vol. 23, no. 6, pp. 62-68, Nov. 2003 https://doi.org/10.1109/MM.2003.1261388
  5. Atanu Chattopadhyay and Zeljko Zilic, 'GALDS:A Complete Framework for Designing Multiclock ASICs and SoCs,' IEEE Trans. on VLSI Syst., vol. 13, no 6, pp641 - 654, June 2005 https://doi.org/10.1109/TVLSI.2005.848825
  6. Kulmala, A., Hamalainen, T.D., Hannikainen, M., 'Comparison of GALS and Synchronous Architectures with MPEG-4 Video Encoder on Multiprocessor System-on-Chip FPGA', Digital System Design: Architectures, Methods and Tools, 2006. DSD 2006. 9th EUROMICRO Conference, pp83 - 88, 2006
  7. Kenneth Y. Yun, Ryan P. Donohue, 'Pausible Clocking: A First Step Toward Heterogeneous Systems' Computer Design: VLSI in Computers and Processors, 1996. ICCD '96, pp118 - 123, 7-9 Oct. 1996
  8. M. Krstic, E. Grass, C. Stabl and M.Piz, 'System integration by request-driven GALS design', IEE Proc.-comput. digit. Tech., Vol. 153, No.5, pp362 - 372, Sep 2006 https://doi.org/10.1049/ip-cdt:20050210
  9. A. R. Ravi, 'Globally-Asynchronous, Locally- Synchronous Wrapper Configurations for Point- to-Point and Multi-Point Dara Communication,' B.E. Banfalore University, 2001
  10. ARM Ltd. AMBATM Specification, Rev 2.0. Reference Nr ARM IHI0011A, May 13, 1999