고성능 32-bit DSP 코프로세서의 아키텍쳐 개발

Development of a High-performance DSP Coprocessor Architecture

  • 윤성철 (연세대학교 전기전자공학과) ;
  • 김상욱 (연세대학교 전기전자공학과) ;
  • 배성일 (연세대학교 전기전자공학과) ;
  • 강성호 (연세대학교 전기전자공학과) ;
  • 김용천 (삼성전자 CalmRISC 팀) ;
  • 정승재 (삼성전자 CalmRISC 팀) ;
  • 김상우 (삼성전자 CalmRISC 팀) ;
  • 문상훈 (삼성전자 CalmRISC 팀)
  • 발행 : 2002.02.01

초록

이 논문은 저전력 마이크로 컨트롤러의 coprocessor로 동작하는 고성능 DSP의 아키텍쳐 구조를 제안한다. 제안된 DSP 아키텍쳐는 DSP 응용 분야의 기본 수식인 곱의 합을 고속으로 수행할 수 있도록 MAC(Multiply and Accumulate) 유닛 두 개를 갖는 dual MAC 아키텍쳐 구조이면서, 곱셈기와 덧셈기를 병렬적으로 배치시킨 특징을 갖는다. 그리고 한번에 최대 3개의 명령어를 동시에 수행할 수 있으면서도 명령어 길이는 31 비트로 고정된 3웨이 수퍼스칼라 구조를 갖는다. 현재 상용되고 있는 세 개의 DSP들과 의 벤치마크 결과, 제안된 DSP 구조가 가장 좋은 성능을 보여주었다. 또한, 특정 알고리듬에 대해서 성능이 같아도 메모리 사용량에 있어 효율적인 구조라는 것을 보여준다.

A new high-performance DSP architecture is proposed, which behaves as a coprocessor of a 32bit microcontroller. Because the proposed DSP architecture is a dual MAC(Multiply and Accumulate) DSP architecture, it can process efficiently a number of SOP(sum of product) operations used in many DSP applications. In order to efficiently perform other operations such as pure additions without any restriction, a MAC is composed of a multiplier and a ALU placed in parallel. In addition, it is a 3-way superscalar architecture, which can issue 3 instructions at a time. The benchmark results with 3 thor dual MAC DSPs show that the proposed DSP has the best performance. Futhermore, it is proven that the proposed DSP is more efficient in memory usage, although the performance is comparable in some algorithms such as Viterbi decoding and FFT butterfly.

키워드

참고문헌

  1. K.-M. Lim, S.-W. Jeong, Y.-C. Kim, S.-J. Jeong, H.-K. Kim, Y.-H.Kim, B.-Y. Chung, and H.-L. Roh, 'CalmRISCTM : A Low Power Microcontroller with Efficient Coprocessor Interface', Proc. Intl Conf. Computer Design(ICCD), pp 299-302, October 1999
  2. TeakTMDSP Core Architecture Spec.
  3. DSP16000 Reference Guide
  4. M. Alidina, G. Burns, C. Holmqvist, E. Morgan, D. Rhodes, S. Simanapalli, M. Thierbach, 'DSP16000 : a high performance, low-power dual-MAC DSP core for communications applications', Custom Integrated Circuits Conference(CICC), pp119-122, 1998 https://doi.org/10.1109/CICC.1998.694919
  5. TMS320C55x DSP CPU Reference Guide
  6. Seshan, N., 'High VelociTI processing [Texas Instruments VLIW DSP architecture]', IEEE Signal Processing Magazine , Volume: 15 Issue : 2 , pp86-101, 117, March 1998 https://doi.org/10.1109/79.664702
  7. Simar, R., Jr., 'Codevelopment of the TMS320C6X VelociTI architecture and compiler', Acoustics, Speech and Signal Processing, 1988. Proceedings of the 1988 IEEE International Conference on , pp3145-3148 vol.5, 1998 https://doi.org/10.1109/ICASSP.1998.678193