An Energy Efficient and High Performance Data Cache Structure Utilizing Tag History of Cache Addresses

캐시 주소의 태그 이력을 활용한 에너지 효율적 고성능 데이터 캐시 구조

  • 문현주 (남서울대학교 컴퓨터학과) ;
  • 지승현 (한국고용정보원 정보화전략팀)
  • Published : 2007.02.28


Uptime of embedded processors for mobile devices are dependent on battery consumption. Especially the large portion of power consumption is known to be due to cache management in embedded processors. This paper proposes an energy efficient data cache structure for high performance embedded processors. High performance prefetching data cache issues prefetching instructions before issuing demand-fetch instructions based on reference predictions. These prefetching instruction bring reduction on memory delay by improving cache hit ratio, but on the other hand those increase energy consumption in proportion to the number of prefetching instructions. In this paper, we adopt tag history table on prefetching data cache for reducing energy consumption by minimizing parallel tag comparison. Experimental results show the proposed data cache improves performance on energy consumption as well as memory delay.

모바일 기기와 같이 배터리에 의존적인 시스템에서 사용되는 임베디드 프로세서는 총 소모 전력의 많은 부분을 캐시에서 소모한다. 본 논문에서는 임베디드 프로세서용 고성능 선인출 데이터캐시의 저전력화 방안을 연구하였다. 고성능 선인출 데이터캐시에서 메모리 참조명령의 수행에 앞서 참조예측의 결과로 발생하는 선인출 명령은 캐시 적중률을 높여 메모리 참조 시간을 단축하는 반면 선인출 명령의 수에 비례하여 전력 소모가 증가한다. 본 논문에서는 선인출 데이터캐시에 태그이력표(tag history table)를 구비하여 병렬태그탐색을 최소화함으로써 전력 소모를 줄이는 캐시 구조를 제안하였다. 실험을 통해 확인한 결과 제안한 데이터캐시 구조가 기존 데이터캐시 구조에 비하여 수행 시간과 전력 소모를 모두 줄일 수 있음을 확인하였다.



  1. T. Mudge, 'Power: A First-Class Architectural Design Constraint,' IEEE Computer, Vol.34, No.4, pp.52-58, Apr., 2001
  2. M. Baron, 'Analog and CPU Wizards Reduce Digital Power: National Semiconductor and ARM Increase Battery Life,' Microprocessor Report, Vol.7, No.1, pp.10-14, Jan., 2003
  3. A. Smith, 'Sequential Program Prefetching in Memory Hierarchies,' IEEE Computer, Vol.11, No.2, pp.7-21, 1978
  4. B. Mathew and A. Davis, 'An Energy Efficient High Performance Scratch-pad Memory System' Proceedings of the Design Automation Conference (DAC), 2004
  5. F. Dahlgren, M. Dubois and P. Stenstrom, 'Fixed and Adaptive Sequential Prefetching in Shared-memory Multiprocessors,' Proceedings of the International Conference on Parallel Processing, pp.56-63, Aug., 1993
  6. T. F. Chen and J. L. Baer, 'Effective Hardware-Based Data Prefetching for High Performance Processors,' IEEE Transactions on Computers, Vol. 44, No.5, pp.609-623, May, 1995
  7. D. Nicolaescu, Al. Veidenbaum and A. Nicolau, 'Reducing Power Consumption for High-Associativity Data Caches in Embedded Processors,' Proceedings of the conference on Design, Automation and Test in Europe, pp.11064-11069, Mar., 2003
  8. M. D. Hill, Dinero III Cache Simulator, 548/tools/dinero
  9. A. Srivastava and A. Eustace, 'ATOM: A System for Builing Customized Program Analysis Tools,' Proceedings of the ACM SIGPLAN 94, pp.196-205, 1994
  10. P. Shivakumar and N. P. Jouppi, 'CACTI 3.0: An Integrated Cache Timing, Power, and Area Model,' HP Western Research Labs, Tech Rep. 2001
  11. M. Zhang and K Asanovic, 'Highly-Associative Caches for Low-Power Processors,' 33rd International Symposium on Microarchitecture, pp.196-205, Dec., 2000
  12. W. T. Shiu, 'Memory Exploration for Low Power Embedded Systems', Proceedings of the 1999 IEEE International Symposium on Circuits and Systems, pp.250-253, May, 1999