• 제목/요약/키워드: 선인출

검색결과 49건 처리시간 0.027초

임베디드 프로세서를 위한 선인출 데이터캐시의 저전력화 방안 (Reducing Power Consumption of Data Caches for Embedded Processors)

  • 문현주;지승현
    • 전자공학회논문지CI
    • /
    • 제44권1호
    • /
    • pp.1-9
    • /
    • 2007
  • 임베디드 프로세서는 총 에너지소모량 가운데 대략 40% 이상을 캐시에서 소모하고 있으므로 에너지-효율적 고성능 데이터 캐시 구조를 필요로 한다. 본 논문에서는 임베디드 프로세서를 위한 저전력 선인출 데이터캐시 구조를 제안하였다. 제안한 데이터캐시 구조는 선인출장치(prefetching unit)를 포함한 기존 데이터캐시 구조에 태그히스토리 테이블(tag history table)을 구비함으로써 요구인출 및 선인출시 발생하는 태그메모리 병렬탐색 횟수를 감소시켰다. 이와 같은 전략적인 캐시 구조는 적은 하드웨어 비용으로 병렬탐색을 위한 전력소모를 현저히 줄일 수 있다. 실험을 통하여 제안한 데이터캐시 구조가 기존 선인출 데이터캐시 구조와 동일한 성능을 유지하면서 낮은 전력을 요구함을 확인하였다.

미디어 데이터의 빠른 참조를 위한 캐시 운영 전략 (A Cache Managing Strategy for Fast Media Data Access)

  • 문현주;김석일
    • 정보처리학회논문지A
    • /
    • 제11A권1호
    • /
    • pp.11-20
    • /
    • 2004
  • 스트리밍 형태로 처리되는 멀티미디어 응용 데이터는 공간적 지역성은 큰 대신 시간적 지역성이 낮은 특징이 있다. 이 논문에서는 멀티미디어 응용 데이터에 내재된 메모리 참조의 규칙성을 활용하는 동적 선인출 기법을 제안하였다. 제안된 기법은 배열을 작은 블록으로 나누어 블록별로 계산을 수행하는 응용 프로그램의 경우에 기존의 방법과 비교하여 선인출 에러를 크게 줄일 수 있다. 여러 가지 미디어 벤치마크에 대한 실험 결과, 제안된 기법이 기존의 선형 선인출 기법에 비하여 예측의 정확도가 높고 성능이 우수함을 확인하였다.

스트라이드 배열 병합 방법의 데이터 선인출 효과 (Data Prefetching Effect of the Stride Merging-Arrays Method)

  • 정인범;이준원
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권11호
    • /
    • pp.1429-1436
    • /
    • 1999
  • 데이타들에 대한 선인출 효과를 얻기 위하여 캐쉬 메모리의 캐쉬 블록은 다중 워드로 구성된다. 그러나 선인출된 데이타들이 사용되지 않을 경우 캐쉬 메모리가 낭비되고 따라서 캐쉬 실패율이 증가한다. 데이타 배열 병합 방법은 캐쉬 실패 원인의 하나인 캐쉬 충돌 실패를 감소시키기 위하여 사용되고 있다. 그러나 기존의 배열 병합 방법은 유용하지 못한 데이타들을 캐쉬 블록에 선인출하는 현상을 보인다. 본 논문에서는 이러한 현상을 개선한 스트라이드 배열 병합을 제안한다. 모의시험에서 캐쉬 블록이 다중 워드로 구성된 경우 스트라이드 배열 병합은 캐쉬 충돌 실패를 감소시킬 뿐 만 아니라 유용한 데이타 선인출을 증가 시키므로 캐쉬 성능을 향상시킴을 보여준다. 또한 이렇게 향상된 캐쉬 성능은 프로세서 증가에 따른 확장성 있는 프로그램 성능을 나타낸다.Abstract The cache memory is composed of cache lines with multiple words to achieve the effect of data prefetching. However, if the prefetched data are not used, the spaces of the cache memory are wasted and thus the cache miss rate increases. The data merging-arrays method is used for the sake of the reduction of the cache conflict misses. However, the existing merging-arrays method results in the useless data prefetching. In this paper, a stride merging-arrays method is suggested for improving this phenomenon. Simulation results show that when a cache line is composed of multiple words, the stride merging-arrays method increases the cache performance due to not only the reduction of cache conflict misses but also the useful data prefetching. This enhanced cache performance also represents the more scalable performance of parallel applications according to increasing the number of processors.

이차원 블록 구조에 근거한 선인출 기법 (A Multimedia Data Prefetching Based on 2 Dimensional Block Structure)

  • 김석주
    • 한국멀티미디어학회논문지
    • /
    • 제7권8호
    • /
    • pp.1086-1096
    • /
    • 2004
  • 스트리밍 데이터를 다루는 멀티미디어 응용의 경우 캐시 관리 측면에서 데이터의 시간적 지역성이 약하여 캐시의 효율이 감소하게 된다. 이는 캐시에 적재된 데이터가 대부분 다시 사용되지 않고 바뀌게 됨을 의미한다. 반면에 이러한 데이터들은 참조 명령에 따른 규칙적인 접근 패턴을 갖고 있는 경우가 많다. 이 논문에서는 약한 시간적 지역성을 나타내는 멀티미디어 응용 데이터에서도 통상적으로 내재된 메모리 참조의 규칙성을 적극적으로 활용하기 위해 동적 등차 참조 선인출 기법의 기능과 함께 이차원 배열 형식(블록)을 찾을 수 있는 방법을 제안한다. 제안된 방법은 블록 구조를 인식하고 이에 따라 선인출 주소를 계산 하므로 블록 참조 예측 기법 (BRPT: block-reference-prediction-technique)이라고 명한다. BRPT는 새로운 규칙으로 인해 선인출 기구가 더 복잡하지만 블록 패턴이 많은 응용의 경우 메모리 참조 시간을 크게 줄이는 것을 확인하였다.

  • PDF

PMS: 모바일 임베디드 시스템의 소프트웨어 스트리밍 서비스를 위한 확률 기반 다중 접근 블록 선인출 알고리즘 (PMS: Probability-based Multi Successor Prefetch Algorithm for Software Streaming Services of Mobile Embedded Devices)

  • 이영재;박선영;박은지;이대우;정욱;김진수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권5_6호
    • /
    • pp.238-248
    • /
    • 2007
  • 최근 PDA의 대중화, 텔레메틱스 산업의 발전에 따라 제한된 저장장치를 갖는 모바일 임베디드 시스템에서 PC와 같은 다양한 소프트웨어를 사용하고자하는 수요가 늘어나고 있다. 그에 따라 소프트웨어 스트리밍 서비스의 필요성이 증가하고 있으나 소프트웨어를 속도가 느린 무선 네트워크를 통해 블록단위로 전송받아 실행속도가 느린 문제점이 있다. 그리하여 이를 보완해주는 선인출 알고리즘이 필요하다. 본 논문에서는 기존에 연구된 선인출 알고리즘인 최근 접근 블록 알고리즘(LS)과 PPM 기반 알고리즘을 소프트웨어 스트리밍 서비스에 적용시켜 성능을 측정하고 분석한 결과를 토대로 고안된 확률 기반 다중 접근 블록(PMS) 알고리즘을 제안한다. LS의 적중률은 60%정도로 낮지만 메모리 사용량이 적다. 그에 반해 PPM 기반 알고리즘은 메모리 사용량은 많지만 96%이상의 높은 적중률을 보인다. PMS는 블록 단위의 소프트웨어 스트리밍 서비스의 특징과 PPM 기반 알고리즘의 특성을 이용하여 LS의 단점을 보완해 N개의 접근 블록을 확률을 기반으로 저장하고 선인출에 이용한다. 이러한 PMS는 보다 적은 공간오버헤드를 가지면서 PPM 기반 알고리즘과 비슷한 적중률을 나타내 높은 메모리 효율을 나타낸다.

M-RPT: 데이터의 주소 간격을 이용한 적극적인 캐시 선인출 방법 (An Eager Cache Prefetching Scheme Using Stride between Successive Data Reference)

  • 전영숙;문현주;전중남;김석일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.217-219
    • /
    • 2003
  • 멀티미디어 응용 프로그램은 방대한 양의 데이터를 실시간으로 고속 처리해야 한다. 적재/저장과 같은 메모리 참조 명령어는 프로세서의 고속 수행에 방해가 되는 주요인이다. 본 논문에서는 메모리 참조 속도를 향상시키기 위해 멀티미디어 데이터의 주소간격이 규칙적으로 참조되는 특성을 활용하여 다음에 참조될 데이터를 미리 캐시로 선인출 함으로써 실행시 캐시 미스율을 줄이고 또한 전체 수행시간을 줄이는 효과적인 방법을 제안한다. 제안한 방법은 캐시 미스율을 줄이는 방법으로서 데이터 선인출 기법을 사용하는데 주소간격을 이동한 기존 연구들에 비해 캐시 미스율에 있어서 평균적으로 27%향상되었다.

  • PDF

스트리밍 데이터의 선인출에 사용되는 참조예측표 교체 전략 (A Replacement Strategy for Reference Prediction Table Used in Prefetching Streaming Data)

  • 임철후;김석일;전중남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.135-138
    • /
    • 2003
  • 멀티미디어 응용프로그램은 처리데이터를 참조할 때 대부분 간격이 일정한 스트리밍 패턴으로 참조한다. 이 특성을 선인출 방법에 적용하여 멀티미디어 응용프로그램의 성능을 항상 시킬 수 있다. 이 논문에서는 하드웨어기반의 규칙 선인출 방법에서 참조예측표에 운영하는 방법을 제안한다. 크기가 제한되어 있는 참조예측표에 메모리 참조 명령어를 추가할 때 주소간격이 0인 행을 우선적으로 제거함으로써 비용절감의 효과를 가져올 수 있다. 실험 결과 제안한 방법과 기존의 참조예측표를 FIFO 방식으로 운영하는 방법을 비교할 때 제안한 방법의 경우 참조예측표의 크기를 반으로 줄여도 거의 같은 효과를 볼 수 있었다.

  • PDF

클러스터 기반 웹 서버에서 실제 서버간 효율적인 선인출 기법 (Efficient Back-end Prefetching Scheme in Cluster-based Web Servers)

  • 박선영;박도현;이준원;조정완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.532-534
    • /
    • 2001
  • 인터넷 사용자가 급속히 증가함에 따라 웹 서비스에 대한 사용자 요구도 증가하고 있다. 최근 연구되고 있는 클러스터 기반 웹 서버는 많은 웹 사용자 요구를 안정적으로 처리할 수 있는 기술로 소개되고 있다. 클러스터 기반 웹 서버는 여러 대의 서버 노드로 구성되어 있는데 각 서버 노드에 들어오는 사용자 요구에 관한 자료가 지역 메모리에 없는 경우, 디스크 접근이나 다른 서버 노드로부터의 자료 전송이 필요하다. 본 논문에서는 클러스터 기반 웹 서버에서 서비스 지연을 감소시키기 위한 서버 노드간 자료 선인출 기법을 제안한다. 즉, 사용자 요구가 들어왔을 때, 다음에 요구될 데이터를 예측하고 각 서버의 지역 메모리에 필요한 자료를 미리 읽어 놓음으로 해서 서비스 지연 시간을 감소시키는 것이다. 모의 실험을 통해 본 논문에서 제안하는 세 가지 알고리즘의 성능을 측정한 결과, 각 자료의 접근 확률(access probability)과 사용자 요구 사이의 지연 시간을 고려하는 선인출 알고리즘인 TAP$^2$(Time and Access Probability-based Prefetch) 방법이 가장 좋은 성능을 보였다. 서비스 지연 시간은 각 서버 노드의 지역 메모리 크기를 작게 하였을 경우(8MB)에 약 20.1%정도 감소된다.

데이타 캐시의 활용도를 높이는 동적 선인출 필터링 기법 (Dynamic Prefetch Filtering Schemes to enhance Utilization of Data Cache)

  • 전영숙;김석일;전중남
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권1호
    • /
    • pp.30-43
    • /
    • 2008
  • Load/store와 같은 메모리 참조 명령어는 프로세서의 고속 수행을 방해하는 주요인이다. 캐시 선인출 기법은 메모리 참조에 따른 지연시간을 줄이는 효과적인 방법이다. 그러나 너무 적극적으로 선인출 할 경우에 캐시 오염을 유발시켜 선인출에 의한 장점을 상쇄시킨다. 본 연구에서는 캐시의 오염을 줄이기 위해 동적으로 필터 테이블을 참조하여 선인출 명령을 수행할 지의 여부를 결정하는 네 가지 필터링 기법들을 비교 평가한다. 먼저 기존 연구에서의 문제점을 분석하기 위해 이진 상태 기법을 보였는데, 이 기법은 기존 연구와 같이 N:1 매핑을 사용하는 반면, 각 엔트리의 값을 1비트로 하여 두 가지 상태값을 갖도록 하였다. 비교 연구를 위해 완전 상태 기법을 제시하여 비교 기준으로 사용하였다. 마지막으로 본 논문의 주 아이디어인 정교한 필터링을 위한 블록주소 참조 기법을 제안하였다 이 기법은 이진 상태 기법과 같은 테이블 길이를 가지며, 각 엔트리의 내용은 완전 상태 기법과 같은 항목을 가지도록 하여 최근에 미 사용된 데이타의 블록주소가 필터 테이블의 하나의 엔트리와 대응되도록 1:1 매핑을 하였다. 일반적으로 많이 사용되는 일반 벤치마크 프로그램과 멀티미디어 벤치마크 프로그램들에 대하여 실험한 결과, 제안한 블록주소 참조 기법(BAL)이 기존 연구인 동적 필터 기법(2-bitSC)과 비교하여 캐시 미스율이 10.5% 감소하였다.

객체관계형 DBMS에서 타입수준 액세스 패턴을 이용한 선인출 전략 (Prefetching based on the Type-Level Access Pattern in Object-Relational DBMSs)

  • 한욱신;문양세;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.529-544
    • /
    • 2001
  • 선인출은 데이타베이스 관리 시스템에서 클라이언트와 서버 사이에 발생하는 라운드트립을 줄 일 수 있는 효과적인 방법이다. 본 논문에서는 타입수준 액세스 패턴과 타입수준 지역성이라는 새로운 개 념을 제시하고, 이 개념에 기반한 새로운 선인출 방법을 제시한다. 타입수준 액세스 패턴이란 항해에 사 용된 애트리뷰트들의 패턴이며, 타입수준 엑세스 지역성이란 항해 응용에서 타입수준 액세스 패턴이 반복 적으로 나타나는 현상이다. 기존의 선인출 방법은 항해 응용에서 액세스된 객체 흑은 페이지 식별자들간의 패턴인 객체수준 혹은 페이지수준 액세스 패턴을 선인룰에 이용하는데, 이 방법은 동일한 객체 혹은 페이 지들이 반복적으로 액세스될 때에만 선인출 효과를 가지는 문제점이 있다. 이에 반해 제안하는 방법은 항 해 응용에서 같은 객체들이 반복적으로 액세스되지 않더라도 같은 애트리뷰트들이 반복적으로 참조되는 경우. 즉, 타입수준 액세스 지역성이 존재하면, 효과적인 선인출을 수행하는 장점이 있다 객체관계형 DHMS(ORDBMS)의 많은 항해 응용들은 타입수준 액세스 지역성이 있다 따라서, 제안하는 방법을 ORDBMS에 적용하면 라운드트립의 횟수를 효과적으로 줄일 수 있고 성능을 크게 향상시킬 수 있다. 제 안하는 방법의 우수성을 증명하기 위해, ORDBMS 프로토타입에 구현하여 많은 종류의 실험을 수행하였 다. 실험결과, 복잡한 구조를 탐색하는 007 벤치마크나 실제 GIS 응용에서, 제안하는 선인출 방법은 단순 한 요구인출 방법 및 최근의 문맥 기반 선인출 방법과 비교하여 라운드트림 횟수를 수십 배에서 수백배가 지 줄이고 성능을 수배가지 향상시켰다. 이와 같은 결과로 볼 때, 제안하는 방법은 객체지향 항해 응용의 성능을 크게 향상시키는 결과로서, 상용 ORDBMS에 구현될 수 있는 실용적인 결과라 믿는다.

  • PDF