• 제목/요약/키워드: 데이터 프리패치

검색결과 10건 처리시간 0.024초

프리패치 기법을 적용한 T.트리 인덱스 구조 (T-Tree Index Structures Utilizing Prefetch Methods)

  • 이익훈;심준호
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.119-131
    • /
    • 2009
  • 최근 전자상거래 환경에서 실시간 트랜잭션 처리가 필요한 환경들이 많아지고 있다. 이동 통신, 금융시장 환경에서 빠른 실시간 트랜잭션 처리 지원을 위한 메인메모리 데이터베이스에 대한 연구와 구축이 많아졌다. 빠른 트랜잭션 지원을 위한 인덱싱 기법에 대한 연구로는 최근 마이크로 프로세서의 구조와 기능을 이용하여 캐시미스 수를 줄이거나 캐시 미스 발생시에 데이터 접근 지연시간을 줄이기 위한 방법들에 대한 연구가 수행되고 있다. 본 논문은 최근 마이크로 프로세서에서 지원하고 있는 프리패치 기법을 이용하여 캐시 미스 시에 데이터 접근 지연시간을 줄이는 트리인덱스 프리패치 기법을 제안한다. 또한 프리패치 기법에 효과적인 pCST-트리 인덱스 구조를 제안하고 실험을 통해 제안한 트리의 우수성을 제시한다.

  • PDF

Resolving Memory Bottlenecks in Hardware Accelerators with Data Prefetch

  • Hyein Lee;Jinoo Joung
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.1-12
    • /
    • 2024
  • 최근 다양한 분야에서 딥러닝이 사용되면서, 더 빠르고 정확한 결과를 내는 딥러닝이 더욱 중요해졌다. 이를 위해서는 많은 양의 저장 공간이 필요하고, 대용량 연산을 진행해야 한다. 이에 따라 여러 연구는 빠르고 정확하게 연산 처리가 가능한 하드웨어 가속기를 이용한다. 하지만 하드웨어 가속기는 CPU와 하드웨어 사이를 이동하면서 병목현상이 발생하게 된다. 따라서 본 논문에서는 하드웨어 가속기의 병목현상을 효율적으로 줄일 수 있는 데이터 프리패치 전략을 제안한다. 데이터 프리패치 전략의 핵심 아이디어는 Matrix Multiplication Unit(MMU)가 연산을 진행하는 동안 다음 연산에 필요한 데이터를 예측하여 로컬 메모리로 올려 병목현상을 줄인다. 또한, 이 전략은 듀얼 버퍼를 이용하여 읽고 쓰는 두 가지 동작을 동시에 진행하여 처리율을 높인다. 이를 통해 데이터 전송의 지연시간 및 실행 시간을 감소시킨다. 시뮬레이션을 통해 듀얼 버퍼를 이용한 병렬 프로세싱과 데이터 프리패치를 이용한 메모리 간 병목현상을 최대한 감소시켜 하드웨어 가속기의 성능이 24% 향상함을 알 수 있다.

고성능 데이터 캐시 메모리 구조 (High Performance Data Cache Memory Architecture)

  • 김홍식;김정길
    • 한국산학기술학회논문지
    • /
    • 제9권4호
    • /
    • pp.945-951
    • /
    • 2008
  • 공간적 지역성(spatial locality) 및 시간적 지역성(temporal locality)을 동시에 향상시킬 수 있는 새로운 고성능 데이터 캐시 구조를 제안한다. 제안된 캐시 메모리는 하드웨어 프리패치 유닛과 큰 블록 크기를 갖는 직접사상(DM: direct mapped) 캐시와 작은 블록 크기를 갖는 완전 사상(FA: fully associative) 캐시의 하위 캐시 유닛으로 구성된다. 공간적 지역성은 블록 데이터를 패치하여 직접 사상 캐시에 저장함으로써 보장되며, DM 캐시 히트가 발생한 경우에 그 이웃 데이터 블록을 프리패치 함으로써 최적화 된다. 시간적 지역성은 작은 블록 데이터가 DM 캐시로부터 제거 될때 그 블록의 과거 기록에 따라서 중요한 데이터는 완전사상 캐시에 저장함으로써 보장된다. Spec2000 벤치 마크 프로그램에 대한 실험 결과에 의하면 제안된 캐시 구조는 비슷한 크기의 직접사상 캐쉬, 4웨이 연관사상(4 way set associative cache) 및 SMI(selective-mode intelligent cache) 캐쉬 [8]등의 기존의 구조에 비해서 미스 비율(miss rate)을 평균적으로 $12.53\sim23.62%$ 그리고 AMAT(average memory access time)를 평균적으로 $14.67\sim18.60%$ 줄일 수 있음을 증명하였다.

낮은 대역폭을 갖는 이동 단말기에서 멀티미디어 프리젠테이션을 재생하기 위한 프리패치 방법 (A Study on the Prefetch Method for Multimedia Presentations to play on the Low Bandwidth Mobile Devices)

  • 홍마리아;양혁;임영환
    • 인터넷정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.65-74
    • /
    • 2003
  • 최근 이동단말기로 멀티미디어 데이터를 서비스 받는 사례가 증가하고 있다. 그러나 이동단말기는 저장공간이나 주 메모리가 부족하여 멀티미디어 데이터를 한꺼번에 다운로드 받는 것이 쉽지 않으므로 스트리밍 형태로 서비스를 받는 것이 일반적이다. 이러한 스트리밍 서비스는 정해진 시간 안에 지속적으로 데이터가 전송되어야 끊이지 않게 서비스를 받을 수 있다. 따라서 이 논문에서는 멀티미디어 프리젠테이션을 협소한 저장 공간을 갖는 이동단말기에서 재생이 가능할 수 있도록 하기 위한 여러 가지 기법을 제안하고자 한다. 먼저 프리젠테이션이 이동단말기에서 재생이 가능한지 파악하는 프리젠테이션 영역 분할 기법과 재생가능성 분석기법을 통해 재생여부를 분석한다. 만약 이 분석 시에 재생이 불가능한 멀티미디어 프리젠테이션이 있다면 EPOB(End point or over Bandwidth)지점을 이용한 선인출(prefetch)기법을 적용한다. 이 기법은 선인출을 통해서 멀티미디어 프리젠테이션들을 사용자 QoS를 유지시키며 재생이 가능하도록 해준다. 즉, 선인출 스케줄링 기법을 통해서 각각의 프리젠테이션들이 선인출하는 시점과 데이터의 양을 지정해 줌으로서 원활한 멀티미디어 프리젠테이션을 재생 할 수 있도록 제안하였다.

  • PDF

미쓰비시의 MCCS측정기, 품질표준화를 위한 과정

  • 대한인쇄문화협회
    • 프린팅코리아
    • /
    • 제7권9호
    • /
    • pp.113-113
    • /
    • 2008
  • PPC 서버는 CIP3/4에 따른 프리프레스장비에 의해 생성된 미리보기 이미지를 통하여 회선율을 산출 및 인쇄조건 데이터를 변환하여 IPC로 전송하고 전송된 데이터는 IPC를 통해 인쇄기에 잉크키 등을 미리설정(프리셋)한다. 인쇄되는 인쇄물의 잉크 키 데이터와 화선율의 데이터를 MCCS(색조관리장치)로 보내고 MCCS에서는 인쇄된 칼라 패치를 분광계로 계측하고, 그 결과를 화면에 표시한다. MCCS는 목표치에 대하여 계측치의 차이를 기준으로 목표치에 가깝게 되도록 잉크키 개도를 조절해 피드백하며, IPC EXPERT 기능용 계측 데이터를 IPC로 보낸다. 따라서, 사람의 눈으로 관리하는 컬러매니지먼트(CMS가 아닌 CIP3/4 데이터의 화선율과 인쇄조건을 PPC서버가 변환하여 IPC에 전송하는 것이다. 인쇄한 인쇄결과물을 MCCS로 계측하여 항상 기준목표 농도치에 맞게 기계에 피드백하고 잉크키 개도를 조절, 색조관리를 함으로써 일정한 품질유지 및 농도관리를 가능(손지절감 및 색조관리의 일관성)하게 하는 시스템이다.

  • PDF

모바일 환경에서 데이터 마이닝을 적용한 하이브리드 데이터 브로드캐스트 기법 (Hybrid broadcast system using data mining in mobile computing environment)

  • 김한수;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.298-300
    • /
    • 2003
  • 모바일 컴퓨팅 환경에서 서버와 클라이언트 간에 데이터 전송은 대역폭의 차이로 인해 비대칭적 통신 구조를 이룬다. 이와 같은 제한된 환경에서 정보 전달은 한번의 전송으로 다수의 클라이언트에게 서비스를 제공하는 브로드캐스트 기법이 효과적이다 하지만 브로드캐스트 방식은 전송되는 데이터의 양이 많을 경우 클라이언트 측에서는 필요한 서비스를 제공받기 위해 높은 접근대기 시간을 갖는 문제점을 가지고 있다. 본 논문에서는 클라이언트 요청 정보를 프로파일 형태로 서버측에 저장하고 이를 데이터 마이닝 기법을 사용해서 자주 요청되면서 서로 연관성이 높은 데이터 패턴을 추출하여 전송함으로써 접근대기 시간을 줄 일수 있는 기법을 제안한다 또한 추출된 패턴도 정기적으로 브로드캐스트 함으로써 클라이언트 측에서 예견적인 프리패치와 캐쉬 재배치를 통해 배터리 소비량을 줄이는 방법을 제안한다.

  • PDF

핑퐁버퍼를 이용한 DEM의 효율적인 사진 트리 삼각화 (An Efficient Quadtree-based Triangulationfor DEMusing Ping-Pong Buffer)

  • 이은석;이진희;;신병석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1480-1483
    • /
    • 2015
  • 최근의 대용량 DEM 데이터는 실시간 렌더링을 하기엔 많은 양의 폴리곤을 필요로 한다. 사진 트리는 이러한 DEM 데이터를 실시간에 렌더링 하기 위해 지형 메쉬를 간략화하는데 널리 사용되는 자료구조이다. 트리구조는 재귀 연산 및 포인터 연산과 같이 GPU 에서 제공하지 않는 기능을 필요로 하기 때문에 일반적으로 CPU 상에서 구현되어 사용된다. GPU 에서 사진 트리 삼각화 기법을 사용하기 위해서 기존의 연구에서는 정점 프리미티브와 스트림 출력 단계를 이용하였다. 하지만 이 방법은 매 프레임 루트 노드부터 리프 노드까지 탐색을 하며 지형 메쉬를 새로 생성 해야하기 때문에 불필요한 연산이 많다. 제안하는 방법은 핑퐁 버퍼를 이용하여 이전 프레임에서 사용한 지형 메쉬를 다음 프레임에서 재활용하여 기존 GPU 기반 사진 트리 삼각화 기법을 가속화한다. 기존 방법이 매 프레임 사각형 패치를 세분화 하면서 지형 메쉬를 생성하는 대신 제안하는 방법은 이전 프레임에서 사용한 메쉬의 각 패치들을 병합하거나 세분화하는 방법을 사용한다. 따라서 본 방법은 GPU 기반 사진 트리 삼각화의 재귀 호출을 제거하여 연산량을 줄이고 매 프레임 CPU-GPU 간의 데이터 전송량도 효율적으로 줄여 기존의 방법을 효율적으로 가속화 한다.

기본적인 SCORM 콘텐츠의 모바일 적응화 (Mobile Adaptation for Basic SCORM Contents)

  • 심진욱;장병철;이승욱;차재혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.757-760
    • /
    • 2004
  • 유비쿼터스 시대의 도래에 발맞춰 유저가 콘텐츠를 이용하는 방법과 사용하는 기기는 PC에 머물지 않고 점차 다양화, 소형화 되고 있다. 최근, 많은 콘텐츠 중에서 e러닝 콘텐츠에 대한 관심은 높아지고 있으며, 본 논문에서는 e러닝 콘텐츠를 다양한 디바이스에 적합한 콘텐츠로 동적 변환하는 모듈을 제안한다. CC/PP 기반의 디바이스 프로파일과 사용자 정보를 포함한 유저 프로파일, 콘텐츠 구성정보를 가진 콘텐츠 프로파일을 통합하여 특성을 추상화 한다. 추상화 된 프로파일을 기반으로 변환방법을 생성하여 콘텐츠에 적용함으로서 해당 디바이스에 적합한 콘텐츠로 적응화 한다. 기존 HTML의 경우 잘 구성된(Well-formed)문서가 아닌 경우가 많고, 문서 내에 데이터와 구조정보를 모두 포함하고 있으므로, 요구되는 데이터의 추출과 정형화된 변환룰의 적용에 어려움이 따른다. 그 대안으로 본 적응화 모듈은 문서의 데이터와 표현 구조를 분리 할 수 있는 XML/XSL 기반의 콘텐츠를 대상으로 하고 있으며, e러닝 콘텐츠의 특성에 적합한 콘텐츠 프리패치 및 캐시 기법을 적용하여 콘텐츠 동적변환에 따른 응답시간 오버헤드를 최소화 하였다.

  • PDF

멀티코어 GP-GPU를 이용한 지오메트리 처리 (Geometry Processing using Multi-Core GP-GPU)

  • 이광엽;김치용
    • 전기전자학회논문지
    • /
    • 제14권2호
    • /
    • pp.69-75
    • /
    • 2010
  • 3D 그래픽 처리 과정은 크게 지오메트리 단계와 렌더링 단계로 구분된다. 본 논문에서는 듀얼페이즈 멀티코어 GP-GPU에서 지오메트리 처리를 가속화시키기 위한 방법을 제안한다. GP-GPU의 SIMD, 듀얼페이즈 구조를 이용한 병렬적 데이터 처리와 메모리 프리패치를 이용하여, 지오메트리 처리를 가속화 시킬 수 있었으며, 모든 기능을 사용할 시 19%의 성능 향상을 나타내었다.

무선랜 시스템을 위한 적응형 빔포밍 시스템의 설계 및 구현 (Design and Implementation of Adaptive Beam-forming System for Wi-Fi Systems)

  • 오주현;곽경훈;오영석;조성민;오혁준
    • 한국정보통신학회논문지
    • /
    • 제18권9호
    • /
    • pp.2109-2116
    • /
    • 2014
  • 본 논문은 무선랜 시스템에서 성능 향상을 위해, 안테나 빔을 전 방향으로 방사하는 기존의 방법과는 달리, 접속한 단말이 존재하는 방향으로만 안테나 빔을 방사하는 빔포밍 시스템을 설계 및 구현하였다. 해당 시스템은 패치형 배열 안테나를 통해 통신을 하며, DSP(Digital Signal Processor)에서 패킷 타입과 단말의 정보를 퀄컴사의 상용 칩으로부터 제공받아 FPGA(Field Programmable Gate Array)로 전송하는 방식으로 동작한다. DSP와 FPGA의 통신 방식은 데이터 송수신시 생기는 지연을 최소화하기 위해 PCI express(Peripheral Component Interconnect express)를 사용하였다. 단말 고유의 MAC(Media Access Control) 주소를 FPGA에서 저장하고 데이터베이스화함으로써 단말들의 위치를 관리할 수 있도록 하였다. 따라서 해당하는 단말로 패킷을 전송할 때, 추정한 위치로 빔을 방사하여 T/P(throughput)를 높일 수 있다. 단말의 위치는 패치형 배열 안테나를 통해 수신한 단말의 SINR(Signal to Interface plus Noise Ratio)을 프리앰블 구간에서 극대화하는 알고리즘을 사용하여 추정하였다. 제안하는 빔포밍 시스템을 Verilog HDL(Hardware Description Language)을 이용하여 FPGA와 퀄컴사의 상용 칩과 연동하여 구현하였으며 실제 운용 환경에서 시험을 통해 구현된 장비가 일반 AP(Access Point) 보다 더 높은 성능을 보이며 통신하는 것을 확인하였다.