• 제목/요약/키워드: CPU Time

검색결과 939건 처리시간 0.03초

실시간 에뮬레이터의 설계 및 제작 (Design and Implementation of Real-Time Emulator)

  • 전문식;최항식;박민용;이상배
    • 한국음향학회지
    • /
    • 제4권2호
    • /
    • pp.36-47
    • /
    • 1985
  • 본 논문에서는 기존의 ICE 기능을 갖춘 사용이 간편하고, 쉽게 이동이 가능한 저가격 범용 8비 트 마이크로프로세서의 실시간 에뮬레이터를 설계, 제작하고자 한다. ICE의 기능을 구현하기 위해서2개 의 보드 즉 에뮬레이션 보드와 콘트롤 보드를 사용하는 구조로 고안하였다. 에뮬레이션 보드에는 CPU 8085를 사용하고, 콘트롤 보드에는 표적시스템의 CPU와 같은 CPU를 사용하였다. 이러한 구조는 표적 CPU가 바뀔 때 콘트롤 보드만 교환하면 된다는 점에서 실용적이다. 에뮬레이션 보드는 범용 8비트 마 이크로프로세서에 대해서, 콘트롤 보드는 표적 CPU가 Z-80인 시스템에 대해서 제작하였다. 또한, 에뮬 레이터의 기능에 의해, 표적 CPU 자체의 기능이 상실됨을 회복시켰다.

  • PDF

3D 게임의 실시간 렌더링 속도 향상을 위한 소프트웨어적 기법 (A Software Method for Improving the Performance of Real-time Rendering of 3D Games)

  • 황석민;성미영;유용희;김남중
    • 한국게임학회 논문지
    • /
    • 제6권4호
    • /
    • pp.55-61
    • /
    • 2006
  • 그래픽스 렌더링 파이프라인 (응용, 기하, 레스터화)은 컴퓨터 게임에서 가장 중요한 기능인 실시간 그래픽스 렌더링의 핵심이다. 일반적으로 그래픽스 렌더링은 CPU와 GPU의 두 장치의 협조에 의해 완성되며 이 협조 과정에서 병목이 발생할 수 있다. 본 논문에서는 CPU와 GPV 사이에 발생하는 병목현상을 줄이는 데 초점을 맞추어, 보통은 하나의 스레드로 처리되는 CPU 연산을 순수 CPU 연산과 GPV와 연관된 연산의 두 가지로 구분하여 서로 독립적인 스레드로 병렬처리 되게 함으로써 실시간 그래픽스 렌더링의 성능을 향상시키는 방법을 제안한다. 이 방법은 CPU와 GPV사이의 협조를 위한 전송 과정에서의 병렬성을 극대화한다. 실험을 통하여 제안하는 방법이 기존의 방법 보다 더 빠르게 그래픽스 렌더링을 수행함을 검증하였다. 또한 본 논문에서는 CPU와 GPU의 협조 과정에서 생기는 병목현상으로 인한 유휴시간을 잘 활용하여 렌더링 파이프라인의 균형을 맞추면서 렌더링의 질을 높이는 방법도 제안한다. 제안하는 방법들을 우리가 개발한 네트워크 게임 엔진에 적용하여 실제 시스템에서도 효과가 있음을 확인하였다.

  • PDF

경성 실시간 태스크와 MPEG 비디오 스트림 기반 멀티미디어 태스크를 위한 CPU 대역폭의 동적 할당 기법 (Dynamic Allocation Method of CPU Bandwidth for Hard Real-Time Task and Multimedia Task Based on MPEG Video Stream)

  • 김진환
    • 한국멀티미디어학회논문지
    • /
    • 제7권7호
    • /
    • pp.886-895
    • /
    • 2004
  • 본 논문에서는 멀티미디어 태스크와 경성 실시간 태스크가 공존하는 시스템에서 두 태스크들을 효율적으로 통합하고 스케쥴링하기 위한 CPU 대역폭의 동적 할당 기법이 제시된다. 연성 실시간적인 멀티미디어 태스크는 평균 실행 시간을 기반으로 처리되는 반면 경성 실시간 태스크는 최악의 경우에 대한 실행 시간을 기반으로 실행이 보장된다. 서버를 기반으로 하는 본 논문의 할당 기법은 CPU 대역폭을 두 태스크들에 대하여 분할한 후 특히 MPEG 비디오 스트림을 위한 멀티미디어 태스크들에 대하여는 할당된 대역폭을 다시 동적으로 조정한다. 제시된 기법의 목적은 시스템에 존재하는 경성 실시간 태스크들의 시간적 제약성을 모두 보장하면서 멀티미디어 태스크들의 종료시한이후 실행이 지연되는 시간을 최소화하는 것이다. 본 논문에서는 시뮬레이션 실험을 통하여 제시된 기법에서 멀티미디어 태스크들의 지연 시간이 다른 기법에 비하여 작아지는 결과를 보여주고 있다.

  • PDF

시계열 데이터베이스에서 타임 워핑 하의 서브시퀀스 매칭 : 관찰, 최적화, 성능 결과 (Subsequence Matching Under Time Warping in Time-Series Databases : Observation, Optimization, and Performance Results)

  • 김만순;김상욱
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1385-1398
    • /
    • 2004
  • 본 논문에서는 시계열 데이터베이스에서 타임 워핑 하의 서브시퀀스 매칭을 효과적으로 처리하는 방안에 관하여 논의한다. 타임 워핑은 시퀀스의 길이가 서로 다른 경우에도 유사한 패턴을 갖는 시퀀스들을 찾을 수 있도록 해 준다. 먼저, 사전 실험을 통하여 기존의 기본적인 처리 방식인 Naive-Scan의 성능 병목이 CPU 처리 과정에 있음을 지적하고, Naive-Scan의 CPU 처리 과정을 최적화하는 새로운 기법을 제안한다. 제안된 기법은 질의 시퀀스와 서브시퀀스들간의 타임 워핑 거리들을 계산하는 과정에서 발생하는 중복 작업들을 사전에 제거함으로써 CPU 처리 성능을 극대화한다. 제안된 기법이 착오 기각을 발생시키지 않음과 Naive-Scan을 처리하기 위한 최적의 기법임을 이론적으로 증명한다. 또한, 제안된 기법을 기존의 타임 워핑 하의 서브시퀀스 매칭 기법인 LB-Scan과 ST-Filter의 후처리 정량적으로 검증한다. 실험 결과에 의하면, 기존의 타임 워핑 하의 서비시퀀스 매칭을 위한 모든 기법들이 제안된 최적화 기법에 의하여 성능이 개선되는 것으로 나타났다. 특히, Nsive-Scan은 최적화 기법의 적용 전에는 가장 떨어지는 성능을 보였으나, 최적화 기법의 적용 후에는 모든 경우에서 ST-Filter나 LB-Scan을 사용한 경우보다 더 좋은 성능을 보였다. 이것은 성능 병목인 CPU 처리 과정을 최적화함으로써 기존 기법들인 Naive-Scan, LB-Scan, ST-Filter 간의 처리 성능 상의 순위 역전 현상이 발생하였음을 보이는 매우 중요한 결과이다.

도시철도역사에서 화재유동에 대한 병렬계산방법연구 (The development of parallel computation method for the fire-driven-flow in the subway station)

  • 장용준;이창현;김학범;박원희
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2008년도 춘계학술대회 논문집
    • /
    • pp.1809-1815
    • /
    • 2008
  • 본 연구는 병렬처리기법을 이용하여 지하역사 화재유동을 시뮬레이션 하였다. 화재해석 프로그램으로는 LES(Large Eddy Simulation)화재해석 프로그램 중 하나인 FDS(Fire Dynamics Simulation)를 사용하여 연구를 진행하였으며, 각 Node당 3.0Ghz_2set이 탑재된 6-node parallel Cluster장비를 사용하여 병렬계산을 수행하였다. 시뮬레이션 모델은 광주 금난로 4가 지하역사를 대상으로 하였으며, 총 시뮬레이션 시간은 600s로 하였다. 먼저 Single-CPU와 Multi-CPU를 이용한 병렬계산과의 결과 비교를 위하여 전체역사를 1-Mesh와 8-Mesh로 나누어 각각 Single-CPU계산과 Multi-CPU를 이용하여 계산결과를 비교분석 하였으며, Single-CPU에서 처리가 불가능한 격자수($15{\times}10^6$)를 가지고 승강장 중앙에서의 화재와 객차 내에서의 화재유동분석 하였다. 연구결과 Single-CPU 해석과 Multi-CPU를 이용한 병렬계산에 있어서, 해석결과의 차이는 거의 없는 것으로 나타났다. 또한 계산시간의 비교에서도 14개의 Mesh를 가지고 약 300만개의 격자를 사용한 경우에 있어서 2CPU(4core)와 7CPU(14core)의 계산시간은 1CPU에 비하여 각각, 2배, 5배의 차이를 보였다. 병렬처리기법의 도입으로 Single-CPU의 한계를 극복하여 보다 빠르고 정확한 결과값을 얻을 수 있을 것으로 기대된다. 향후 병렬처리기법연구에 있어서 계산효율성 증대를 위한 연구가 계속적으로 진행되어야 할 것이다.

  • PDF

병렬 GPU를 이용한 분자 도킹 시스템 (Molecular Docking System using Parallel GPU)

  • 박성준
    • 한국콘텐츠학회논문지
    • /
    • 제8권12호
    • /
    • pp.441-448
    • /
    • 2008
  • 분자 도킹 실험은 일반적으로 계산 량이 매우 많아 슈퍼 컴퓨팅 파워를 요구하는 실험이다. 따라서 시간이 많이 소요되기 때문에 일반적으로 CPU가 탑재된 컴퓨터를 여러 대 묶어서 사용하는 분산 환경 혹은 그리드 환경에서 실험을 수행하고 있다. 이와 같은 실험 환경은 시간적, 공간적 제약성이 많아 일반적으로 과학자들이 접근하기가 어렵다. 그래서 근래에는 많은 CPU를 사용하기 보다는 월등히 성능이 높은 GPU를 병렬 화하여 과학 분야에 계산하는 연구가 매우 활발히 이루어지고 있는 추세이다. CUDA는 병렬 GPU 프로그래밍을 가능하게 하는 공개 기술이다. 본 논문에서는 이러한 CUDA 기술을 사용하여 분자 도킹 실험을 할 수 있는 시스템을 제안한다. 또한, 분자 도킹 실험에 있어서 중요한 에너지 최소화 계산을 병렬 화하는 알고리즘을 제안한다. 이와 같은 실험을 검증하기 위해 본 논문에서는 일반적인 CPU에서 분자 도킹 실험 시간과 본 논문에서 제안한 병렬 CPU 기반의 분자 도킹 시간을 비교 분석 하였다.

차세대 CPU를 위한 캐시 메모리 시스템 설계 (Design of Cache Memory System for Next Generation CPU)

  • 조옥래;이정훈
    • 대한임베디드공학회논문지
    • /
    • 제11권6호
    • /
    • pp.353-359
    • /
    • 2016
  • In this paper, we propose a high performance L1 cache structure for the high clock CPU. The proposed cache memory consists of three parts, i.e., a direct-mapped cache to support fast access time, a two-way set associative buffer to reduce miss ratio, and a way-select table. The most recently accessed data is stored in the direct-mapped cache. If a data has a high probability of a repeated reference, when the data is replaced from the direct-mapped cache, the data is stored into the two-way set associative buffer. For the high performance and fast access time, we propose an one way among two ways set associative buffer is selectively accessed based on the way-select table (WST). According to simulation results, access time can be reduced by about 7% and 40% comparing with a direct cache and Intel i7-6700 with two times more space respectively.

GPU가 장착된 PC를 위한 혼합 정렬 알고리즘 설계 (Designing Hybrid Sorting Algorithm for PC with GPU)

  • 권오영
    • 한국항행학회논문지
    • /
    • 제15권2호
    • /
    • pp.281-286
    • /
    • 2011
  • 데이터 정렬은 현대 사회에 존재하는 수많은 디지털 데이터에 대한 중요한 가공 작업 중의 하나이지만, 데이터가 방대할수록 정렬 과정 자체도 많은 연산시간을 소비한다. 본 논문에서 데이터 배열을 분할하여 PC에 있는 CPU와 GPU에서 각각 동시에 정렬을 수행하는 혼합 정렬 알고리즘을 제안하였다. 각 장치의 처리 성능을 바탕으로 가장 효율적인 배열의 분할 범위를 결정하고 각각 분할된 영역을 CPU와 GPU에서 동시에 정렬함으로써 전체 정렬 시간을 단축시켰다. 실험결과에서 알 수 있듯 혼합 정렬이 GPU만 활용한 정렬보다 8%이상 정렬 수행 속도를 향상시켰다.

고속 스토리지를 이용한 실시간 IoT 시스템의 전력 절감 최적화 기술 (Optimization Techniques for Power-Saving in Real-Time IoT Systems using Fast Storage Media)

  • 윤수지;박희진;조경운;반효경
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.71-76
    • /
    • 2021
  • 최근 사물인터넷의 데이터가 대용량화됨에 따라 실시간 시스템의 메모리 전력 소모가 급증하고 있다. 이는 실시간 시스템이 태스크 전체를 항상 메모리에 올려놓고 처리함으로 인한 DRAM 용량 증가에 기인한다. 본 논문은 최근 각광 받는 고속 스토리지를 활용하여 실시간 태스크의 일부를 스토리지에 내려놓고 필요시 메모리에 올리는 전력 절감 기술을 제안한다. 또한, 이를 CPU의 동적 전압조절 기법과 결합하여 CPU와 메모리의 전력 절감을 동시에 최적화한다. 제안하는 기술은 CPU의 유휴시간을 최대한 줄이는 전압 모드를 결정하는 동시에 메모리 크기를 최소화하는 스왑 비율을 결정하여, 태스크의 데드라인을 어기지 않으면서 전력 소모를 최소화하는 최적의 조합을 탐색한다. 시뮬레이션 실험을 통해 제안하는 기술이 실시간 시스템의 전력 소모를 크게 줄임을 보인다.

소형 적외선영상 호밍시스템용 고속 실시간 영상신호처리기 개발 (Development of High-Speed Real-Time Image Signal Processing Unit for Small Infrared Image Tracking Radar)

  • 김홍락;박진호;김경일;전효원;신정섭
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권4호
    • /
    • pp.43-49
    • /
    • 2021
  • 소형 적외선영상 호밍시스템은 지상의 표적에 대하여 주야간 적외선 영상처리를 통하여 표적을 식별하고 주요 표적에 대하여 표적을 탐색, 탐지하여 추적하는 적외선 영상센서를 보유한 추적시스템이다. 본 논문에서는 지상의 표적을 주야간 적외선 영상을 통하여 표적 정보를 획득하여 실시간 영상처리를 통하여 표적을 식별하기 위한 고속의 CPU와 FPGA(Field Programmable Gate Array)가 탑재된 보드 개발의 내용을 설명한다. CPU, FPGA 선정과 영상신호처리를 위한 CPU-FPGA 결합 아키텍처에 대하여 제안하고 또한 김발구조의 적외선센서를 제어하기 위한 FPGA를 활용에 대하여 설명한다.