• 제목/요약/키워드: memory latency

검색결과 361건 처리시간 0.039초

NVMe 드라이버 구현 방식에 따른 I/O 응답시간 분석 (Analysis of I/O Response Time Throughout NVMe Driver Implementation Architectures)

  • 강인구;주용수;임성수
    • 대한임베디드공학회논문지
    • /
    • 제12권3호
    • /
    • pp.139-147
    • /
    • 2017
  • In recent years, non-volatile memory express (NVMe), a new host controller interface standard, has been adapted to overcome performance bottlenecks caused by the acceleration of solid state drives (SSD). Recently, performance breakthrough cases over AHCI based SATA SSDs by adapting NVMe based PCI Express (PCIe) SSD to servers and PCs have been reported. Furthermore, replacing legacy eMMC-flash storage with NVMe based storage is also considered for next generation of mobile devices such as smartphones. The Linux kernel includes drivers for NVMe support, and as the kernel version increases, the implementation of the NVMe driver code has changed. However, mobile devices are often equipped with older versions of Android operating systems (OSes), where the newest features of NVMe drivers are not available. Therefore, different features of different NVMe driver implementations are not well evaluated on Android OSes. In this paper, we analyze the response time of the NVMe driver for various Linux kernel version.

모바일 3D 그래픽 가속기를 위한 저전력 텍스쳐 캐쉬 구조 설계 (A design of low power structures of texture caches for mobile 3D graphics accelerator)

  • 김영식;이재영
    • 한국게임학회 논문지
    • /
    • 제6권4호
    • /
    • pp.63-70
    • /
    • 2006
  • 본 논문에서는 모바일 3D 그래픽 가속기의 텍스쳐 데이터 메모리 지연시간을 감소하기 위해 사용하는 텍스쳐 캐쉬의 다양한 저전력 구조를 고찰하였다. 또한 텍스쳐 필터링 알고리즘에 따라서 가변적 전력 모드 전환 기준을 갖는 텍스쳐 캐쉬를 설계하였다. 각 텍스쳐 캐쉬 구조의 성능 비교 분석을 위하여 Quake 게임 엔진을 벤치마크로 사용한 트레이스 기반의 시뮬레이션을 수행하였다. 또한 저전력 텍스쳐 캐쉬 구조에 적합한 텍스쳐 필터링 알고리즘에 따라서 가변적 전력 모드 전환 기준을 갖는 알고리즘을 제안하고 시뮬레이션을 통하여 검증하였다.

  • PDF

병렬 SISO 복호기에 의한 저전력 터보 복호기의 설계 (Design of a Low-Power Turbo Decoder Using Parallel SISO Decoders)

  • 이희진;황선영
    • 한국통신학회논문지
    • /
    • 제30권2C호
    • /
    • pp.25-30
    • /
    • 2005
  • 터보 코드는 Shannon의 한계 이론에 가까운 성능을 보이나 알고리듬의 특성상 반복 복호와 대용량 메모리의 사용으로 구현이 복잡하며 전력 소모가 크다. 본 논문에서는 병렬 구조 방식을 적용할 경우 출력 주파수가 감소되어 결과적으로 전력 소모가 감소된다는 사실을 이용하여 터보 부호기에 병렬 구조 방식을 적용한 설계를 제안하였다. 하드웨어의 복잡도를 줄이기 위해 Max-Log-MAP 방식을 사용하였으며, 병렬 구조가 적용된 터보 부호기를 위한 새로운 인터리버 구조를 제안하였다. 제안된 인터리버의 사용으로 병렬 구조화된 각각의 SISO 부호기들이 인터리버에 대해 읽기/쓰기 동작을 수행할 경우 발생할 수 있는 메모리 충돌을 방지할 수 있다. 실험 결과 기존의 구조와 비교하였을 경우 인터리버 제어기에 의한 면적의 증가는 무시할 정도이며, 전력 소모는 약 40%정도 감소되었다.

디지털 신호처리 기능을 강화한 32비트 마이크로프로세서 (A 32-bit Microprocessor with enhanced digital signal process functionality)

  • 문상국
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.820-822
    • /
    • 2005
  • 본 논문에서는 16비트 혹은 32비트 고정 소수점 연산을 지원하는 디지털 신호처리 기능을 강화한 명령어 축소형 마이크로프로세서를 설계하였다. 설계한 마이크로프로세서는 명령어 축소형 마이크로 아키텍쳐의 표준에 따라서 범용 마이크로프로세서의 기능과 디지털 신호처리 프로세서의 기능을 함께 갖추고 있다. 산술연산기능 유닛, 디지털 신호처리 유닛, 메모리 제어 유닛으로 구성되어 있으며, 이 연산 유닛들이 병렬적으로 수행되어 디지털 신호처리 명령이나 로드/스토어 명령어의 지연된 시간을 보상할 수 있게 설계되었다. 이 연산유닛들을 병렬적으로 동작하게 함으로써 5단계 파이프라인의 구조로 고성능 마이크로프로세서를 구현하였다.

  • PDF

깊이 검사 결과에 의한 선택적 적재 방법을 가지는 픽셀 캐쉬 구조 (A Pixel Cache Architecture with Selective Loading Scheme based on Z-test)

  • 이길환;박우찬;김일산;한탁돈
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권10호
    • /
    • pp.579-585
    • /
    • 2003
  • 최근 대부분의 3차원 그래픽 렌더링 프로세서는 메모리 접근 지연 및 대역폭을 줄이기 위해 깊이 데이타와 색상 데이타를 가지고 있는 픽셀 캐쉬(pixel cache)를 사용한다. 본 논문에서는 렌더링 프로세서의 성능을 향상시키기 위한 효과적인 픽셀 캐쉬 구조를 제시한다. 제안하는 픽셀 캐쉬 시스템은 기본적으로 3차원 렌더링 프로세서에서 수행되는 깊이 검사(Z-test) 결과에 의해 선택적으로 깊이 데이터를 캐쉬에 저장하며, 색상 데이타는 별도의 버퍼에 저장한다. 시뮬레이션 결과에 의하면 16K바이트의 제안하는 캐쉬 시스템이 32K바이트의 일반적인 캐쉬보다 더 나은 성능을 보인다.

New Two-Level L1 Data Cache Bypassing Technique for High Performance GPUs

  • Kim, Gwang Bok;Kim, Cheol Hong
    • Journal of Information Processing Systems
    • /
    • 제17권1호
    • /
    • pp.51-62
    • /
    • 2021
  • On-chip caches of graphics processing units (GPUs) have contributed to improved GPU performance by reducing long memory access latency. However, cache efficiency remains low despite the facts that recent GPUs have considerably mitigated the bottleneck problem of L1 data cache. Although the cache miss rate is a reasonable metric for cache efficiency, it is not necessarily proportional to GPU performance. In this study, we introduce a second key determinant to overcome the problem of predicting the performance gains from L1 data cache based on the assumption that miss rate only is not accurate. The proposed technique estimates the benefits of the cache by measuring the balance between cache efficiency and throughput. The throughput of the cache is predicted based on the warp occupancy information in the warp pool. Then, the warp occupancy is used for a second bypass phase when workloads show an ambiguous miss rate. In our proposed architecture, the L1 data cache is turned off for a long period when the warp occupancy is not high. Our two-level bypassing technique can be applied to recent GPU models and improves the performance by 6% on average compared to the architecture without bypassing. Moreover, it outperforms the conventional bottleneck-based bypassing techniques.

RIO와 HTM을 이용한 MMO 게임서버의 성능 개선 (Performance Improvement of MMO Gameservers Using RIO and HTM)

  • 강수빈;정내훈
    • 한국게임학회 논문지
    • /
    • 제20권6호
    • /
    • pp.13-22
    • /
    • 2020
  • RIO는 윈도우의 최신 네트워크 API로 낮은 부하와 지연을 통해 높은 IO 성능을 발휘하도록 설계되었으며. 고성능의 네트워크 IO를 요구하는 대규모 동시접속(MMO) 게임 서버에 적합할 것으로 기대된다. 또한 HTM은 기존의 멀티스레드 동기화 방식보다 생산성과 성능이 우수하여 MMO 게임 서버에 적용 시 성능향상이 예상된다. 본 논문에서는 MMO 게임 서버에 RIO를 적용함과 동시에 RIO의 성능을 최대한 끌어내도록 구조를 개선하고, 기존의 시야 처리 알고리즘을 HTM 방식으로 변경하여 서버의 성능을 향상시켰다. 결과적으로 동시 접속자 수를 19%가량 증가시켰으며, 벤치마킹 프로그램을 사용하여 이를 검증하였다.

효율적 자원 배치를 위한 이동객체의 최적 이동패턴 추출 (Optimal Moving Pattern Extraction of the Moving Object for Efficient Resource Allocation)

  • 조호성;남광우;장민석;이연식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.689-692
    • /
    • 2021
  • 본 논문은 Fog/Edge Computing(FEC) 환경에서 애플리케이션 서비스의 사용자 근접성을 지원하는 컴퓨팅 리소스의 최적 할당 및 지연시간 감소를 위한 이동에이전트 기반 오프로딩의 효율성을 제고하기 위한 선행연구로써, 이동객체들의 방대한 시공간 이동 이력데이터 집합으로부터 복합적인 시공간 제약을 적용한 최적 이동패턴 추출 시 수행시간 및 소요 메모리양을 효과적으로 감소시키는 알고리즘을 제안한다. 제안 알고리즘은 빈발도 기반의 최적경로 추출을 통하여 향후 FEC 환경에서 계산 오프로딩을 위한 컴퓨팅 리소스의 분배 및 배치에 유용하게 사용될 수 있다.

  • PDF

Genetic Algorithm based hyperparameter tuned CNN for identifying IoT intrusions

  • Alexander. R;Pradeep Mohan Kumar. K
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권3호
    • /
    • pp.755-778
    • /
    • 2024
  • In recent years, the number of devices being connected to the internet has grown enormously, as has the intrusive behavior in the network. Thus, it is important for intrusion detection systems to report all intrusive behavior. Using deep learning and machine learning algorithms, intrusion detection systems are able to perform well in identifying attacks. However, the concern with these deep learning algorithms is their inability to identify a suitable network based on traffic volume, which requires manual changing of hyperparameters, which consumes a lot of time and effort. So, to address this, this paper offers a solution using the extended compact genetic algorithm for the automatic tuning of the hyperparameters. The novelty in this work comes in the form of modeling the problem of identifying attacks as a multi-objective optimization problem and the usage of linkage learning for solving the optimization problem. The solution is obtained using the feature map-based Convolutional Neural Network that gets encoded into genes, and using the extended compact genetic algorithm the model is optimized for the detection accuracy and latency. The CIC-IDS-2017 and 2018 datasets are used to verify the hypothesis, and the most recent analysis yielded a substantial F1 score of 99.23%. Response time, CPU, and memory consumption evaluations are done to demonstrate the suitability of this model in a fog environment.

녹용 추출물이 치매 동물모델의 기억력 개선과 관련효소 활성에 미치는 효과 (Effects of the Deer Antler Extract on Scopolamine-induced Memory Impairment and Its Related Enzyme Activities)

  • 이미라;손백신;고리주안;왕춘년;방철명;왕젠;모은경;이선영;성창근
    • 한국식품영양과학회지
    • /
    • 제38권4호
    • /
    • pp.409-414
    • /
    • 2009
  • 본 연구는 녹용 추출물이 scopolamine으로 기억손상을 유발한 실험동물의 기억력 개선과 AChE, MAO-B의 활성억제, 신경전달 물질인 ACh 함량을 치매 치료제인 tacrine과 비교하여 분석하였다. 공간인지력을 평가하는 Morris water maze test에서 scopolamine(2 mg/kg, i.p.)으로 기억손상을 유발한 경우 4일간의 인지훈련에도 불구하고 platform을 찾아가는 escape latency 시간이 증가되었으며, tacrine과 녹용추출물 투여군은 훈련 2일째부터 유의적으로 escape latency 시간이 감소하였다. 실험 5일째 platform을 제거한 probe test에서도 녹용 추출물 처리군은 scopolamine 처리군보다도 escape latency 시간이 유의적으로 감소하여 장기기억 개선효과가 있음을 보여주었다. 뇌의 신경전달물질인 ACh 생성은 대조군 대비 scopolamine 투여군은 84.7% 감소하였으나, 녹용 추출물 투여군(97.5%)은 치매 치료제인 tacrine(97.8%)과 비슷하게 정상적인 수치로 ACh 생성량을 증가시켰다. Tacrine 처리군은 scopolamine 투여로 상승한 뇌조직과 혈청의 AChE 활성을 유의적으로 감소시켰고, 녹용 추출물 처리군은 뇌조직의 AChE 활성을 유의적으로 감소시켰다. 뇌조직의 MAO-B 활성은 그룹 간 유의적인 차이는 없었으나, tacrine과 녹용 추출물 처리군이 scopolamine 투여군보다 MAO-B 활성을 감소시키는 경향을 보였다. 따라서 녹용 추출물은 scopolamine으로 기억손상을 유발한 치매 동물모델에서 신경전달물질을 분해하는 효소의 활성을 저해함으로써 장기기억 활성을 촉진하고 콜린성 신경계를 자극하여 기억 및 학습 증진에 효과적으로 작용하는 천연물 유래 기능성 물질로 사료된다.