• 제목/요약/키워드: Write Performance

검색결과 391건 처리시간 0.037초

개인용 모바일 환경의 AI 워크로드 수행을 위한 메모리 참조 분석 및 시스템 설계 방안 (Implications for Memory Reference Analysis and System Design to Execute AI Workloads in Personal Mobile Environments)

  • 권석민;반효경
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.31-36
    • /
    • 2024
  • 최근 AI 기술을 활용하는 모바일 앱이 늘고 있다. 개인용 모바일 환경에서는 메모리 용량의 제약으로 인해 대용량 데이터로 구성된 워크로드의 학습 시 극심한 성능 저하가 발생할 수 있다. 본 논문에서는 이러한 현상을 규명하기 위해 AI 워크로드의 메모리 참조 트레이스를 추출하고 그 특성을 분석하였다. 그 결과 AI 워크로드는 메모리 쓰기 연산시 약한 시간지역성과 불규칙한 인기편향성 등으로 인해 잦은 스토리지 접근을 발생시켜 모바일 기기의 성능을 저하시킬 수 있음을 확인하였다. 이러한 분석을 토대로 본 논문에서는 AI 워크로드의 메모리 쓰기 연산을 영속 메모리 기반의 스왑 장치를 이용해서 효율적으로 관리할 수 있는 방안에 대해 논의하였다. 시뮬레이션을 통해 본 연구에서 제안한 구조가 기존의 모바일 시스템 대비 80% 이상 입출력 시간을 개선할 수 있음을 보였다.

분산 주기억장치 데이터베이스에서 카탈로그 관리 기법의 성능평가 (Performance Evaluation of Catalog Management Schemes for Distributed Main Memory Databases)

  • 정한라;홍의경;김명
    • 한국멀티미디어학회논문지
    • /
    • 제8권4호
    • /
    • pp.439-449
    • /
    • 2005
  • 분산 주기억장치 데이터베이스 관리 시스템 (DMM-DBMSs)은 데이터베이스를 참여 사이트의 주기억 장치에 저장한다. 지역 데이터베이스에 신속하게 접근할 수 있고 사이트들 사이에 고속 통신이 가능하므로 DMM-DBMS는 높은 성능을 보장한다. 최근 들어 DMM-DBMS에 대해 많은 연구 결과가 발표되었으나 아직까지 DMM-DBMS의 카탈로그 관리 기법에 대한 성능 분석 결과는 발표된 것이 없다. 본 연구에서는 높은 사이트 자치성을 보장하는 DMM-DBMS의 분할식 카탈로그 관리 기법의 성능을 실험적으로 평가하였다. 분할식 카탈로그 관리 기법을 캐시없는 분할식 카탈로그 방식(PCWC), 점진적 캐시를 이용한 분할식 카탈로그 방식(PCWIC), 완전 캐시를 이용한 분할식 카탈로그 방식(PCWFC)으로 분류하였고, 성능평가는 사이트 수, 사이트 당 터미널 수, 버퍼 크기, 쓰기 질의 비율, 지역 질의 비율 등을 중심으로 분석하였다. 분석 결과 PCWFC가 모든 경우에 가장 높은 성능을 보였다. 이는 또한 PCWIC가 시간이 흐름에 따라 더욱 높은 성능을 보인다는 것을 뜻한다. PCWFC 방식은 디스크 기반 분산 DMBS에서는 사이트 부하가 크거나 카탈로그 쓰기 비율이 높거나 원격 데이터 객체가 빈번히 액세스되는 상황에서 고성능을 보장하지 못하지만, DMM-DBMS에서는 원격 데이터 객체의 카탈로그가 자주 갱신된다고 해도 질의 컴파일과 원격 카탈로그 액세스가 고속으로 이루어질 수 있기 때문에 높은 성능을 보장하는 것이다.

  • PDF

시뮬링크를 이용한 플래시메모리 저장장치 성능 모델링 (Performane Modeling of Flash Memory Storage Systems Using Simulink)

  • 민항준;박정수;이주일;민상렬;김강희
    • 대한임베디드공학회논문지
    • /
    • 제6권5호
    • /
    • pp.263-272
    • /
    • 2011
  • The complexity of flash memory based storage systems is high due to diverse host interfaces and other design choices such as mapping granularity, flash memory controller execution models and so on. Thus, it is possible that the actual performance after implementation is not consistent with the target performance. This paper demonstrates that the performance prediction of flash memory based storage systems is possible through performance modeling that takes into account various design parameters. In the performance modeling, the FTL, which is the core element of flash memory based storage systems, is modeled as a set of (copy-on-write) logs and their interactions. Also, the flash memory controller is modeled based on the classification proposed in the design of the Ozone flash controller. In this study, the performance model has been implemented using Simulink and experimental results are presented and analyzed.

하이브리드 하드디스크를 위한 효율적인 데이터 블록 교체 및 재배치 기법 (An Efficient Data Block Replacement and Rearrangement Technique for Hybrid Hard Disk Drive)

  • 박광희;이근형;김덕환
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.1-10
    • /
    • 2010
  • 최근 낸드 플래시 메모리가 하드디스크 수준으로 읽기 성능이 향상되고, 전력소비가 훨씬 적음에 따라, 플래시메모리와 하드디스크를 같이 사용하는 하이브리드 하드디스크와 같은 이기종 저장장치들이 출시되고 있다. 하지만 낸드 플래시 메모리의 쓰기 및 삭제 속도가 기존 자기디스크의 쓰기 성능에 비해 매우 느릴 뿐 아니라, 사용자 층에서 쓰기 요청이 집중될 경우 CPU, 메인 메모리에 심각한 오버헤드를 발생시킨다. 본 논문에서는 비휘발성 캐시의 역할을 하는 낸드 플래시 메모리의 성능을 향상시키기 위해 읽기의 참조 빈도는 낮고, 쓰기의 갱신 빈도가 높은 데이터 블록들을 교체하는 LFU(Least Frequently Used)-Hot 기법을 제시하고, 교체 될 데이터 블록들을 재배치하여 자기디스크로 플러싱하는 기법을 제시한다. 실험 결과, 본 논문에서 제안하는 LFU-Hot 블록 교체 기법과 멀티존 기반의 데이터 블록 재배치기법 실행시간이 기존 LRU, LFU 블록 교체 기법들보다 입출력 성능 면에서 최대 38% 빠르고, 비휘발성 캐시의 수명을 약 40% 이상 향상 시킴을 증명하였다.

<심청전>의 재구와 고전 콘텐츠 - <심청전을 짓다: 심청이 제삿날 밤에>를 대상으로 - (Reconstruction of and Classical literature contents)

  • 김선현
    • 공연문화연구
    • /
    • 제36호
    • /
    • pp.45-73
    • /
    • 2018
  • 이 논문에서는 <심청전을 짓다: 심청이 제삿날 밤에>를 대상으로, 심청이야기의 재구 방식과 특징을 살펴 심청의 목소리가 어떻게 재현되고 의미화 되는지를 고찰하였다. 그리고 이를 바탕으로 이 텍스트가 <심청전>의 서사를 재매개 및 재창작하는 방식을 탐구해 봄으로써 고전 문학을 바탕으로 한 콘텐츠의 가능성과 방향을 탐색해 보았다. 이 작품은 심청의 이야기를 다루되 심청과 심봉사가 아닌 남경상인이나 귀덕어미 등 주변인들의 시선을 통해 심청의 희생과 죽음을 둘러싼 문제적인 국면들을 포착하고 있다. 그 과정에서 그간 간과되었던 희생자이자 사회적 타자로서 심청의 목소리가 발견되고, 이를 가부장제 사회 속에서 여성의 삶을 규율했던 효열 담론과 연결 지으며 조선 시대 여성의 삶에 대한 사회적 공론의 장을 마련한다. <심청전을 짓다>는 이와 같은 방식을 통해 <심청전>에 대한 새로운 해석의 가능성을 제시하는 한편, 현대의 독자와 관객들이 원전에 대한 깊은 이해를 바탕으로 사회적 하위주체의 '희생'을 재고해 볼 수 있는 기회를 제공한다.

New Control System Aspects for Supporting Complex Data and High Performance System

  • Yoo, Dae-Seung;Tan, Vu Van;Yi, Myeong-Jae
    • Journal of Computing Science and Engineering
    • /
    • 제2권4호
    • /
    • pp.394-411
    • /
    • 2008
  • The data in automation and control systems can be achieved not only from different field devices but also from different OPC (OLE for Process Control) servers. However, current OPC clients can only read and decode the simple data from OPC servers. They will have some problems to acquire structured data and exchange the structured data. In addition to the large network control systems, the OPC clients can read, write, and subscribe to thousands of data points from/to OPC servers. Due to that, the most important factor for building a high performance and scalable industrial control system is the ability to transfer the process data between server and client in the most efficient and fastest way. In order to solve these problems, we propose a means to implement the OPC DA (Data Access) server supporting the OPC complex data, so that the OPC DA clients are able to read and decode any type of data from OPC servers. We also propose a method for caching the process data in large industrial control systems to overcome the limitation of performance of the pure OPC DA system. The performance analysis and discussion indicate that the proposed system has an acceptable performance and is feasible in order for applying to real-time industrial systems today.

MBS-LVM: A High-Performance Logical Volume Manager for Memory Bus-Connected Storages over NUMA Servers

  • Lee, Yongseob;Park, Sungyong
    • Journal of Information Processing Systems
    • /
    • 제15권1호
    • /
    • pp.151-158
    • /
    • 2019
  • With the recent advances of memory technologies, high-performance non-volatile memories such as non-volatile dual in-line memory module (NVDIMM) have begun to be used as an addition or an alternative to server-side storages. When these memory bus-connected storages (MBSs) are installed over non-uniform memory access (NUMA) servers, the distance between NUMA nodes and MBSs is one of the crucial factors that influence file processing performance, because the access latency of a NUMA system varies depending on its distance from the NUMA nodes. This paper presents the design and implementation of a high-performance logical volume manager for MBSs, called MBS-LVM, when multiple MBSs are scattered over a NUMA server. The MBS-LVM consolidates the address space of each MBS into a single global address space and dynamically utilizes storage spaces such that each thread can access an MBS with the lowest latency possible. We implemented the MBS-LVM in the Linux kernel and evaluated its performance by porting it over the tmpfs, a memory-based file system widely used in Linux. The results of the benchmarking show that the write performance of the tmpfs using MBS-LVM has been improved by up to twenty times against the original tmpfs over a NUMA server with four nodes.

데이터베이스 압축 성능 향상을 위한 선택적 압축 전략 (A Selective Compression Strategy for Performance Improvement of Database Compression)

  • 이기훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권9호
    • /
    • pp.371-376
    • /
    • 2015
  • 사물인터넷 (IoT)은 데이터의 양을 상당히 증가시킨다. 데이터베이스 압축은 저장 시스템 비용과 I/O 대역폭을 절약할 수 있기 때문에 빅데이터에 있어서 중요하다. 그러나 데이터베이스 압축은 압축된 페이지에 대한 업데이트로 인해 OLTP와 같은 쓰기 집중적인 워크로드에 대해 낮은 성능을 보일 수 있다. 본 논문에서는 데이터베이스 압축의 성능 향상을 위한 실용적 가이드라인을 제시한다. 특히, 압축 페이지 크기에 의한 계산으로부터 예상되는 공간 절약과 거의 같은 공간 절약을 보이는 테이블들만을 압축하는 SELECTIVE 전략을 제시한다. TPC-C 벤치마크와 MySQL을 이용한 실험을 통해 SELECTIVE 전략이 압축하지 않는 방법에 비해 1.1배 높은 성능을 보이면서 17.3%의 공간을 절약한다는 것을 보였다.

집합 I/O와 부분군 기법의 성능 분석 (An Analysis of the Performance of Collective I/Os and the Subgroup Method)

  • 차광호;조혜영;김성호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.513-516
    • /
    • 2007
  • 많은 과학 분야 응용 어플리케이션들이 대규모 데이터 처리를 수행하면서, 병렬 I/O의 중요성이 급속도로 부각되고 있다. 특히 집합 I/O는 병렬 I/O의 중요한 개념 중 하나이며, 응용 프로그래머들이 쉽게 대용량 데이터를 취급할 수 있도록 해주고 있다. 본 연구에서는 원래의 집합 I/O들과 집합 I/O를 효과적으로 쓰기 위한 방법 중 하나인 부분군 기법의 성능을 측정하고 분석하였다. 실험 결과를 통하여 두 종류의 부분군 기법이 서로 다른 성능을 보임을 확인하였다. 집합 쓰기의 경우 부분군 기법은 성능저하를 나타냈으나 집합 읽기의 경우 적은 데이터를 사용하는 경우 우수한 성능을 보여 주고 있음을 확인하였다.

  • PDF

큐잉 모델을 이용한 분산된 리오더 버퍼 수퍼스칼라 프로세서의 성능분석 (The Performance Analysis of Distributed Reorder Buffer Superscalar Processor using Queuing Model)

  • 백석균;정진하;신광식;최상방
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.1087-1090
    • /
    • 2005
  • In all contemporary superscalar processors, the result repositories are implemented as the Reorder Buffer(ROB) slots. In such designs, the ROB is a large multi-ported structure. There are several approaches for reducing the ROB complexity in processors. The one technique relies on a distributed implementation that spreads the centralized ROB structure across the function units(FUs). Each distributed component sized to match the FU workload and with one write port and one read port on each component. We are using M/M/1 Queuing theory to determine the number of entries in each ROB component that the performance of processor depends on. Our schemes are evaluated using the simulation of CPU2000 benchmarks.

  • PDF