• 제목/요약/키워드: Memory Improvement

검색결과 699건 처리시간 0.028초

분할된 압축 인덱스를 이용한 컬럼-지향 플래시 스토리지의 검색 성능 개선 (Search Performance Improvement of Column-oriented Flash Storages using Segmented Compression Index)

  • 변시우
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.393-401
    • /
    • 2013
  • 대부분의 기존 데이터베이스들은 빠른 저장 성능을 얻기 위하여 한 레코드의 속성들을 하드 디스크에 연속적으로 배치하는 레코드-지향 저장 모델을 사용하였다. 하지만 검색이 대부분인 데이터웨어하우스 시스템에는 월등한 읽기 성능 때문에 컬럼-지향 저장 방식이 적합한 모델이 되고 있다. 또한, 현재 플래시 메모리가 고속 데이터베이스 시스템을 위한 선호 저장 매체로 인정되고 있다. 본 논문에서는 고속 컬럼-지향 데이터베이스 모델을 도입하고, 고속 컬럼-지향 데이터웨어하우스 시스템을 위한 컬럼-인지 인덱스 관리 기법을 제안한다. 본 인덱스 관리 기법은 개선된 B트리에 기반하며, 중간 노드와 리프노드에서 내장 플래시 인덱스와 빈공간 압축을 통하여 높은 검색 성능을 얻는다. 성능 평가 결과를 기반으로 본 인덱스 관리 기법이 기존 기법보다 검색 처리 및 응답 시간 측면에서 더 우수함을 확인하였다.

가상현실 경험을 복습시켜주는 사진 정리 알고리즘 (The Image Summarization Algorithm for Reviewing the Virtual Reality Experience)

  • 곽은주;조용주;조현상;박경신
    • 정보처리학회논문지B
    • /
    • 제15B권3호
    • /
    • pp.211-218
    • /
    • 2008
  • 이 논문에서 우리는 교육용 가상환경에서 사용자가 직접 촬영한 사진들을 학습 내용과 사용자의 상황 정보를 바탕으로 자동으로 사진을 정리 요약해서 가상 환경 체험이 끝난 후 짧게 보여주는 새로운 사진 정리 알고리즘을 제안한다. 이 알고리즘은 기존의 날짜, 장소, 키워드를 이용하여 많은 양의 사진을 정리 요약해주는 사진 정리 알고리즘과는 달리 사용자의 관심도와 기억해야 할 주요 학습내용을 다시 한 번 살펴보도록 함으로써 기억 향상을 도와주는 것을 목적으로 한다. 본 논문에서는 먼저 학습 효과를 높이기 위해 교육적으로 의미가 있는 사진을 추출하는 기준과 인지율 계산을 설명하고, 이 알고리즘을 가상환경과 사진 뷰어 인터페이스와 연동한 전체적인 시스템을 설명한다. 또한 이 알고리즘에 사용된 인지율 모델링을 위한 사용자 실험 분석과 향후 연구 방향에 대해 논한다.

실행시간 적응에 의한 병렬처리시스템의 성능개선 (Performance Improvement of Parallel Processing System through Runtime Adaptation)

  • 박대연;한재선
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권7호
    • /
    • pp.752-765
    • /
    • 1999
  • 대부분 병렬처리 시스템에서 성능 파라미터는 복잡하고 프로그램의 수행 시 예견할 수 없게 변하기 때문에 컴파일러가 프로그램 수행에 대한 최적의 성능 파라미터들을 컴파일 시에 결정하기가 힘들다. 본 논문은 병렬 처리 시스템의 프로그램 수행 시, 변화하는 시스템 성능 상태에 따라 전체 성능이 최적화로 적응하는 적응 수행 방식을 제안한다. 본 논문에서는 이 적응 수행 방식 중에 적응 프로그램 수행을 위한 이론적인 방법론 및 구현 방법에 대해 제안하고 적응 제어 수행을 위해 프로그램의 데이타 공유 단위에 대한 적응방식(적응 입도 방식)을 사용한다. 적응 프로그램 수행 방식은 프로그램 수행 시 하드웨어와 컴파일러의 도움으로 프로그램 자신이 최적의 성능을 얻을 수 있도록 적응하는 방식이다. 적응 제어 수행을 위해 수행 시에 병렬 분산 공유 메모리 시스템에서 프로세서 간 공유될 수 있은 데이타의 공유 상태에 따라 공유 데이타의 크기를 변화시키는 적응 입도 방식을 적용했다. 적응 입도 방식은 기존의 공유 메모리 시스템의 공유 데이타 단위의 통신 방식에 대단위 데이타의 전송 방식을 사용자의 입장에 투명하게 통합한 방식이다. 시뮬레이션 결과에 의하면 적응 입도 방식에 의해서 하드웨어 분산 공유 메모리 시스템보다 43%까지 성능이 개선되었다. Abstract On parallel machines, in which performance parameters change dynamically in complex and unpredictable ways, it is difficult for compilers to predict the optimal values of the parameters at compile time. Furthermore, these optimal values may change as the program executes. This paper addresses this problem by proposing adaptive execution that makes the program or control execution adapt in response to changes in machine conditions. Adaptive program execution makes it possible for programs to adapt themselves through the collaboration of the hardware and the compiler. For adaptive control execution, we applied the adaptive scheme to the granularity of sharing adaptive granularity. Adaptive granularity is a communication scheme that effectively and transparently integrates bulk transfer into the shared memory paradigm, with a varying granularity depending on the sharing behavior. Simulation results show that adaptive granularity improves performance up to 43% over the hardware implementation of distributed shared memory systems.

Adaptive length SMA pendulum smart tuned mass damper performance in the presence of real time primary system stiffness change

  • Contreras, Michael T.;Pasala, Dharma Theja Reddy;Nagarajaiah, Satish
    • Smart Structures and Systems
    • /
    • 제13권2호
    • /
    • pp.219-233
    • /
    • 2014
  • In a companion paper, Pasala and Nagarajaiah analytically and experimentally validate the Adaptive Length Pendulum Smart Tuned Mass Damper (ALP-STMD) on a primary structure (2 story steel structure) whose frequencies are time invariant (Pasala and Nagarajaiah 2012). In this paper, the ALP-STMD effectiveness on a primary structure whose frequencies are time varying is studied experimentally. This study experimentally validates the ability of an ALP-STMD to adequately control a structural system in the presence of real time changes in primary stiffness that are detected by a real time observer based system identification. The experiments implement the newly developed Adaptive Length Pendulum Smart Tuned Mass Damper (ALP-STMD) which was first introduced and developed by Nagarajaiah (2009), Nagarajaiah and Pasala (2010) and Nagarajaiah et al. (2010). The ALP-STMD employs a mass pendulum of variable length which can be tuned in real time to the parameters of the system using sensor feedback. The tuning action is made possible by applying a current to a shape memory alloy wire changing the effective length that supports the damper mass assembly in real time. Once a stiffness change in the structural system is detected by an open loop observer, the ALP-STMD is re-tuned to the modified system parameters which successfully reduce the response of the primary system. Significant performance improvement is illustrated for the stiffness modified system, which undergoes the re-tuning adaptation, when compared to the stiffness modified system without adaptive re-tuning.

GPU 성능 향상을 위한 MSHR 활용률 기반 동적 워프 스케줄러 (MSHR-Aware Dynamic Warp Scheduler for High Performance GPUs)

  • 김광복;김종면;김철홍
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제8권5호
    • /
    • pp.111-118
    • /
    • 2019
  • GPU는 병렬처리가 가능한 강력한 하드웨어 자원을 기반으로 높은 처리량을 제공한다. 하지만 과도한 메모리 요청이 발생하는 경우 캐쉬 효율이 낮아져 GPU 성능이 크게 감소할 수 있다. 캐쉬에서의 경합이 심각하게 발생한 경우 동시 처리되는 스레드의 수를 감소시킨다면 캐쉬에서의 경합이 완화되어 전체 성능을 향상시킬 수 있다. 본 논문에서는 캐쉬에서의 경합 정도에 따라 동적으로 병렬성을 조절할 수 있는 워프 스케줄링 기법을 제안한다. 기존 워프 스케줄링 정책 중 LRR은 GTO에 비해 워프 수준의 병렬성이 높다. 따라서 제안하는 워프 스케줄러는 L1 데이터 캐쉬 경합 정도를 반영하는 MSHR(Miss Status Holding Register)이 낮은 자원 활용률을 보일 때 LRR 정책을 적용한다. 반대로 MSHR 자원 활용률이 높을 때는 워프 수준의 병렬성을 낮추기 위해 GTO 정책을 적용하여 워프 우선순위를 결정한다. 제안하는 기법은 동적으로 스케줄링 정책을 선택하기 때문에 기존의 고정된 LRR과 GTO에 비해 높은 IPC 성능과 캐쉬 효율을 보여준다. 실험 결과 제안하는 동적 워프 스케줄링 기법은 LRR 정책에 비해 약 12.8%, GTO 정책에 비해 약 3.5% IPC 향상을 보인다.

SSD 캐시를 위한 이웃 프리페칭 기법 (A Neighbor Prefetching Scheme for a Hybrid Storage System)

  • 백승훈
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권5호
    • /
    • pp.40-52
    • /
    • 2018
  • 플래시 기반의 SSD(solid state drive)를 HDD(hard disk drive)의 2차 캐시로 사용하는 기술이 많이 연구되었다. SSD를 이용한 캐시에 대한 캐시 교체 정책 및 관리에 관한 연구뿐만 아니라 프리페칭 연구도 필요하게 되었다. 본 논문은 SSD를 스토리지급 캐시로 사용하는 시스템을 위한 프리페칭 기술을 제시한다. 이 프리페칭 기술은 스토리지급 크기의 캐시에 맞게 대규모의 프리페칭이며, 단기적인 프리페칭은 1차 캐시인 주메모리에서 수행되므로 장기적 스케줄링을 기반한 프리페칭이며, 기존 프리페칭은 읽기만을 고려하였지만, 지속 가능한 SSD 캐시를 위해 쓰기 요청도 고려한 프리페칭이다. 어떤 사용자의 14일간의 입출력에서, 64GB 용량의 SSD에 프리페칭 용량이 4GiB일 때에, 2.3%에서 17.8%의 캐시 적중률 향상을 보였다. 본 기술은 구현이 간단하여 스토리지급 캐시 시스템에 쉽게 적용할 수 있다.

모바일 기기의 실시간 작업 지원을 위한 종단간 자원 관리 기술 (End-to-End Resource Management Techniques for Supporting Real-time Tasks in Mobile Devices)

  • 반효경
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.43-48
    • /
    • 2022
  • 최근 모바일 기기의 성능이 급격히 향상되고 다양한 앱이 등장하면서 대화형 작업뿐 아니라 실시간 작업을 동반하는 앱이 늘고 있다. 한편, 실시간 작업은 데드라인 제약 조건이 있어 종래의 시분할 시스템이 추구하던 자원 관리 정책으로는 실시간 제약 조건을 만족하는 데에 한계가 있다. 본 논문에서는 모바일 기기에서 대화형 작업과 실시간 작업이 동시에 실행될 때 CPU, 메모리, 스토리지로 이어지는 종단간 자원 관리를 어떻게 함으로써 실시간 작업의 제약 조건을 만족하면서 자원의 효율적인 관리가 가능한지에 대해 알아본다. 본 논문에서는 복잡한 자원관리 정책의 제안보다 각 자원들이 실시간 작업의 조건을 만족하기 위해 필요한 기본 개념에 대해 살펴보는 데에 초점을 맞춘다. CPU의 경우 실시간 작업을 위한 전담코어 할당, 메모리의 경우 워킹셋의 일정 비율을 보장하는 방식, 스토리지의 경우 고속 스토리지를 사용하고 문맥교환을 생략하는 방식 등 기본적인 지원 방안을 알아보고 이를 어떻게 효율화할 수 있는지에 대해 알아본다.

폴리실라잔 고체 전해질 층과 은 활성 전극의 공정이 멤리스터의 전기적 특성에 미치는 영향 (Effect of the Processes of Polysilazane Solid Electrolyte Layer and Silver Active Electrode on the Electrical Characteristics of Memristor)

  • 양희수;오경석;김동수;권진혁;김민회
    • 전기전자학회논문지
    • /
    • 제27권1호
    • /
    • pp.25-29
    • /
    • 2023
  • 폴리실라잔 고체 전해질 층과 은(Ag) 활성 전극의 공정이 멤리스터의 전기적 특성에 미치는 영향을 살펴보았다. 더 높은 온도에서 어닐링된 고체 전해질을 갖는 멤리스터가 더 낮은 온도에서 어닐링된 고체 전해질을 갖는 소자보다 더 높은 set voltage 및 더 나은 메모리 유지 특성을 보였다. 어닐링 온도 증가에 따른 set voltage의 증가 및 메모리 유지 특성의 향상은 각각 고체 전해질 층 내부의 빈 공간의 감소 및 균일도 증가 때문인 것으로 사료된다. 고체 전해질 층을 비교적 높은 온도에서 어닐링 할지라도, 폴리실라잔 용액의 농도가 지나치게 높은 경우에는 멤리스터의 저저항상태가 유지되지 못했다. 마지막으로, 용액공정으로 형성한 Ag 활성 전극을 갖는 멤리스터는 진공공정으로 형성한 Ag 활성 전극을 갖는 소자와 달리 WORM 특성을 갖는 것으로 나타났다. 이러한 WROM 특성은 용액공정 Ag 활성 전극에 존재하는 형태적 결함 때문인 것으로 사료된다.

Analysis of streamflow prediction performance by various deep learning schemes

  • Le, Xuan-Hien;Lee, Giha
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.131-131
    • /
    • 2021
  • Deep learning models, especially those based on long short-term memory (LSTM), have presented their superiority in addressing time series data issues recently. This study aims to comprehensively evaluate the performance of deep learning models that belong to the supervised learning category in streamflow prediction. Therefore, six deep learning models-standard LSTM, standard gated recurrent unit (GRU), stacked LSTM, bidirectional LSTM (BiLSTM), feed-forward neural network (FFNN), and convolutional neural network (CNN) models-were of interest in this study. The Red River system, one of the largest river basins in Vietnam, was adopted as a case study. In addition, deep learning models were designed to forecast flowrate for one- and two-day ahead at Son Tay hydrological station on the Red River using a series of observed flowrate data at seven hydrological stations on three major river branches of the Red River system-Thao River, Da River, and Lo River-as the input data for training, validation, and testing. The comparison results have indicated that the four LSTM-based models exhibit significantly better performance and maintain stability than the FFNN and CNN models. Moreover, LSTM-based models may reach impressive predictions even in the presence of upstream reservoirs and dams. In the case of the stacked LSTM and BiLSTM models, the complexity of these models is not accompanied by performance improvement because their respective performance is not higher than the two standard models (LSTM and GRU). As a result, we realized that in the context of hydrological forecasting problems, simple architectural models such as LSTM and GRU (with one hidden layer) are sufficient to produce highly reliable forecasts while minimizing computation time because of the sequential data nature.

  • PDF

Resolving Memory Bottlenecks in Hardware Accelerators with Data Prefetch

  • Hyein Lee;Jinoo Joung
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.1-12
    • /
    • 2024
  • 최근 다양한 분야에서 딥러닝이 사용되면서, 더 빠르고 정확한 결과를 내는 딥러닝이 더욱 중요해졌다. 이를 위해서는 많은 양의 저장 공간이 필요하고, 대용량 연산을 진행해야 한다. 이에 따라 여러 연구는 빠르고 정확하게 연산 처리가 가능한 하드웨어 가속기를 이용한다. 하지만 하드웨어 가속기는 CPU와 하드웨어 사이를 이동하면서 병목현상이 발생하게 된다. 따라서 본 논문에서는 하드웨어 가속기의 병목현상을 효율적으로 줄일 수 있는 데이터 프리패치 전략을 제안한다. 데이터 프리패치 전략의 핵심 아이디어는 Matrix Multiplication Unit(MMU)가 연산을 진행하는 동안 다음 연산에 필요한 데이터를 예측하여 로컬 메모리로 올려 병목현상을 줄인다. 또한, 이 전략은 듀얼 버퍼를 이용하여 읽고 쓰는 두 가지 동작을 동시에 진행하여 처리율을 높인다. 이를 통해 데이터 전송의 지연시간 및 실행 시간을 감소시킨다. 시뮬레이션을 통해 듀얼 버퍼를 이용한 병렬 프로세싱과 데이터 프리패치를 이용한 메모리 간 병목현상을 최대한 감소시켜 하드웨어 가속기의 성능이 24% 향상함을 알 수 있다.