• Title/Summary/Keyword: Data Memory

Search Result 3,302, Processing Time 0.029 seconds

Large-scale 3D fast Fourier transform computation on a GPU

  • Jaehong Lee;Duksu Kim
    • ETRI Journal
    • /
    • 제45권6호
    • /
    • pp.1035-1045
    • /
    • 2023
  • We propose a novel graphics processing unit (GPU) algorithm that can handle a large-scale 3D fast Fourier transform (i.e., 3D-FFT) problem whose data size is larger than the GPU's memory. A 1D FFT-based 3D-FFT computational approach is used to solve the limited device memory issue. Moreover, to reduce the communication overhead between the CPU and GPU, we propose a 3D data-transposition method that converts the target 1D vector into a contiguous memory layout and improves data transfer efficiency. The transposed data are communicated between the host and device memories efficiently through the pinned buffer and multiple streams. We apply our method to various large-scale benchmarks and compare its performance with the state-of-the-art multicore CPU FFT library (i.e., fastest Fourier transform in the West [FFTW]) and a prior GPU-based 3D-FFT algorithm. Our method achieves a higher performance (up to 2.89 times) than FFTW; it yields more performance gaps as the data size increases. The performance of the prior GPU algorithm decreases considerably in massive-scale problems, whereas our method's performance is stable.

반도체 공정에서 인 메모리 데이터 그리드를 이용한 고속의 빅데이터 처리 시스템 구현 (Implementation of High Speed Big Data Processing System using In Memory Data Grid in Semiconductor Process)

  • 박종범;이방원;김성중
    • 한국ITS학회 논문지
    • /
    • 제15권5호
    • /
    • pp.125-133
    • /
    • 2016
  • 최근 하드웨어와 소프웨어의 발전으로 데이터의 처리 용량과 처리 속도도 급속하게 증가하고 있다. 이로 인한 데이터 사용량은 기하급수적으로 증가하고 있으며, 이미 컴퓨터가 처리해야하는 자료는 초당 5천 트랜잭션을 넘었다. 이처럼 빅데이터가 중요한 이유는 실시간 때문이며, 이는 어떠한 상황에서도 모든 데이터를 분석하여 정확한 데이터를 적시에 얻을 수 있기 때문이다. 또한, 빅데이터를 활용한 스마트 공장을 만들면 개발 및 생산비용, 품질관리 비용 감소효과가 있을 것으로 예상하고 많은 연구가 수행되고 있다. 본 논문에서는 많은 데이터들이 발생하는 반도체 공정에서 고속의 빅데이터 처리를 위한 인-메모리 데이터 그리드를 이용한 시스템을 구현하였으며, 실험을 통해 향상된 성능을 입증하였다. 구현한 시스템은 반도체 뿐 만 아니라 빅데이터를 사용하는 모든 부분에서 응용 가능 할 것으로 판단된다.

Research on Improving Memory of VR Game based on Visual Thinking

  • Lu, Kai;Cho, Dong Min;Zou, Jia Xing
    • 한국멀티미디어학회논문지
    • /
    • 제25권5호
    • /
    • pp.730-738
    • /
    • 2022
  • Based on visual Thinking theory, VR(virtual reality) game changes the traditional form of memory and maps the content into game elements to realize the immersive spatial memory mode. This paper analyzes the influencing factors of game design and system function construction. This paper proposes a hypothesis: with the help of visual thinking theory, VR game is helpful to improve learners' visual memory, and carries out research. The experiment sets different levels of game through empirical research and case analysis of memory flip game. For example, when judging two random cards. If the pictures are the same, it will be judged as the correct combination; if they are different, the two cards will be restored to the original state. The results are analyzed by descriptive statistical analysis and AMOS data analysis. The results show that game content using the concept of "Memory Palace", which can improve the accuracy of memory. We conclude that the use of spatial localization characteristics in flip games combining visual thinking can improve users' memory by helping users memorize and organize information in a Virtual environment, which means VR games have strong feasibility and effectiveness in improving memory.

GPU를 이용한 Quantum-Inspired Evolutionary Algorithm 가속 (GPU-Based Acceleration of Quantum-Inspired Evolutionary Algorithm)

  • 류지현;박한민;최기영
    • 대한전자공학회논문지SD
    • /
    • 제49권8호
    • /
    • pp.1-9
    • /
    • 2012
  • Quantum-Inspired Evolutionary Algorithm(QEA)은 알고리즘 자체에 충분한 data-level parallelism이 내재되어 있어 GPU를 이용한 가속에 용이하다. 그러나 효과적인 실행시간의 단축을 위해서는 CPU와 GPU에의 적절한 task-mapping이 필요하다. 이때 단순히 함수 자체의 병렬성만을 고려하는 것이 아니라 CPU와 GPU간의 데이터 전송도 고려하여 task-mapping을 할 필요가 있다. 또한 추가적인 성능향상을 위하여 zero-copy host memory와 적절한 execution configuration의 사용, 그리고 memory coalescing 등을 이용할 수 있다. 그 결과 30,000개의 item수를 가진 0-1 knapsack problem에 대한 QEA의 수행을 multi-threading CPU에 비해 평균 3.69배 빠르게 할 수 있었다.

교환 시스템에서의 이중화 저장장치 (Redundant Storage Device in Communication System)

  • 노승환
    • 한국통신학회논문지
    • /
    • 제29권4B호
    • /
    • pp.403-410
    • /
    • 2004
  • 일반적으로 교환 시스템은 프로세서 보드, 입출력처리 보드 및 데이터 저장 장치등 그 기능별로 다수의 서브시스템들로 구성되어 있다. 또한 신뢰성을 확보하기 위하여 모든 서브 보드들은 이중화로 되어 있다. 교환시스템에서 저장 장치에는 시스템에 관련된 정보나 과금 정보등과 같은 작업 관련 데이터를 저장하며 비 휘발성 메모리에 저장해야 한다. 일반적으로 비 휘발성 저장장치를 구현할 때는 플래시메모리(flash memory) 또는 배터리 백업 메모리(battery backup memory)를 사용한다. 그러나 메모리는 단위 용량당 가격이 높고 백업(backup) 하지 않은 데이터를 손실했을 때 복구할 수 없다. 본 논문에서는 마이크로 컨트롤러를 이용하여 단위 용량당 가격이 저렴하고, 대용량의 데이터를 저장함과 동시에 이중화를 만족시키는 on-board 형태의 소형 디스크 모듈을 설계 구현하였다. 본 논문에서 구현된 이중화 저장장치는 사용 중인 엑티브(active) 디스크에 결함이 생겨 사용할 수 없을 경우에 리빌딩(rebuilding)과정을 동해 스탠바이 모듈로부터 데이터를 복구하며, 리빌딩 중에도 호스트 시스템은 스탠바이 디스크모듈을 이용하여 지속적으로 서비스를 제공할 수 있도록 설계되었다. 본 연구에서 개발된 저장장치는 교환시스템에서 플래시 메모리와 같은 값비싼 저장 장치를 대체 할 수 있을 것으로 기대된다.

비휘발성 메모리를 이용한 로그 구조 파일 시스템의 성능 향상 (Improving Log-Structured File System Performance by Utilizing Non-Volatile Memory)

  • 강양욱;최종무;이동희;노삼혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권5호
    • /
    • pp.537-541
    • /
    • 2008
  • 로그 구조 파일 시스템(Log-Structured File System, LFS)은 변경된 데이타를 메모리에 충분히 모아서 한번에 순차 쓰기로 디스크에 기록함으로써 높은 쓰기 성능을 실현한 파일 시스템이다. 그러나 실제 시스템에서는 여전히 디스크와 메모리 상의 일관성을 위해서 동기화가 발생하며 변경된 데이타를 충분히 메모리에 모으지 못한 채 디스크로 쓰기가 발생하는 모습을 보인다. 자주 발생되는 쓰기는 클리너의 오버헤드를 증가시키고, 더 많은 메타데이타를 기록하게 한다. 본 연구에서는 비휘발성 메모리를 이용해서 동기화를 없애고, 작은 단위의 쓰기를 효과적으로 활용하도록 LFS와 운영체제의 관련된 서브 시스템들을 변경하였다. 이를 통하여 DRAM만 있는 LFS에 비해서 256M의 NVRAM을 가진 시스템에서 약 2.5배의 성능 향상을 보였다.

모바일 DBMS를 위한 효율적인 압축 데이터 관리 시스템의 개발 (Development of the Efficient Compressed Data Management System for Embedded DBMS)

  • 신영재;황진호;김학수;이승미;손진현
    • 정보처리학회논문지D
    • /
    • 제15D권5호
    • /
    • pp.589-598
    • /
    • 2008
  • 최근 휴대용 정보기기 사용이 보편화되어지고, 정보의 디지털화로 인해 휴대용 정보기기에서 처리되어야 하는 정보가 무수히 많아지고 있다. 이로 인해 휴대용 정보기기에서는 정보들을 효과적으로 관리하기 위해 모바일 DBMS의 사용이 요구되고 있다. 또한 휴대용 정보기기에서 보편적으로 사용되는 저장장치는 NAND형 플래시 메모리로 단위 공간당 비용이 기존의 하드디스크에 비해 수십 배 가량 높아 저장 공간의 효율적인 관리가 요구되고 있다. 따라서 본 논문에서는 플래시메모리를 저장매체로 사용하는 모바일 DBMS에서 압축 기법을 사용한 효율적인 데이터 관리 시스템을 제안한다. 제안되는 압축 기반 시스템은 저장 공간의 절약을 가져오고, 데이터 입출력을 줄인다. 이러한 이점은 플래시 메모리의 수명을 연장시키는 효과 또한 기대할 수 있다.

트리 자료구조를 이용한 비 휘발성 메모리의 가비지 수집 기법 (Garbage Collection Technique for Non-volatile Memory by Using Tree Data Structure)

  • 이도근;원유집
    • 정보과학회 논문지
    • /
    • 제43권2호
    • /
    • pp.152-162
    • /
    • 2016
  • 비 휘발성 메모리를 할당받아 사용하기 위해서는 비 휘발성 메모리 전용의 가비지 수집 기법이 필수적이다. 본 논문에서는 이를 위해 비 휘발성 메모리 할당 정보 관리용 메타데이터를 설계하였고 이를 Allocation Tree라고 명명하였다. 이 메타데이터는 검색 속도의 향상을 위해 트리 자료구조를 이용하여 구성되었고, 하나의 노드 안에는 할당 메모리 시작 주소와 저장소 ID 정보가 키-밸류 형태로 저장된다. 비 휘발성 메모리 공간이 부족하여 가용 공간이 70% 이하로 떨어지면 가비지 수집기가 작동되어 가비지 수집을 수행하게 되고 Allocation Tree와 사용자 데이터를 비교하여 가비지를 판정한다. 본 연구에서는 이 알고리즘을 Persistent Heap기반의 메모리 할당 플랫폼인 'HEAPO'에서 구현하여 정상적으로 동작함을 증명하였다.

OFDM 통신시스템을 위한 radix-22 MDF IFFT의 메모리 감소 기법 (Memory Reduction Method of Radix-22 MDF IFFT for OFDM Communication Systems)

  • 조경주
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권1호
    • /
    • pp.42-47
    • /
    • 2020
  • OFDM 기반 초고속 통신시스템을 위한 IFFT/FFT 프로세서는 저면적 저전력이면서 데이터 처리량이 높고 프로세싱 지연이 적어야 한다. 따라서, 파이프라인과 병렬처리를 적용한 radix-2k 알고리즘 기반 MDF(multipath delay feedback) 구조가 적합하다. 기존의 MDF 구조에서 입력신호의 워드길이에 비례하여 커지는 피드백 메모리는 면적과 전력소모가 크다. 본 논문에서는 OFDM 응용을 위한 radix-22 MDF IFFT 프로세서의 피드백 메모리 크기 감소 방법을 제안한다. MDF 구조에서 첫 두 스테이지의 피드백 메모리의 크기는 전체 피드백 메모리의 75%를 차지하므로 첫 두 스테이지의 피드백 메모리 크기 감소에 초점을 맞춘다. OFDM 전송에서 IFFT 입력신호는 변조데이터와 파일럿과 널 신호로 구성된다는 특징을 이용하여 변조데이터와 파일럿/널 신호를 각각 부호있는 정수로 매핑하여 입력신호의 워드길이를 감소시키는 방법을 제안한다. 시뮬레이션을 통해 제안한 방법이 기존 방법보다 피드백 메모리의 크기를 약 39%까지 감소시킬 수 있음을 보인다.

이동 기기를 위한 플래시 메모리 파일 시스템 (Flash Memory File System for Mobile Devices)

  • 배영현;최종무;이동희;노삼혁;민상렬
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권4호
    • /
    • pp.368-380
    • /
    • 2005
  • 휴대 전화와 같은 소형 이동 기기에서 데이터 저장 장치로 널리 사용되는 플래시 메모리를 위한 파일 시스템은 고속의 데이터 쓰기 및 읽기 성능뿐만 아니라 소형 이동 기기의 사용 환경에 적합하도록 메모리 사용량이 적고 전원 오류 등의 상황에서도 데이터의 무결성을 보장하여야 한다 본 논문에서는 파일 시스템 수준에서 플래시 메모리의 물리적 동자 특성과 데이터 저장 상태를 고려하여 데이터 쓰기 요청을 제어함으로써 성능을 최적화한 플래시 메모리 파일 시스템을 구현한다. 구현된 파일 시스템은 모든 작업을 트랜잭션 개념으로 처리하여 오류 상황에서도 저장 장치의 신뢰성을 좌장하며 단순한 구조의 주소 사상 기법을 적용하여 메모리 사용량을 최소화한다. 그리고 실제 하드웨어 환경에서 제안된 기술을 구현하고 기존 플래시 메모리 파일 시스템과의 비교 측정을 통해 성능의 우수성을 보인다.