• 제목/요약/키워드: Data Memory

검색결과 3,302건 처리시간 0.037초

메모리 파일시스템에서 메모리 매핑을 이용한 파일 입출력의 오버헤드 분석 (Analyzing the Overhead of the Memory Mapped File I/O for In-Memory File Systems)

  • 최정식;한환수
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권10호
    • /
    • pp.497-503
    • /
    • 2016
  • 비휘발성 메모리 같은 차세대 저장장치의 등장으로 저장장치 지연시간은 거의 사라질 것이다. 예전에는 저장장치 지연시간이 가장 큰 문제였기 때문에 소프트웨어의 효율성은 중요한 문제가 아니었다. 하지만 이제는 소프트웨어 오버헤드가 해결해야 할 문제점으로 나타나고 있다. 소프트웨어 오버헤드를 최소화하기 위해 많은 연구자들은 메모리 매핑을 이용한 파일 입출력 기법을 제안하고 있다. 메모리 맵 파일 입출력 기법을 사용하면 기존 운영체제의 복잡한 파일 입출력 스택을 피할 수 있을 뿐 아니라 빈번한 사용자/커널 모드 변환도 최소화할 수 있다. 또한 다수의 메모리 복사 오버헤드도 최소화 할 수 있다. 하지만 메모리 맵 파일 입출력 기법에도 해결해야 할 문제점이 존재한다. 메모리 맵 파일 입출력 메커니즘도 느린 블록 디바이스를 효율적으로 관리하기 위해 설계된 기존 운영체제의 일부이기 때문이다. 본 논문에서는 메모리 맵 파일 입출력의 오버헤드 문제점을 설명하고 실험을 통해 그 문제점을 확인한다.

암묵적 기억의 발달: 지식기반과 메타기억의 영향 (Development of Implicit Memory: The Effect of Knowledge Base and Meta Memory)

  • 장세희
    • 한국콘텐츠학회논문지
    • /
    • 제15권9호
    • /
    • pp.639-651
    • /
    • 2015
  • 본 연구는 지식기반과 메타기억이 범주 예 생성 과제를 통해 측정되는 개념적 암묵적 기억에 영향을 미치는 지를 살펴보는데 목적이 있다. 본 연구의 대상은 서울과 경기도의 초등학교 2학년 60명, 초등학생 6학년 60명, 고등학생 60명, 총 180명이었다. 대상 아동들에게 범주예 생성 암묵적 기억검사, 지식기반검사, 메타기억검사를 시행하였다. 수집된 자료는 공변량 분석을 실시하였고, Scheffe 사후검증을 실시하였다. 연구결과 첫째, 연령이 높을수록 암묵적 기억이 발달하였다. 암묵적 기억량은 초등학교 2학년과 고등학생, 초등학교 6학년과 고등학생 간에 유의하게 차이가 나타났다. 둘째, 아동의 지식기반수준이 높을수록 암묵적 기억이 발달하였다. 연령과 지식기반의 유의한 차이가 나타났다. 셋째, 아동의 메타기억이 높을수록 암묵적 기억이 발달하였다. 본 연구결과들로 연령, 지식기반, 그리고 메타기억이 암묵적 기억의 발달에 중요한 요인이라는 것을 알 수 있었다. 그리고 아동이 연령에 따라 지식기반과 메타기억이 발달한다면 암묵적 기억이 발달할 것이라는 시사점을 제공한다.

계층적 메모리 구성에 따른 GPU 성능 분석 (Analysis on the GPU Performance according to Hierarchical Memory Organization)

  • 최홍준;김종면;김철홍
    • 한국콘텐츠학회논문지
    • /
    • 제14권3호
    • /
    • pp.22-32
    • /
    • 2014
  • 병렬 연산에 최적화된 하드웨어를 가진 GPU를 그래픽스 작업 이외에 범용 작업에 활용하고자, 최근에 GPGPU 기술이 큰 관심을 받고 있다. GPU와 같은 대용량 병렬처리 장치에서는 메모리 시스템이 성능에 큰 영향을 미치게 된다. GPU에서는 메모리 시스템의 효율성을 향상시키기 위하여, 메모리 대역폭 사용률을 감소시켜주는 계층적 메모리 구조와 메모리를 요청하는 트랜잭션을 줄여주는 메모리 주소 접합과 메모리 요청 합병 등의 기술들을 사용한다. 본 논문에서는 메모리 시스템 효율성 향상을 위해 활용되는 기법들이 GPU 성능에 미치는 영향을 정량적으로 평가하고 분석하기 위해, 다양한 메모리 구조에 대한 실험을 수행한다. 실험 결과에 따르면, 캐쉬를 사용하지 않는 경우에 비해 8KB, 16KB, 32KB, 64KB의 L1 캐쉬를 추가하면 평균적으로 15.5%, 21.5%, 25.5%, 30.9%의 성능이 각각 향상된다. 하지만, 일부 벤치마크 프로그램에서는 데이터 일관성을 유지하기 위하여 메모리 트랜잭션이 증가함에 따라 오히려 성능이 감소하는 결과를 보이기도 한다. 그리고 메모리 요청에 대한 미스가 많이 발생하는 경우에는 캐쉬 레벨이 증가함에 따라 평균 메모리 접근 지연 시간이 증가하기도 한다.

Multi-Access Memory System(MAMS)의 속도 향상을 위한 아키텍처 설계 (Architecture design for speeding up Multi-Access Memory System(MAMS))

  • 고경식;김재희;이스라엘;박종원
    • 전자공학회논문지
    • /
    • 제54권6호
    • /
    • pp.55-64
    • /
    • 2017
  • 대용량 고화질의 영상 응용분야에서는 많은 양의 데이터를 고속으로 처리하는 기술이 필요하며, 이를 위해 고속화된 병렬처리 시스템이 요구된다. 2004년 park은 병렬처리 메모리의 충돌 없이 여러 처리기에 데이터를 접속할 수 있는 방법을 제안하였다. 제안된 MAMS(Multi-Access Memory System) 는 이후 MAMS-PP16 및 MAMS-PP64 등으로 추가적인 연구가 이루어졌다. MAMS는 병렬처리를 위한 메모리 아키텍처로써 One-chip으로 구성되어야하기 때문에 기존 MAMS와 동일한 기능을 수행하면서 아키텍처의 최소화 하는 방법의 연구가 필요하다. 주소 계산 (ACR : Address Calculation and Routing) circuit과 MMS(Memory Module Selection)circuit의 아키텍처는 메모리에 있는 데이터를 병렬처리기(Prossing Elements)들에게 전달한다. 본 논문에서는 MMS circuit을 사용하지 않고 ACR circuit 내부에 1개의 쉬프트와 메모리 모듈의 개수만큼의 조건문으로 구성하는 방법을 통해 아키텍처를 최소화 하는 방법을 제안한다. 구현한 아키텍처의 검증을 위해 Image correlation 실험을 하였다. 실험을 통하여 제안된 MAMS-PP64의 처리시간을 측정 하였으며, 그 결과 Ratio가 평균 1.05향상 된 결과를 확인 할 수 있었다.

플래쉬 메모리기반 저장장치에서의 공간분할기법 색인의 성능 평가 (The Performance Evaluation of a Space-Division typed Index on the Flash Memory based Storage)

  • 김동현
    • 한국정보통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.103-108
    • /
    • 2014
  • 스마트폰과 같은 휴대용 기기에서 많이 사용되는 플래쉬 메모리는 비휘발성 저장장치로 작은 크기에 대용량 데이터를 안정적으로 저장할 수 있는 장점을 가지고 있다. 플래쉬 메모리에 저장된 대용량 데이터에 대한 질의 연산을 효율적으로 처리하기 위하여 색인을 사용해야 한다. 그러나 플래쉬 메모리는 쓰기 연산의 속도가 느리고 덮어쓰기 연산을 지원하지 않기 때문에 기존의 색인을 평가하고 개선점을 파악할 필요가 있다. 이 논문에서는 플래쉬 메모리에 적용한 공간분할 기법의 공간 색인에 대한 성능을 평가한다. 이를 위하여 고정그리드파일을 구현하여 다양한 환경에서 질의 연산과 변경 연산의 평균 연산 수행 속도를 측정한다. 그리고 자기디스크 저장장치에서의 수행속도와 비교한다.

메모리 크기에 효율적인 적분영상 하드웨어 설계 연구 (A Study of Integral Image Hardware Design for Memory Size Efficiency)

  • 이수현;정용진
    • 전자공학회논문지
    • /
    • 제51권9호
    • /
    • pp.75-81
    • /
    • 2014
  • 적분영상은 입력영상의 픽셀 값을 기준좌표부터 순차적으로 누적하여 만든 영상으로, Haar-like features와 같은 네모난 박스 모양의 필터 연산을 효율적으로 처리하기 위하여 사용된다. 그러나 적분영상은 입력영상보다 3배 이상 많은 메모리를 소모하기 때문에, 메모리 자원이 제한적인 하드웨어 설계 환경에서는 사용이 어렵다. 본 논문에서는 효율적인 메모리 사용을 위한 적분영상 하드웨어 설계 방법을 제안한다. 해당 방법은 적분영상 이외에 세로적분영상과 가로적분영상을 생성하고, 입력영상을 재사용 하는 방법을 사용한다. 그리고 박스 필터의 크기에 따라 modulo 연산을 적용하여 적분영상의 데이터 크기를 줄이는 방법을 함께 적용하였다. 적분 영상 데이터를 읽기 위해 나누어진 영상 데이터를 다시 덧셈해야하는 연산 오버헤드가 발생하지만, 4개의 데이터를 단순히 더하는 연산이므로 병렬처리가 가능한 하드웨어 환경에서는 큰 영향을 미치지 않는다. Xilinx사의 Virtex5-LX330T를 대상으로 실험한 결과 $640{\times}480$ 크기의 8bit gray-scale 입력영상에서 최대 $32{\times}32$ 크기의 필터사용을 기준으로 50%의 적분영상 메모리를 감소시킬 수 있다.

공유 메모리 기반 시스토릭 어레이 FFT 프로세서 설계 및 구현 (Design and Implementation Systolic Array FFT Processor Based on Shared Memory)

  • 정동민;노윤석;손한나;정용철;정윤호
    • 전기전자학회논문지
    • /
    • 제24권3호
    • /
    • pp.797-802
    • /
    • 2020
  • 본 논문에서는 base-4 시스토릭 어레이 FFT 프로세서에서 사용되는 여러 메모리를 하나의 메모리로 공유함으로써 기존 보다 작은 메모리 면적의 FFT 프로세서의 설계 및 구현 결과를 제시한다. 메모리를 공유하여 면적이 줄어드는 장점이 생겼으며, 데이터의 입출력이 하나의 메모리에서 진행되므로 데이터의 흐름이 단순해졌다. 제시한 FFT 프로세서를 FPGA 디바이스 상에서 구현 및 검증하였으며, 구현 결과 4096-point FFT 기준 51,855개의 CLB LUT, 29,712개의 CLB registers, 8개의 block RAM tile과 450개의 DSP로 구현되었고, 최대 동작 주파수는 150MHz 인 것을 확인했으며 특히, 기존 base-4 시스토릭 어레이 구조 대비 메모리 면적이 65% 감소 가능함을 확인하였다.

스토리지 클래스 메모리에서의 파일 접근 설계 (A Design for File Access in Storage Class Memory-based Computer Systems)

  • 박성민;원유집;강수용
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권2호
    • /
    • pp.247-254
    • /
    • 2013
  • PRAM, FRAM, MRAM 등 스토리지 클래스 메모리(SCM)는 가까운 미래에 접근 속도는 DRAM에 용량은 플래시 메모리에 근접할 것으로 예상된다. 따라서 SCM이 컴퓨터 시스템에서 메모리(DRAM)뿐만 아니라 스토리지(하드디스크 혹은 플래시 메모리)를 대체할 수 있을 것이다. 이 논문에서는 SCM 기반 컴퓨터 시스템을 위한 효율적인 파일 접근 프레임워크를 제안한다. 제안하는 프레임워크는 SCM에 파일 저장을 위한 영역과 메모리 사용을 위한 영역을 구분하지 않는다. 또한 제안하는 프레임워크는 파일 관리를 위하여 단일 데이터 접근 경로, 파일 매핑을 통한 제로 카피 데이터 읽기, 카피 온 라이트 기반 데이터 쓰기, 다수 페이지 프리 폴팅 등 다양한 메모리 관련 기술들을 사용한다. 주요 실험 결과를 통해서 논문에서 제안하는 프레임워크는 SCM 기반 컴퓨터 시스템의 운영체제 디자인을 위한 초석이 될 것이다.

효율적인 채널 정보 메모리 관리를 위한 PCM 엔코더 설계 (Design of Advanced PCM Encoder Architecture for Efficient Channel Information Memory Management)

  • 노윤희;김건희;김동영;김복기;이남식
    • 한국항행학회논문지
    • /
    • 제24권4호
    • /
    • pp.305-313
    • /
    • 2020
  • 원격측정 시스템은 비행체의 상태 정보 데이터를 획득하여 지상 수신소로 전송하는 시스템이다. PCM 엔코더는 획득한 상태 정보 데이터를 이용하여 프레임을 생성하기 위해 채널 정보를 저장할 메모리가 필요하다. 대형 비행체의 경우 각 부위의 센서 및 시스템이 증가함에 따라 많은 데이터를 계측해야 하므로 더 큰 용량의 메모리를 필요로 한다. 그러나 한정된 메모리에서 모든 채널 정보를 저장하기에는 어려움이 있다. 따라서 본 논문에서는 FPGA 내부 ROM의 한정된 메모리에서 중복되는 채널 정보는 메모리에 한번만 할당하고, 마이너 프레임마다 다른 정보를 가지는 서브콤의 채널 정보는 서브콤 배수만큼 메모리에 할당하는 PCM 엔코더 구조를 제시하고 구현하였다. 이는 중복으로 할당되는 채널 정보를 최소화하여 효율적으로 메모리를 관리할 수 있다. 또한 다양한 계측 주기의 채널을 구성한 시뮬레이션을 통해 제시한 PCM 엔코더의 동작을 검증하였다.

Cold 블록 영역과 hot 블록 영역의 주기적 교환을 통한 wear-leveling 향상 기법 (A wear-leveling improving method by periodic exchanging of cold block areas and hot block areas)

  • 장시웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.175-178
    • /
    • 2008
  • 플래시 메모리에서 읽기 작업은 속도도 빠르고 제약이 없으나 데이터 변경 시에는 덮어쓰기(overwrite)가 되지 않아 해당 데이터를 새로운 영역에 쓰고 이전에 존재하던 데이터는 무효 시켜야한다. 무효화시킨 데이터는 가비지컬렉션을 통해 지움 연산을 수행해야 한다. 지역 접근성을 가지는 데이터에 대해 가비지컬렉션을 통해 클리어 시킬 대상 목록을 선정할 때 cost-benefit 방법을 사용하면 성능은 좋으나 wear-leveling이 나빠지는 문제점이 있다. 본 연구에서는 wear-leveling을 개선하기 위해 플래시 메모리를 hot 데이터 그룹들과 cold 데이터 그룹들의 다수의 그룹으로 분할한 후 데이터를 배치하고 주기적으로 hot 데이터 영역과 cold 데이터 영역을 교체함으로써 wear-leveling과 성능을 개선하였다.

  • PDF