• 제목/요약/키워드: memory performance

검색결과 3,145건 처리시간 0.039초

Latency Hiding based Warp Scheduling Policy for High Performance GPUs

  • Kim, Gwang Bok;Kim, Jong Myon;Kim, Cheol Hong
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권4호
    • /
    • pp.1-9
    • /
    • 2019
  • LRR(Loose Round Robin) warp scheduling policy for GPU architecture results in high warp-level parallelism and balanced loads across multiple warps. However, traditional LRR policy makes multiple warps execute long latency operations at the same time. In cases that no more warps to be issued under long latency, the throughput of GPUs may be degraded significantly. In this paper, we propose a new warp scheduling policy which utilizes latency hiding, leading to more utilized memory resources in high performance GPUs. The proposed warp scheduler prioritizes memory instruction based on GTO(Greedy Then Oldest) policy in order to provide reduced memory stalls. When no warps can execute memory instruction any more, the warp scheduler selects a warp for computation instruction by round robin manner. Furthermore, our proposed technique achieves high performance by using additional information about recently committed warps. According to our experimental results, our proposed technique improves GPU performance by 12.7% and 5.6% over LRR and GTO on average, respectively.

마우스 공간지각과 기억 형성에 미치는 전정 유래 정보의 규명 (Identification of Vestibular Organ Originated Information on Spatial Memory in Mice)

  • 한규철;김민범;김미주
    • Research in Vestibular Science
    • /
    • 제17권4호
    • /
    • pp.134-141
    • /
    • 2018
  • Objectives: We aimed to study the role of vestibular input on spatial memory performance in mice that had undergone bilateral surgical labyrinthectomy, semicircular canal (SCC) occlusion and 4G hypergravity exposure. Methods: Twelve to 16 weeks old ICR mice (n=30) were used for the experiment. The experimental group divided into 3 groups. One group had undergone bilateral chemical labyrinthectomy, and the other group had performed SCC occlusion surgery, and the last group was exposed to 4G hypergravity for 2 weeks. The movement of mice was recorded using camera in Y maze which had 3 radial arms (35 cm long, 7 cm high, 10 cm wide). We counted the number of visiting arms and analyzed the information of arm selection using program we developed before and after procedure. Results: The bilateral labyrinthectomy group which semicircular canal and otolithic function was impaired showed low behavioral performance and spacial memory. The semicircular canal occlusion with $CO_2$ laser group which only semicircular canal function was impaired showed no difference in performance activity and spatial memory. However the hypergravity exposure group in which only otolithic function impaired showed spatial memory function was affected but the behavioral performance was spared. The impairment of spatial memory recovered after a few days after exposure in hypergravity group. Conclusions: This spatial memory function was affected by bilateral vestibular loss. Space-related information processing seems to be determined by otolithic organ information rather than semicircular canals. Due to otolithic function impairment, spatial learning was impaired after exposure to gravity changes in animals and this impaired performance was compensated after normal gravity exposure.

플래시 메모리 파일 시스템을 위한 가비지 콜렉터 설계 및 구현 (A garbage collector design and implementation for flash memory file system)

  • 김기영;손성훈;신동하
    • 정보처리학회논문지A
    • /
    • 제14A권1호
    • /
    • pp.39-46
    • /
    • 2007
  • 최근 들어 많은 임베디드 기기들이 휴대성과 성능 향상을 위해 플래시 메모리를 저장 매제로 사용하고 있다. 플래시 메모리는 일반적인 디스크와는 다른 특성과 제약 조건으로 인해 파일 시스템 설계에 있어서 여러 가지가 고려되어야 하며, 디스크와 다르게 덮어쓰기가 불가능하다. 플래시 메모리 파일 시스템은 LFS(Log-structure File System)의 형태를 가지며, 따라서 가비지 콜렉터를 사용한다. 블록을 재사용하기 위해서는 가비지 콜렉터의 역할이 크며, 가비지 콜렉터는 파일 시스템의 성능에 직접적으로 영향을 주기 때문에 플래시 메모리의 특성을 고려하여 설계해야 한다. 이에 본 논문에서는 JFFS2(Journaling Flash File System II)의 가비지 콜렉터를 개선한 플래시 메모리 파일 시스템을 제시하고, 이를 임베디드 시스템 실험 보드에서 테스트하였다. 그 결과 기존의 파일 시스템에 비해 메모리 사용률을 감소시킬 수 있었으며, 이로 인한 플래시 메모리 수명 연장, 쓰기 평준화(wear-leveling) 개선 등의 성능 향상이 나타남을 확인할 수 있었다.

정상 노인과 경도인지장애의 감별을 위한 언어 기억과 시공간 기억 검사의 예측 성능 비교 (Comparison of Predictive Performance between Verbal and Visuospatial Memory for Differentiating Normal Elderly from Mild Cognitive Impairment)

  • 변해원
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.203-208
    • /
    • 2020
  • 이 연구는 첫째, 경도인지장애(MCI)가 언어 기억 및 시공간 기억 등 특정 기억의 저하와 관련이 있는지를 파악하고, 둘째, 정상 노인으로부터 MCI를 감별하는 데 예측력이 우수한 지표를 탐색하였다. 표준화 된 기억검사를 수행한 189명(정상 노인 103 명, MCI 86 명)을 분석하였다. 언어 기억은 Seoul Verbal Learning Test를 이용하였고. 시공간 기억은 Rey Complex Figure Test를 이용해서 측정하였다. 다항 로지스틱 회귀모형을 이용하여 기억 검사의 예측력을 분석한 결과, 언어 기억과 시공간 기억은 정상 노인으로부터 MCI를 감별하는 데 예측 성능이 유의미하였다. 반면, 각 기억 검사의 수행결과를 포함하여 모든 혼란변수를 보정했을 때, 언어 기억의 즉시 회상만 정상 노인으로부터 MCI를 감별하는 데 예측력이 유의미하였으며, 시공간 기억의 즉시 회상은 예측력이 유의미하지 않았다. 이 결과는 MCI를 선별할 때 언어 기억과 시공간 기억의 지연 회상, 언어 기억의 즉시 회상이 MCI의 기억능력을 감별할 수 있는 최상의 조합임을 시사한다.

대용량 메모리 데이타 처리를 위한 범용 하드웨어 기반의 원격 메모리 시스템 (Large-Memory Data Processing on a Remote Memory System using Commodity Hardware)

  • 정형수;한혁;염헌영
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권9호
    • /
    • pp.445-458
    • /
    • 2007
  • 본 논문에서는 대용량 메모리 데이타 처리를 위한 범용 하드웨어 기반의 원격 메모리 시스템을 제안한다. 느린 디스크와 상대적으로 대단히 빠른 접근 속도를 보장하는 메모리 사이에 존재하게 되는 새로운 메모리 계층을 구현하기 위해, 본 논문에서는 다수의 일반적인 범용 데스크탑 PC들과 원격 직접메모리 접근 (이하 RDMA) 기능이 가능한 고속 네트워크를 최대한 활용하였다. 제안된 새로운 계층의 메모리는 합리적인 응답시간과 용량을 제공함으로서 비교적 적은 양의 성능 부담으로서 대용량의 메모리 상주 데이타베이스를 구동할 수 있게 되었다. 제안된 원격 메모리 시스템은 원격 메모리 페이지들을 관리하게 되는 원격 메모리 시스템과, 원격 메모리 페이지의 교체를 관리하게 되는 원격 메모리 페이저로 구성되어 있다. 범용으로 쓰이는 MySQL과 같은 데이타베이스를 이용한 TPC-C 실험 결과로 볼 때 제안된 원격 메모리 시스템은 일반적인 대용량 메모리 데이타 처리 시스템에서 요구하는 다양한 요구조건을 만족시킬 수 있을 것이라 생각된다.

분산공유 메모리 시스템 상에서의 효율적인 자료분산 방법 (An Efficient Data Distribution Method on a Distributed Shared Memory Machine)

  • 민옥기
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1433-1442
    • /
    • 1996
  • 자료 분산은 SPMD(Single Program Multiple Data)형태의 병렬성을 제공하는 HPF (High Performance Fortran)의 주기능으로 구현 방법에 따라 컴파일러 성능을 좌우한 다. 본 논문에서는 SPAX(Scalable Parallel Architecture computer based on X-bar network)상에 자료 분산 기능을 제공하기 위한 설계 주안점과 효율적인 모델에 관하 여 기술하였다. SPAX는 분산공유 메모리 (DSM:distributed shared memory)를 사용한 계층적 클러스터링 구조를 가진다. 이러한 메모리 구조에서는 분산 메모리 자료 분산 (DMDD:Distributed Memory Data Distribution)이나 공유 메모리 자료 분산(SMDD: Shared Memory Data Distribution)방법으로는 시스템 가용성을 만족할 수 없다. 그래 서 계층적 마스터-슬래브 형태의 분산공유 메모리 자료분산(DSMDD:Distributed Shared Memory Data Distribution)모델을 설계하였다. 이 모델은 각 노드에 원격 마 스터와 슬래브들을 할당하고 노드내에서는 공유 메모리를 그리고 노드간에는 메세지 전달 인터페이스를 사용한다. 시뮬레이션을 수행한 결과, 시스템 성능 저하를 최소화 하는 노드 크기로 DSMDD를 수행하였을 때 SMDD나 DMDD보다 훨씬 더 효율적이였다. 특 히, 논리적 프로세서 갯수가 많을수록, 분산된 자료들 간의 자료 종속성이 적을수록 성능이 우수하였다.

  • PDF

Dynamic Rank Subsetting with Data Compression

  • Hong, Seokin
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.1-9
    • /
    • 2020
  • 본 논문에서는 데이터 압축을 통해 메모리 시스템의 에너지 효율 및 성능을 향상시키는 동적랭크 서브세팅 기법 (Dynamic Rank Subsetting, DRAS)을 제안한다. DRAS 기법은 하나의 메모리 랭크 (Rank)를 두 개의 서브랭크 (Sub-rank)로 동작되도록 하여, 데이터가 절반 크기로 압축될 경우 압축된 데이터를 하나의 서브랭크에만 저장한다. 이를 통해 DRAS 기법은 압축된 데이터에 대한 읽기 및 쓰기 동작의 메모리 대역폭을 두 배로 높일 수 있고, 동적 전력 소모도 절반으로 감소시킬 수 있다. 만약 데이터가 절반 크기로 압축되지 않는다면 기존 메모리 시스템에서와 같이 데이터를 두 서브랭크에 저장한다. 따라서 DRAS 기법은 데이터가 압축되지 않는 경우에 대해서는 기존 메모리 시스템 수준의 메모리 대역폭과 전력 효율성을 보장한다. 메모리 시뮬레이터를 사용한 실험 평가를 통해 DRAS 기법이 컴퓨터 시스템 성능을 평균 12% 향상시키고 메모리 시스템의 전력소모를 평균 24% 감소시킬 수 있음을 보인다.

High Performance Flexible Inorganic Electronic Systems

  • 박귀일;이건재
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2012년도 제43회 하계 정기 학술대회 초록집
    • /
    • pp.115-116
    • /
    • 2012
  • The demand for flexible electronic systems such as wearable computers, E-paper, and flexible displays has increased due to their advantages of excellent portability, conformal contact with curved surfaces, light weight, and human friendly interfaces over present rigid electronic systems. This seminar introduces three recent progresses that can extend the application of high performance flexible inorganic electronics. The first part of this seminar will introduce a RRAM with a one transistor-one memristor (1T-1M) arrays on flexible substrates. Flexible memory is an essential part of electronics for data processing, storage, and radio frequency (RF) communication and thus a key element to realize such flexible electronic systems. Although several emerging memory technologies, including resistive switching memory, have been proposed, the cell-to-cell interference issue has to be overcome for flexible and high performance nonvolatile memory applications. The cell-to-cell interference between neighbouring memory cells occurs due to leakage current paths through adjacent low resistance state cells and induces not only unnecessary power consumption but also a misreading problem, a fatal obstacle in memory operation. To fabricate a fully functional flexible memory and prevent these unwanted effects, we integrated high performance flexible single crystal silicon transistors with an amorphous titanium oxide (a-TiO2) based memristor to control the logic state of memory. The $8{\times}8$ NOR type 1T-1M RRAM demonstrated the first random access memory operation on flexible substrates by controlling each memory unit cell independently. The second part of the seminar will discuss the flexible GaN LED on LCP substrates for implantable biosensor. Inorganic III-V light emitting diodes (LEDs) have superior characteristics, such as long-term stability, high efficiency, and strong brightness compared to conventional incandescent lamps and OLED. However, due to the brittle property of bulk inorganic semiconductor materials, III-V LED limits its applications in the field of high performance flexible electronics. This seminar introduces the first flexible and implantable GaN LED on plastic substrates that is transferred from bulk GaN on Si substrates. The superb properties of the flexible GaN thin film in terms of its wide band gap and high efficiency enable the dramatic extension of not only consumer electronic applications but also the biosensing scale. The flexible white LEDs are demonstrated for the feasibility of using a white light source for future flexible BLU devices. Finally a water-resist and a biocompatible PTFE-coated flexible LED biosensor can detect PSA at a detection limit of 1 ng/mL. These results show that the nitride-based flexible LED can be used as the future flexible display technology and a type of implantable LED biosensor for a therapy tool. The final part of this seminar will introduce a highly efficient and printable BaTiO3 thin film nanogenerator on plastic substrates. Energy harvesting technologies converting external biomechanical energy sources (such as heart beat, blood flow, muscle stretching and animal movements) into electrical energy is recently a highly demanding issue in the materials science community. Herein, we describe procedure suitable for generating and printing a lead-free microstructured BaTiO3 thin film nanogenerator on plastic substrates to overcome limitations appeared in conventional flexible ferroelectric devices. Flexible BaTiO3 thin film nanogenerator was fabricated and the piezoelectric properties and mechanically stability of ferroelectric devices were characterized. From the results, we demonstrate the highly efficient and stable performance of BaTiO3 thin film nanogenerator.

  • PDF

유연 반도체/메모리 소자 기술 (Technology of Flexible Semiconductor/Memory Device)

  • 안종현;이혁;좌성훈
    • 마이크로전자및패키징학회지
    • /
    • 제20권2호
    • /
    • pp.1-9
    • /
    • 2013
  • Recently flexible electronic devices have attracted a great deal of attention because of new application possibilities including flexible display, flexible memory, flexible solar cell and flexible sensor. In particular, development of flexible memory is essential to complete the flexible integrated systems such as flexible smart phone and wearable computer. Research of flexible memory has primarily focused on organic-based materials. However, organic flexible memory has still several disadvantages, including lower electrical performance and long-term reliability. Therefore, emerging research in flexible electronics seeks to develop flexible and stretchable technologies that offer the high performance of conventional wafer-based devices as well as superior flexibility. Development of flexible memory with inorganic silicon materials is based on the design principle that any material, in sufficiently thin form, is flexible and bendable since the bending strain is directly proportional to thickness. This article reviews progress in recent technologies for flexible memory and flexible electronics with inorganic silicon materials, including transfer printing technology, wavy or serpentine interconnection structure for reducing strain, and wafer thinning technology.

임베디드 리눅스 커널의 실행속도 향상을 위한 메모리 맵 분석 (The Analysis of Memory Map for Improving the Execution Speed of Embedded Linux Kernel)

  • 이두완;장경식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.801-804
    • /
    • 2009
  • 본 논문에서는 임베디드 리눅스 시스템 성능 향상을 위한 방안으로 리눅스 커널 메모리 맵을 분석하였다. 안정성과 다양한 H/W 플랫폼을 지원하고 범용 시스템에 최적화 되어 있는 리눅스 커널 메모리 맵은 부팅시간과 효율적인 시스템 자원 활용에 중요한 역할을 담당하므로 자원 제한적인 임베디드 리눅스 시스템의 성능 향상을 위해 커널 메모리 맵의 분석이 요구된다. 분석결과, 리눅스 커널 메모리의 할당 위치에 따라 임베디드 리눅스 시스템의 부팅속도 및 메모리 효율성의 향상을 확인하였다. 그러므로 본 논문에서 제안한 부트로더 및 커널 메모리 할당 방안이 임베디드 리눅스 시스템의 메모리 활용성 향상에 적합할 것으로 사료된다.

  • PDF