• 제목/요약/키워드: DMA-DMA

검색결과 498건 처리시간 0.027초

CNN 가속기의 효율적인 데이터 전송을 위한 메모리 데이터 레이아웃 및 DMA 전송기법 연구 (Memory data layout and DMA transfer technique research For efficient data transfer of CNN accelerator)

  • 조석재;박성경;박성정
    • 전기전자학회논문지
    • /
    • 제24권2호
    • /
    • pp.559-569
    • /
    • 2020
  • 딥 러닝 알고리즘 중 하나인 CNN 인공지능 어플리케이션은 하드웨어 측면에서 컨벌루션 레이어의 많은 데이터들을 저장하기 위해 오프 칩 메모리를 사용 하고, DMA를 사용하여 매 데이터 전송 시 프로세서의 부하를 줄여 성능을 향상 시킬 수 있다. 또한 컨벌루션 레이어의 데이터를 가속기의 글로벌 버퍼에 전송되는 순서를 다르게 하여 어플리케이션의 성능의 저하를 줄일 수 있다. 불 연속된 메모리 주소를 가지고 있는 베이직 레이아웃의 경우 SG-DMA를 사용 할 때 ordinary DMA를 사용할 때보다 DMA를 사전 설정하는 부분에서 약 3.4배의 성능향상을 보였고 연속적인 메모리 주소를 가지고 있는 아이디얼 레이아웃의 경우 ordinary DMA 와 SG-DMA를 사용하는 두가지 경우 모두 1396 사이클 정도의 오버헤드를 가졌다. 가장 효율적인 메모리 데이터 레이아웃과 DMA의 조합은 프로세서의 DMA 사전 설정 부하를 약 86 퍼센트까지 감소할 수 있음을 실험을 통해 확인했다.

실시간 시스템의 DMA I/O 요구를 위한 최악 시간 분석 (Worst Case Timing Analysis for DMA I/O Requests in Real-time Systems)

  • 한주선;하란;민상렬
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권4호
    • /
    • pp.148-159
    • /
    • 2005
  • CPU의 수행과 병행하여 I/O가 수행되도록 DMA 방식을 채택한 실시간 시스템의 스케줄 가능성을 보장하기 위해서는 CPU 태스크 뿐만 아니라 I/O 요구의 스케줄 가능성도 반드시 검증되어야 한다. 본 논문에서는 CPU에게 최상위 우선순위가 할당된 고정우선순위 버스 프로토콜을 기반으로 CPU와 다수의 DMA 컨트롤러가 시스템 버스를 공유하는 환경에서 DMA I/O 요구의 최악 응답시간을 분석하는 기법을 제안한다. 제안하는 분석 기법의 첫 번째 단계에서는 CPU 상에서 수행 중인 각 CPU 태스크별로 최악 버스 요구 패턴을 구한다. 두 번째 단계에서는 이들 CPU 태스크의 최악 버스 요구 패턴을 모두 통 차해 CPU 전체의 최악 버스 요구 패턴을 구한다. 최종 세 번째 단계에서는 CPU의 최악 버스 요구 패턴으로부터 DMA 컨트롤러의 버스 가용량을 구하고 DMA I/O 요구의 최악 응답시간을 산출한다. 모의 실험을 통해 제안하는 분석 기법이 일반적인 DMA 전송량에 대해 $20\%$ 오차 범위 이내에서 안전한 응답시간을 산출하며, DMA 전송량이 증가할수록 오차가 점차 감소함을 보였다

혼합효과가 DMA와 CPC를 이용한 입자분포 측정에 미치는 영향에 관한 연구 (Study on the Influence of Mixing Effect to the Measurement of Particle Size Distribution using DMA and CPC)

  • 이윤수;안강호;김상수
    • 대한기계학회논문집B
    • /
    • 제27권3호
    • /
    • pp.326-333
    • /
    • 2003
  • In the measurement using DMA and CPC in series, there is some time delay for particles classified in DMA to detect in CPC. During this time, the DMA time-response changes due to the velocity profile of sampling tube and the diffusion of particles in the volume that exists between the DMA exit and the detector of ultra-fine CPC. This is called mixing effect. In the accelerated measurement methods like the TSI -SMPS, the size distribution is obtained from the correlation between the time-varying electrical potential of the DMA and the corresponding particle concentrations sampled in DMA. If the DMA time -response changes during this delay time, this can cause the error of a size distribution measured by this accelerated technique. The kernel function considering this mixing effect using the residence time distribution is proposed by Russell et al. In this study, we obtained a size distribution using this kernel to compare to the result obtained by the commercial accelerated measurement system, TSI -SMPS for verification and considered the errors that result from the mixing effect with the geometric mean diameters of originally sampled particles, using virtually calculated responses obtained with this kernel as input data.

$PEO_{45}$-MeDMA를 이용한 m-aramid 섬유의 염색특성 (Dyeing Properties of m-Aramid Fibers Using $PEO_{45}$-MeDMA)

  • 한신영;정재윤
    • 한국염색가공학회:학술대회논문집
    • /
    • 한국염색가공학회 2008년도 제39차 학술발표회
    • /
    • pp.35-36
    • /
    • 2008
  • A diblock copolymer($PEO_{45}$-MeDMA) derived from [2-(methacryloyloxy) ethyl] trimethylammonium chloride(MeDMA) was synthesized and applied to the meta-aramid fibers. Meta-aramid fabric was pretreated with $PEO_{45}$-MeDMA and successfully dyed with acid dyes. The dyeability of this fabric was investigated and found to depend on the $PEO_{45}$-MeDMA concentration, pH, and dye concentration. The color fastness properties of the copolymer pretreated dyed fabric was evaluated.

  • PDF

고정우선순위 버스 프로토콜 환경에서 DMA I/O 요구의 최악 응답시간 분석 (Analysis of Worst Case DMA Response Time in Fixed-Priority Bus Arbitration Protocol)

  • 한주선;하란;민상렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.21-23
    • /
    • 1999
  • CPU에게 최상위 우선순위가 할당된 고정 우선순위 버스 프로토콜에서는 CPU와 DMA 컨트롤러의 버스 요구가 충돌할 경우 DMA 전송이 지연된다. 본 논문에서는 CPU와 다수의 DMA 컨트롤러가 시스템 버스를 공유하는 환경에서 DAM I/O 요구의 최악 응답시간을 분석하는 기법을 제안한다. 제안하는 최악 응답시간 분석 기법은 다음의 세단계로 구성되어 있다. 첫 번째 단계에서는 CPU 상에서 수행중인 각 CPU 태스크별로 최악 버스 요구 패턴을 구한다. 두 번째 단계에서는 이들 CPU 태스크의 최악 버스 요구 패턴을 모두 통합해 CPU 전체의 최악 버스 요구 패턴을 구한다. 최종 세 번째 단계에서는 CPU의 최악 버스 요구 패턴으로부터 DMA 컨트롤러의 버스 가용량을 구하고 DMA I/O 요구의 최악 응답시간을 산출한다. 모의 실험을 통해 제안하는 분석 기법일 일반적인 DMA전송량에 대해 20% 오차 범위 이내에서 안전한 응답시간을 산출함을 보였다.

  • PDF

IOMMU Para-Virtualization for Efficient and Secure DMA in Virtual Machines

  • Tang, Hongwei;Li, Qiang;Feng, Shengzhong;Zhao, Xiaofang;Jin, Yan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권12호
    • /
    • pp.5375-5400
    • /
    • 2016
  • IOMMU is a hardware unit that is indispensable for DMA. Besides address translation and remapping, it also provides I/O virtual address space isolation among devices and memory access control on DMA transactions. However, currently commodity virtualization platforms lack of IOMMU virtualization, so that the virtual machines are vulnerable to DMA security threats. Previous works focus only on DMA security problem of directly assigned devices. Moreover, these solutions either introduce significant overhead or require modifications on the guest OS to optimize performance, and none can achieve high I/O efficiency and good compatibility with the guest OS simultaneously, which are both necessary for production environments. However, for simulated virtual devices the DMA security problem also exists, and previous works cannot solve this problem. The reason behind that is IOMMU circuits on the host do not work for this kind of devices as DMA operations of which are simulated by memory copy of CPU. Motivated by the above observations, we propose an IOMMU para-virtualization solution called PVIOMMU, which provides general functionalities especially DMA security guarantees for both directly assigned devices and simulated devices. The prototype of PVIOMMU is implemented in Qemu/KVM based on the virtio framework and can be dynamically loaded into guest kernel as a module, As a result, modifying and rebuilding guest kernel are not required. In addition, the device model of Qemu is revised to implement DMA access control by separating the device simulator from the address space of the guest virtual machine. Experimental evaluations on three kinds of network devices including Intel I210 (1Gbps), simulated E1000 (1Gbps) and IB ConnectX-3 (40Gbps) show that, PVIOMMU introduces little overhead on DMA transactions, and in general the network I/O performance is close to that in the native KVM implementation without IOMMU virtualization.

Phenol과 DMA 간의 수소결합 (Intermolecular Hydrogen Bond between Phenol and DMAs)

  • 김복혜;이익춘
    • 대한화학회지
    • /
    • 제10권1호
    • /
    • pp.15-17
    • /
    • 1966
  • Phenol과 각 종 Dimethylaniline(DMA)간의 수소결합을 Infrared Spectrophotometer로 연구하였다. 일반으로 DMA는 n-donor 및 ${\pi}$-donor의 2중 역활을 하나 주로 n-donor로 작용하며 phenol의 O-H stretching frequency의 shift(${\Delta}{\nu}$)는 DMA의 basicity에 비례하였고 (${\Delta}{\nu}$) 와 Hammett의 σcontant사이에는 linearity가 성립함을 알았다.

  • PDF

꽁치과메기의 건조조건에 따른 Amine의 변화 (Changes in Amine Constituents of Kwamaege Flesh by Different Drying for Pacific Saury, Cololabis saira)

  • 오승희;김덕진;최경호
    • 한국식품영양학회지
    • /
    • 제11권1호
    • /
    • pp.20-25
    • /
    • 1998
  • 건조과정 중의 amine의 함량 변화는 초기건조 온도의 상승으로 DMA와 TMA의 함량이 건조 9일째까지 급격히 증가하였고, 인공건조의 경우가 자연건조보다 DMA, TMA 함량이 낮게 나타났다. TMAO의 경우, 건조과정 중 분해되어 함량이 감소되어 DMA, TMA 함량과 역상관계를 보였다. DMA와 TMA의 생성은 건조과정에서 생성되고 있으며 유통과정에서 더욱 많이 발생된 것으로 사료되므로 유통에 따른 유해성 문제점을 심각하다고 판정되므로 유통방법 개선이 필요하다고 생각된다.

  • PDF

The Effect of Entrepreneurial Orientation on Digital Marketing Performance: A Case Study of Small Enterprises in Kendari City, Indonesia

  • HAKIM, Abdul;MADJID, Rahmat;SUKOTJO, Endro;YUSUF, Yusuf
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제9권3호
    • /
    • pp.295-302
    • /
    • 2022
  • This research aims to determine and analyze: (a) the effects of digital marketing activity (DMAc), digital marketing capability (DMC), and Digital marketing asset (DMA), (b) the effects of DMAc, DMC, and DMA on marketing performance (MP), (c). the effects of entrepreneurial orientation (OE) on MP and (d). the mediating role of OA on the effects of DMAc, DMC, and DMA on OE. The research population is all the small enterprise actors in Kendari city applying digital marketing and having a permanent establishment in Kendari City. The analysis tool used is SEM Partial Least Square. Results of the research show that: (a). DMC and DMA have positive and significant effects on OE while DMAc is found to be insignificant on OE, (b). then, DMAc and DMA have positive and significant effects on MP, and DMC is found to be insignificantly increasing MP, (c). OE has positive and significant effects on MP and (d). DMC effects on MP and effects between DMA and MP are mediated by OE, whereas DMA effects on MP are not mediated by OE position. Based on research findings, DMC and DMA are superior at forming research opinions since they have a substantial influence on enhancing collaboration.

DMA(Direct Memory Access)을 이용한 SDRAM의 고속 인터페이스 (SDRAM Fast Accession By DMA (Direct Memory Access))

  • 김진완;조현묵
    • 전기전자학회논문지
    • /
    • 제10권1호
    • /
    • pp.22-29
    • /
    • 2006
  • 본 논문에서는 마이크로프로세서와 주변블록 사이에서 SDRAM을 사용함에 있어서 DMA(Direct Memory Access)에 의한 효율적인 SDRAM 접근방식을 제시하고 있다. 여기에서 마이크로프로세서는 AMBA 버스를 통해서 SDRAM에 접근을 하고 DMA는 DMA 전용 버스를 통해서 SDRAM에 접근한다. 마이크로프로세서가 SDRAM에 접근하지 않고 다른 레지스터에 접근하거나, 아니면 마이크로프로세서 캐쉬에서 히트(hit)신호가 발생하여 SDRAM에 접근할 필요가 없을 때에 주변 블록에서는 DMA를 통해서 SDRAM에 접근하여 데이타를 읽거나 쓰기 동작을 통해서 SDRAM을 효율적으로 사용할 수 있다. 이 방법은 DMA가 마이크로프로세서의 SDRAM 억세스를 최소한의 방해로 SDRAM을 사용할 수 있다. 이와 같은 방법을 이용함으로써 전체적인 시스템 효율을 높여 약 16.8% 정도의 성능 향상 효과를 가져옴을 확인 할 수 있었다.

  • PDF