• Title/Summary/Keyword: 성능최적화 기법

Search Result 1,338, Processing Time 0.03 seconds

Model Optimization for Supporting Spiking Neural Networks on FPGA Hardware (FPGA상에서 스파이킹 뉴럴 네트워크 지원을 위한 모델 최적화)

  • Kim, Seoyeon;Yun, Young-Sun;Hong, Jiman;Kim, Bongjae;Lee, Keon Myung;Jung, Jinman
    • Smart Media Journal
    • /
    • v.11 no.2
    • /
    • pp.70-76
    • /
    • 2022
  • IoT application development using a cloud server causes problems such as data transmission and reception delay, network traffic, and cost for real-time processing support in network connected hardware. To solve this problem, edge cloud-based platforms can use neuromorphic hardware to enable fast data transfer. In this paper, we propose a model optimization method for supporting spiking neural networks on FPGA hardware. We focused on auto-adjusting network model parameters optimized for neuromorphic hardware. The proposed method performs optimization to show higher performance based on user requirements for accuracy. As a result of performance analysis, it satisfies all requirements of accuracy and showed higher performance in terms of expected execution time, unlike the naive method supported by the existing open source framework.

Profit-based Segment Caching for Wireless Streaming QoS (무선 스트리밍 QoS를 위한 이득 기반 세그먼트 캐싱)

  • Lee, Chong-Deuk
    • Journal of Advanced Navigation Technology
    • /
    • v.16 no.3
    • /
    • pp.463-470
    • /
    • 2012
  • This paper proposes a new profit popularity-based segment caching control mechanism for assuring a consecutive streaming QoS (Quality of Service) in the wireless channel. Then, the proposed mechanism operates SSCP (Single Segment Caching Profit) and MSCP (Multiple Segment Caching Profit) for assuring a QoS. SSCP and MSCP is to optimize the cache performance when is performed the streaming in the proxy. The proposed mechanism simulated to evaluate such mechanisms as fixed-partition mechanism, weight-based mechanism, SSCP, and MSCP. Simulation results show that the proposed mechanism has superior performance compared to other mechanisms.

Methods to Reduce Execution Time of Ontology Reasoners based on Tableaux Algorithm (태블로 알고리즘 기반 온톨로지 추론 엔진의 속도 향상을 위한 방법)

  • Kim, Je-Min;Park, Young-Tack
    • Journal of KIISE:Software and Applications
    • /
    • v.36 no.2
    • /
    • pp.153-160
    • /
    • 2009
  • As size of ontology has been increased more and more, the descriptions in the ontologies become more complicated, Therefore finding and modifying unsatisfiable concepts is hard work in ontology construction process, Minerva is an ontology reasoner which detects unsatisfiable concepts automatically and infers subsumption relation between concepts in ontology, Most description logic based ontology reasoners (including Minerva) work using tableaux algorithm, Because tableaux algorithm is very costly, ontology reasoners need various optimization methods, In this paper, we propose optimizing methods to reduce execution time of tableaux algorithm based ontology reasoner. Proposed methods were applied to Minerva which was developed as preceding study result. In consequence the new version Minerva shows high performance.

Optimizing Shared Memory Accesses for GPGPU Computations (GPGPU를 위한 공유 메모리 최적화)

  • Tran, Nhat-Phuong;Lee, Myungho;Hong, Sugwon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.197-199
    • /
    • 2012
  • Recently, a lot of general-purpose application programs in addition to graphic applications have been parallelized for boosting their performance using Graphic Processing Unit (GPU)'s excellent floating-point performance. In order to maximize the application performance on GPUs, optimizing the memory hierarchy and the on-chip caches such as the shared memory is essential. In this paper, we propose techniques to optimize the shared memory, and verify its effectiveness using a pattern matching application program.

Optimization of SGX library OS for executing multi-thread JavaScript application (멀티쓰레드 자바스크립트 어플리케이션 실행을 위한 SGX library OS 최적화)

  • Chul-Min Lee;Byoung-Young Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.226-228
    • /
    • 2024
  • 자바스크립트는 어플리케이션 및 서비스를 개발하는 주요한 언어 중 하나이다. 자바스크립트는 현재 서버 측에서도 널리 사용되고 있으며 서버에서 계산 집약적인 어플리케이션을 수행하기 위해 멀티쓰레드 기능도 최근 추가되었다. 이 논문에서는 Intel SGX 를 활용하여 클라우드 환경에서 자바스크립트 어플리케이션에 대한 보안을 강화하려는 시도를 다룬다. 그 과정에서 SGX 의 library OS 가자바스크립트 어플리케이션을 수행하는 데에 있어서 발생하는 성능 저하를 다루며, 이를 최적화하여 극복하는 방안을 제시한다. 또한, 실험 결과를 통해 제안된 최적화 기법이 어떻게 성능을 향상시키는지를 확인한다.

The Improved Evolutionary Programming with Direction Vectors (방향성 벡터를 갖는 개선된 진화프로그래밍)

  • 박진현;배준경
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.10 no.6
    • /
    • pp.542-547
    • /
    • 2000
  • 진화프로그래밍(Evolutionary Programming : EP)은 최적화 문제에 있어서 매우 유용한 기법으로 자연선택의 원리를 모방한 탐색알고리즘이다. EP는 기존의 최적화 알고리즘에 비하여 여러해를 동시에 탐색하는 전역탐색(global search)방법이므로 국부수렴(local convergence)의 가능성이 줄어들고, 최적화 파라메터 영역의 연속성과 미분치의 존재성과 같은 조건이 필요 없는 장점을 갖는다. 이러한 장점에도 불구하고, EP의 탐색영역이 초기조건 및 최적화 파라메터들의 랜덤 생성 그리고 최적화에 필요한 전략적 파라메터들에 의하여 탐색 영역이 결정되고, 수렴성이 느린 단점을 갖는다. 이러한 문제를 해결하기 위하여, 본 연구에서는 빠른 수렴성과 다양성을 갖는 개선된 EP을 제안하고, 제안된 방향성 벡터를 갖는 개선된 EP를 함수 최적화 문제에 적용하여 그 성능의 유용성을 보이고자 한다.

  • PDF

연소시험을 통한 우주발사체 추진기관 성능검증

  • 강선일;이정호;김영한;권오성;하성업;오승협
    • Bulletin of the Korean Space Science Society
    • /
    • 2003.10a
    • /
    • pp.96-96
    • /
    • 2003
  • 우주발사체라 함은 지구상의 물체를 우주, 즉 지구의 중력이 영향을 미치지 못하는 대기권 밖으로 운반하는 수단을 말한다. 이를 위해 다양한 추진방식이 제안되었고 연구되고 있으나 현재까지 실용화 된 것은 화학연료를 연소시킴으로 인해 발생하는 추진력으로 지구 중력을 이겨내는 방식이다. 또한 발사체 구성에서 추진기관분야는 전체 성능을 좌우할 정도로 큰 비중을 차지하고 있다. 따라서 이에 대한 최적화 및 성능 검증은 필수적이다. 추진기관에 대한 성능 검증기법은 우주발사체 기술이 발달해 옴에 따라 해석적 방법, 비 연소 모사시험 등 다양하게 제시되고 있으나, 우주발사체용 추진기관의 연소현상을 예측 및 모사하는 것이 쉽지 않고 구축된 데이터가 적기 때문에 발사체 개발 단계의 최종 검증 차원에서 연소시험을 실시하는 것이 일반적이다. 한국 최초의 우주발사체라 평가되고 있는 KSR-III 로켓의 경우에도 다양한 해석기법과 모사시험을 통해서 성능 예측을 하였으나, 역시 최종 성능 검증을 위해 10여회의 연소시험을 실시하였다. 본 논문을 통해 저자는 KSR-III 개발과정에서 수행된 10회의 연소시험의 수행 과정과 결과를 기술, 정리 및 평가하여 향후 진행될 우주발사체 개발 사업의 기초로 삼고자 한다.

  • PDF

Device Virtualization Frameworks for Accelerating GPU Performance on Virtual Environments (가상화 환경에서 GPU 성능의 향상을 위한 장치 가상화 프레임워크)

  • Joo, Younghyun;Lee, Dongwoo;Eom, Young Ik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.86-87
    • /
    • 2013
  • 최근 가상화 기술에 대한 많은 관심과 연구들로 인해 가상 머신은 물리(Native) 머신에 가까운 성능을 보이며 프로세서 및 메모리 자원을 제공하고 있다. 하지만 GPU 와 같은 그래픽 하드웨어에 대한 장치 가상화는 다른 가상화 기법에 비해 연구가 미흡한 상태로 가상화 환경에서의 영상처리에 걸림돌이 되고 있다. 가상화 환경에서의 영상처리는 기존의 X 윈도우 시스템을 이용하여 영상을 처리하는데, 이는 2D 영상처리에 최적화 되어 있어서 3D 영상을 처리하는데 성능의 한계 보일 뿐만 아니라 가상 머신에서 메모리가 중복으로 복사되면서 낮은 성능 보여주고 있다. 제안하는 장치 가상화 프레임워크는 기존의 메모리의 중복 복사를 제거하면서 성능을 향상 시킬 수 있다. 본 논문에서는 가상화 환경에서 GPU 성능 향상을 위한 장치 가상화 프레임워크를 제안하고 평가를 통해 본 기법의 타당성을 입증한다.

SqueezeNet based Single Image Super Resolution using Knowledge Distillation (SqueezeNet 기반의 지식 증류 가법을 활용한 초해상화 기법)

  • Seo, Yu lim;Kang, Suk-Ju
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.226-227
    • /
    • 2020
  • 근래의 초해상화 (super-resolution, SR) 연구는 네트워크를 깊고, 넓게 만들어 성능을 높이는데 주를 이뤘다. 그러나 동시에 높은 연산량과 메모리 소비량이 증가하는 문제가 발생하기 때문에 이를 실제로 하드웨어로 구현하기에는 어려운 문제가 존재한다. 그렇기에 우리는 네트워크 최적화를 통해 성능 감소를 최소화하면서 파라미터 수를 줄이는 네트워크 SqueezeSR을 설계하였다. 또한 지식 증류(Knowledge Distillation, KD)를 이용해 추가적인 파라미터 수 증가 없이 성능을 높일 수 있는 학습 방법을 제안한다. 또한 KD 시 teacher network의 성능이 보다 student network에 잘 전달되도록 feature map 간의 비교를 통해 학습 효율을 높일 수 있었다. 결과적으로 우리는 KD 기법을 통해 추가적인 파라미터 수 증가 없이 성능을 높여 다른 SR네트워크 대비 더 빠르고 성능 감소를 최소화한 네트워크를 제안한다.

  • PDF

Wanda Pruning for Lightweighting Korean Language Model (Wanda Pruning에 기반한 한국어 언어 모델 경량화)

  • Jun-Ho Yoon;Daeryong Seo;Donghyeon Jeon;Inho Kang;Seung-Hoon Na
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.437-442
    • /
    • 2023
  • 최근에 등장한 대규모 언어 모델은 다양한 언어 처리 작업에서 놀라운 성능을 발휘하고 있다. 그러나 이러한 모델의 크기와 복잡성 때문에 모델 경량화의 필요성이 대두되고 있다. Pruning은 이러한 경량화 전략 중 하나로, 모델의 가중치나 연결의 일부를 제거하여 크기를 줄이면서도 동시에 성능을 최적화하는 방법을 제시한다. 본 논문에서는 한국어 언어 모델인 Polyglot-Ko에 Wanda[1] 기법을 적용하여 Pruning 작업을 수행하였다. 그리고 이를 통해 가중치가 제거된 모델의 Perplexity, Zero-shot 성능, 그리고 Fine-tuning 후의 성능을 분석하였다. 실험 결과, Wanda-50%, 4:8 Sparsity 패턴, 2:4 Sparsity 패턴의 순서로 높은 성능을 나타냈으며, 특히 일부 조건에서는 기존의 Dense 모델보다 더 뛰어난 성능을 보였다. 이러한 결과는 오늘날 대규모 언어 모델 중심의 연구에서 Pruning 기법의 효과와 그 중요성을 재확인하는 계기가 되었다.

  • PDF