• 제목/요약/키워드: GPU Process

검색결과 147건 처리시간 0.022초

GPU을 이용한 다중 고정 길이 패턴을 갖는 DNA 시퀀스에 대한 k-Mismatches에 의한 근사적 병열 스트링 매칭 (Parallel Approximate String Matching with k-Mismatches for Multiple Fixed-Length Patterns in DNA Sequences on Graphics Processing Units)

  • 호 티엔 루안;김현진;오승록
    • 전기학회논문지
    • /
    • 제66권6호
    • /
    • pp.955-961
    • /
    • 2017
  • In this paper, we propose a parallel approximate string matching algorithm with k-mismatches for multiple fixed-length patterns (PMASM) in DNA sequences. PMASM is developed from parallel single pattern approximate string matching algorithms to effectively calculate the Hamming distances for multiple patterns with a fixed-length. In the preprocessing phase of PMASM, all target patterns are binary encoded and stored into a look-up memory. With each input character from the input string, the Hamming distances between a substring and all patterns can be updated at the same time based on the binary encoding information in the look-up memory. Moreover, PMASM adopts graphics processing units (GPUs) to process the data computations in parallel. This paper presents three kinds of PMASM implementation methods in GPUs: thread PMASM, block-thread PMASM, and shared-mem PMASM methods. The shared-mem PMASM method gives an example to effectively make use of the GPU parallel capacity. Moreover, it also exploits special features of the CUDA (Compute Unified Device Architecture) memory structure to optimize the performance. In the experiments with DNA sequences, the proposed PMASM on GPU is 385, 77, and 64 times faster than the traditional naive algorithm, the shift-add algorithm and the single thread PMASM implementation on CPU. With the same NVIDIA GPU model, the performance of the proposed approach is enhanced up to 44% and 21%, compared with the naive, and the shift-add algorithms.

A Study on Efficient User Management System of Combat System

  • Hee-Soo Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권7호
    • /
    • pp.191-198
    • /
    • 2024
  • 이 논문에서는 함정 내 전투체계 시스템을 효율적으로 운용하기 위한 사용자 관리 시스템을 제안한다. 최근 함정에는 다양한 센서, 기능 그리고 시스템의 지속적인 발전을 통해 성능이 강화되고 있다. 이러한 시스템의 발전은 함정 내 다양한 센서와 기능을 조작할 수 있는 다기능 콘솔의 증가로 이어지며, 이에 따라 다기능 콘솔의 운용자 수도 증가하고 있다. 따라서 함정 내 효율적인 관리를 위해 다기능 콘솔과 운용자를 실시간 통제 및 관리하는 사용자 관리 시스템이 요구된다. 본 논문에서는 다기능 콘솔에 접근하는 사용자의 실시간 상황에 대해 효율적으로 관리할 수 있는 사용자 관리 시스템을 제안한다. 또한, 전투체계 시스템의 다양한 기능을 운용하는 CPU의 부하를 줄일 수 있는 GPU를 이용한 병렬화 방법을 제안한다. 제안한 사용자 관리 시스템은 GPU를 활용한 결과 CPU를 활용한 결과에 비해 응답시간은 약 82%, 점유율은 약 20% 줄어드는 성능을 확인하였다.

폴리술폰 중공사막을 이용한 바이오가스 고순도화 고효율 저온 분리 공정 (Highly Efficient Biogas Upgrading Process Using Polysulfone Hollow Fiber Membrane at Low Temperature)

  • 김세종;한상훈;임진혁;이충섭;장원석;김길정;하성용
    • 멤브레인
    • /
    • 제32권2호
    • /
    • pp.140-149
    • /
    • 2022
  • 본 연구에서는 폴리술폰 분리막을 이용한 바이오가스 정제 공정으로 고선택성 소재를 이용한 2단 공정의 높은 회수율 및 경제성과 동등한 수준의 회수율을 확보하기 위해 저온 고압의 분리막 공정을 설계하고 평가하였다. 폴리술폰 고분자를 4성분계 도프를 이용하여 비용매 유도 상전이법으로 중공사 분리막을 제조하였다. 기체 분리용 중공사 분리막은 1.6 m2의 유효 막면적을 갖는 샘플을 제조하여 상온 및 저온에서 기체 투과 특성을 평가하였다. 제조된 기체분리막 모듈의 온도에 따른 기체 투과 특성을 분석하기 위하여 온도별 단일 기체 투과도를 평가한 결과 이산화탄소와 메탄 투과도는 20℃에서 각각 412, 12.7 GPU이며, -20℃에서는 각각 280, 3.6 GPU로써 이상 선택도는 32.4에서 77.8로 향상되었다. 단일 기체 투과 테스트 후 혼합 기체에 대한 분리 테스트를 진행하였으며, 모듈 1단 구성 및 2단 구성(막 면적비 1:1, 1:2, 1:3)을 통하여 투과 거동을 살펴보았다. 1단 구성에서는 stage-cut이 상승함에 따라 메탄의 농도가 상승하지만, 반대로 회수율은 떨어지는 결과를 나타내었다. 2단 구성 테스트에서는 메탄 농도 97% 기준에서 막 면적비 1:1보다 1:3이 메탄의 회수율이 더 높게 측정되었으며, 공급 기체의 온도가 낮을수록 메탄의 회수율이 높아짐을 확인하였고, 최종적으로 폴리술폰 2단 공정에서 메탄 농도 97%, 회수율 97%의 결과를 달성하였다.

인공지능프로세서 기술 동향 (Trends in AI Processor Technology)

  • 이미영;정재훈;이주현;한진호;권영수
    • 전자통신동향분석
    • /
    • 제35권3호
    • /
    • pp.66-75
    • /
    • 2020
  • As the increasing expectations of a practical AI (Artificial Intelligence) service makes AI algorithms more complicated, an efficient processor to process AI algorithms is required. To meet this requirement, processors optimized for parallel processing, such as GPUs (Graphics Processing Units), have been widely employed. However, the GPU has a generalized structure for various applications, so it is not optimized for the AI algorithm. Therefore, research on the development of AI processors optimized for AI algorithm processing has been actively conducted. This paper briefly introduces an AI processor especially for inference acceleration, developed by the Electronics and Telecommunications Research Institute, South Korea., and other global vendors for mobile and server platforms. However, the GPU has a generalized structure for various applications, so it is not optimized for the AI algorithm. Therefore, research on the development of AI processors optimized for AI algorithm processing has been actively conducted.

Use of High-performance Graphics Processing Units for Power System Demand Forecasting

  • He, Ting;Meng, Ke;Dong, Zhao-Yang;Oh, Yong-Taek;Xu, Yan
    • Journal of Electrical Engineering and Technology
    • /
    • 제5권3호
    • /
    • pp.363-370
    • /
    • 2010
  • Load forecasting has always been essential to the operation and planning of power systems in deregulated electricity markets. Various methods have been proposed for load forecasting, and the neural network is one of the most widely accepted and used techniques. However, to obtain more accurate results, more information is needed as input variables, resulting in huge computational costs in the learning process. In this paper, to reduce training time in multi-layer perceptron-based short-term load forecasting, a graphics processing unit (GPU)-based computing method is introduced. The proposed approach is tested using the Korea electricity market historical demand data set. Results show that GPU-based computing greatly reduces computational costs.

솔-젤법을 이용한 aminoalkoxysilane 산소차단필름의 제조 (The Preparation of Sol-Gel Derived Aminoalkoxysilane Films and its Application for Oxygen Barrier)

  • 김현준
    • 반도체디스플레이기술학회지
    • /
    • 제5권3호
    • /
    • pp.17-21
    • /
    • 2006
  • The oxygen barrier films were formed on poly(ethylene terephthalate) (PET) substrate by a sol-gel process using aminoalkoxysilanes. The coating layers were characterized by FT-IR and SEM. The oxygen permeability coefficients of coating films were measured by variable volume method, and then the influences of solvent ratio in sol and film drying temperature on the oxygen barrier properties were investigated. The aminoalkoxysilane coating films exhibited much higher oxygen barrier properties than PET film. The oxygen permeability coefficient of the film coated with each of APTEOS and APTMOS was measured to be $2.96{\times}10^{-6}$ and $3.05{\times}10^{-5}\;GPU$, respectively, while that of PET film was $1.16{\times}10^{-4}\;GPU$.

  • PDF

An IPC-based Dynamic Cooperative Thread Array Scheduling Scheme for GPUs

  • Son, Dong Oh;Kim, Jong Myon;Kim, Cheol Hong
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권2호
    • /
    • pp.9-16
    • /
    • 2016
  • Recently, many research groups have focused on GPGPUs in order to improve the performance of computing systems. GPGPUs can execute general-purpose applications as well as graphics applications by using parallel GPU hardware resources. GPGPUs can process thousands of threads based on warp scheduling and CTA scheduling. In this paper, we utilize the traditional CTA scheduler to assign a various number of CTAs to SMs. According to our simulation results, increasing the number of CTAs assigned to the SM statically does not improve the performance. To solve the problem in traditional CTA scheduling schemes, we propose a new IPC-based dynamic CTA scheduling scheme. Compared to traditional CTA scheduling schemes, the proposed dynamic CTA scheduling scheme can increase the GPU performance by up to 13.1%.

Surface Model and Scattering Analysis for Realistic Game Character

  • Kim, Seongdong;Lee, Myounjae
    • 한국게임학회 논문지
    • /
    • 제21권4호
    • /
    • pp.109-116
    • /
    • 2021
  • In this paper, we considered that recently 3D game characters have been almost alike realistic expression because of a great mathematical computation and efficient techniques on GPU hardware. We presented the rendering technique and analysis for 3D game characters to simulate and render mathematical approach model from recent researches to perform the game engine for the surface reflection of lighting model. We compare our approach with the existing variant rendering techniques here using Open GL shader language on game engine. The experimental result will be provided the view-dependent visual appearance of variant and effective modeling characters for realistic expression using existing methods on the GPU for effective simulations and rendering process. Since there are many operations that are used redundantly while performing mathematical operations, the necessary functions and requirements have been to compute in advance.

R-function을 이용한 형상의 음함수 모델링 및 해석 (Geometric Implicit Function Modeling and Analysis Using R-functions)

  • 신헌주;신동우;김태완
    • 한국CDE학회논문집
    • /
    • 제12권3호
    • /
    • pp.220-232
    • /
    • 2007
  • Current geometric modeling and analysis are commonly based on B-Rep modeling and a finite elements method respectively. Furthermore, it is difficult to represent an object whose material property is heterogeneous using the B-Rep method because the B-Rep is basically used for homogeneous models. In addition, meshes are required to analyze a property of a model when the finite elements method is applied. However, the process of generating meshes from B-Rep is cumbersome and sometimes difficult especially when the model is deformed as time goes by because the topology of deforming meshes are changed. To overcome those problems in modeling and analysis including homogeneous and heterogeneous materials, we suggest a unified modeling and analysis method based on implicit representation of the model using R-function which is suggested by Rvachev. For implicit modeling of an object a distance field is approximated and blended for a complex object. Using the implicit function mesh-free analysis is possible where meshes are not necessary. Generally mesh-free analysis requires heavy computational cost compared to a finite elements method. To improve the computing time of function evaluation, we utilize GPU programming. Finally, we give an example of a simple pipe design problem and show modeling and analysis process using our unified modeling and analysis method.

셀룰로오스 아세테이트 중공사 분리막을 이용한 바이오가스 분리에 대한 향류 흐름 모델의 적용성 (Suitability of Counter-current Model for Biogas Separation Processes using Cellulose Acetate Hollow Fiber Membrane)

  • 정상철;권기욱;전미진;전용우
    • 유기물자원화
    • /
    • 제28권4호
    • /
    • pp.43-52
    • /
    • 2020
  • 멤브레인을 이용한 기체 분리 기술이 발전함에 따라 분리 과정을 설명하기 위해 다양한 수학적 모델을 개발하고 적용해 왔다. 본 연구에서는 셀룰로오스 아세테이트(CA) 중공사 분리막을 제조하여 실험에 사용하였다. 메탄, 질소, 산소 및 이산화탄소 순수가스를 이용하여 투과도를 측정하고, 향류 흐름 모델(Counter-current model)을 적용하여 실험데이터와 비교/해석하였다. CA 막에 대한 이산화탄소와 메탄의 투과도는 각각 25.82 GPU와 0.65 GPU로 나타났다. CO2/CH4 선택도는 39.7이었다. 순수가스 테스트 후 세 가지 모의 혼합가스에 대한 분리 테스트를 수행하였으며, 다양한 stage-cut 조건에서 투과된 가스의 농도를 측정하였다. 실험으로 얻은 데이터를 향류 흐름 모델로 비교한 결과 상당히 일치하는 것으로 나타났으며, CA 멤브레인 모듈을 사용한 바이오가스 분리를 수학적 모델로 구현할 수 있었다. 또한 유한차분법(FDM)을 적용하여 멤브레인에서 바이오가스의 분리 거동을 유추할 수 있었다. 향후 향류 흐름 모델은 바이오가스 분리 공정을 위한 모델로서 활용 가능할 것으로 기대된다.