• 제목/요약/키워드: MP Parallel Computer

검색결과 34건 처리시간 0.018초

Accelerating Group Fusion for Ligand-Based Virtual Screening on Multi-core and Many-core Platforms

  • Mohd-Hilmi, Mohd-Norhadri;Al-Laila, Marwah Haitham;Hassain Malim, Nurul Hashimah Ahamed
    • Journal of Information Processing Systems
    • /
    • 제12권4호
    • /
    • pp.724-740
    • /
    • 2016
  • The performance issues of screening large database compounds and multiple query compounds in virtual screening highlight a common concern in Chemoinformatics applications. This study investigates these problems by choosing group fusion as a pilot model and presents efficient parallel solutions in parallel platforms, specifically, the multi-core architecture of CPU and many-core architecture of graphical processing unit (GPU). A study of sequential group fusion and a proposed design of parallel CUDA group fusion are presented in this paper. The design involves solving two important stages of group fusion, namely, similarity search and fusion (MAX rule), while addressing embarrassingly parallel and parallel reduction models. The sequential, optimized sequential and parallel OpenMP of group fusion were implemented and evaluated. The outcome of the analysis from these three different design approaches influenced the design of parallel CUDA version in order to optimize and achieve high computation intensity. The proposed parallel CUDA performed better than sequential and parallel OpenMP in terms of both execution time and speedup. The parallel CUDA was 5-10x faster than sequential and parallel OpenMP as both similarity search and fusion MAX stages had been CUDA-optimized.

MP 병렬컴퓨터에서 효과적인 과학계산의 수행 (Efficient Scientific Computation on WP Parallel Computer)

  • 김선경
    • 한국산업정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.26-30
    • /
    • 2003
  • 대칭이고 큰 희소 행렬(Large Sparse Matrices)에 대한 가장 작거나 또는 가장 큰 고유치(Eigenvalues)들을 구하기 위해서 Lanczos 방법이 많이 이용된다. MP(Message Passing) 병렬 컴퓨터에서 global communications은 계산 속도를 떨어뜨린다. 본 논문에서는 s-step Lanczos 알고리즘을 소개하였으며 이 s-step 방법은 기존의 Lanczos 알고리즘에 의해 생성된 행렬에 유사한 축소 행렬을 생성하며 s-step Lanczos 알고리즘에서 한번의 반복은 기존의 Lanczos 알고리즘의 s 번 반복에 해당한다. s-step 방법은 global communications을 최소화하였으며 기존의 알고리즘에 비해 뛰어난 병렬 성질을 가진다. 알고리즘들은 Cray T3E에서 수행되었으며 그 결과를 볼 수 있다.

  • PDF

그래프 컬러링과 OpenMP를 이용한 병렬 메쉬 스무딩 알고리즘의 성능 분석 (Performance Analysis of a Parallel Mesh Smoothing Algorithm using Graph Coloring and OpenMP)

  • 신명규;김지범
    • 전자공학회논문지
    • /
    • 제53권6호
    • /
    • pp.80-87
    • /
    • 2016
  • 본 논문에서는 그래프 컬러링과 OpenMP를 사용한 병렬 메쉬 스무딩 알고리즘을 제안하고 공유메모리 기반의 슈퍼컴퓨터를 이용하여 제안하는 병렬 메쉬 스무딩 알고리즘의 성능 분석을 수행하였다. 제안하는 병렬 메쉬 스무딩 알고리즘은 그래프 컬러링 방법을 통해 전체 메쉬를 여러 개의 독립적인 집합 (색깔)으로 나눈 후 각각의 독립적인 집합에 대하여 OpenMP 라이브러리를 사용하여 순차적으로 병렬 메쉬 스무딩을 수행하는 방법이다. 실험을 통하여 여러 가지 그래프 컬러링 방법과 색깔 순서 재배열 방법이 병렬 메쉬 스무딩의 효율성에 미치는 영향에 대해서 알아보았다. 또한, OpenMP의 루프 스케줄링 방법이 병렬 메쉬 스무딩의 효율성에 끼치는 영향에 대해서 알아보았다.

단일 칩 다중 프로세서상에서 운영체제를 사용하지 않은 OpenMP 구현 및 주요 디렉티브 변환 (Implementation and Translation of Major OpenMP Directives for Chip Multiprocessor without using OS)

  • 전우철;하순회
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권4호
    • /
    • pp.145-157
    • /
    • 2007
  • 단일 칩 다중 프로세서의 경우 표준화된 병렬 프로그래밍 방법이 없는데 OpenMP를 사용하면 병렬 프로그래밍이 쉬우므로 OpenMP는 단일 칩 다중 프로세서를 위한 매력적인 병렬 프로그래밍 모델이다. 그런데 단일 칩 다중 프로세서 시스템의 구조는 대상 응용 프로그램에 따라 다양할 수 있다. 따라서 각 시스템마다 다른 방식으로 OpenMP를 구현해야 할 필요가 있다. 본 논문에서는 운영체제를 사용하지 않는 단일 칩 다중 프로세서를 위한 OpenMP 구현과 주요 디렉티브의 효과적인 변환을 제안하여 특수한 하드웨어에 의존하지 않고 OpenMP 디렉티브의 추가적인 확장 없이 성능을 향상 시킬 수 있게 한다. 실험은 대상 플랫폼인 CT3400에서 수행하고 그 결과를 제시한다.

MP-2에서의 타원형 편미분 방정식 병렬계산 (Parallel Computation of Elliptic Partial Differential Equation on MP-2)

  • 김형중;이용호
    • 산업기술연구
    • /
    • 제14권
    • /
    • pp.19-28
    • /
    • 1994
  • 일반적으로 2차원 Poisson 방정식을 풀기 위해 유한 차분법을 이용하여 tridiagonal block Toeplitz 선형방정식을 얻는다. 이 선형방정식의 독특한 형태를 활용하기 위해 Lyapunov 방정식으로 변화시킨 다음 이산정현변환(DST)을 이용해서 대각선 행렬로 만들면 계산이 용이해진다. 또 DST는 FFT를 이용해 계산할 수 있으므로 고속 계산이 가능하다. FFT를 병렬로 처리하기 위해 프로세서가 4,096개인 SIMD 컴퓨터 MP-2에서 시뮬레이션했다. 본 논문에서는 알고리즘 유도, 매핑 및 시뮬레이션 결과를 제시했다.

  • PDF

OpenMP 병렬프로그램을 이용한 그물의 수중형상 시뮬레이션 구현 (Implementation of Underwater Simulation of a Net using OpenMP)

  • 박명철;박석규
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.11-17
    • /
    • 2008
  • 수중에서 그물의 형상변화는 다양한 벡터에 의해 영향을 받게 된다. 그러나 그물의 각 입자마다 모든 벡터의 영향을 계산하는 것은 정확성과 사실성은 증대하지만, 방대한 계산량으로 처리 시간이 많이 소요된다. 기존의 시뮬레이션 방법들은 물리적 사실성을 희생하고 시각적인 사실성을 유지하는 범위에서 수중 가상현실을 시뮬레이션으로 구현하였다. 본 논문에서는 입자들의 병렬처리를 통하여 물리적, 시각적 사실성을 모두 만족하는 시뮬레이션을 제안한다. 병렬처리를 위해서는 OpenMP를 이용하였고, 사실적 그래픽 표현은 OpenGL을 사용하여 구현하였다. 본 논문에서 구현한 시뮬레이션은 게임 및 해양수산 분야에서 모델분석이나 전문가 시스템구축을 위한 기초자료로 활용될 수 있을 것이다.

  • PDF

Performance Comparison of Parallel Programming Frameworks in Digital Image Transformation

  • Shin, Woochang
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제11권3호
    • /
    • pp.1-7
    • /
    • 2019
  • Previously, parallel computing was mainly used in areas requiring high computing performance, but nowadays, multicore CPUs and GPUs have become widespread, and parallel programming advantages can be obtained even in a PC environment. Various parallel programming frameworks using multicore CPUs such as OpenMP and PPL have been announced. Nvidia and AMD have developed parallel programming platforms and APIs for program developers to take advantage of multicore GPUs on their graphics cards. In this paper, we develop digital image transformation programs that runs on each of the major parallel programming frameworks, and measure the execution time. We analyze the characteristics of each framework through the execution time comparison. Also a constant K indicating the ratio of program execution time between different parallel computing environments is presented. Using this, it is possible to predict rough execution time without implementing a parallel program.

병렬구조를 이용한 증강현실 구현 (Implementation of augmented reality using parallel structure)

  • 박태룡;허훈;곽재창
    • 전기전자학회논문지
    • /
    • 제17권3호
    • /
    • pp.371-377
    • /
    • 2013
  • 본 논문에서는 FAST와 BRIEF 알고리즘을 기반으로 하는 증강현실을 구현하기 위해서 효율적인 병렬 구조를 제안한다. 객체 인식 알고리즘으로 잘 알려진 SURF 알고리즘은 객체인식에 강인하지만 연산 량이 많아 실시간으로 구현하기에 어려운 단점을 가지고 있다. FAST와 BRIEF 알고리즘을 활용하여 객체를 인식하였고, 임베디드 환경에서 성능을 향상하기 위해 기존의 OpenMP 라이브러리를 사용한 병렬구조를 개선하여 속도를 약 70%에서 100%로 향상 시켰다.

PERFORMANCE OF A KNIGHT TOUR PARALLEL ALGORITHM ON MULTI-CORE SYSTEM USING OPENMP

  • VIJAYAKUMAR SANGAMESVARAPPA;VIDYAATHULASIRAMAN
    • Journal of applied mathematics & informatics
    • /
    • 제41권6호
    • /
    • pp.1317-1326
    • /
    • 2023
  • Today's computers, desktops and laptops were build with multi-core architecture. Developing and running serial programs in this multi-core architecture fritters away the resources and time. Parallel programming is the only solution for proper utilization of resources available in the modern computers. The major challenge in the multi-core environment is the designing of parallel algorithm and performance analysis. This paper describes the design and performance analysis of parallel algorithm by taking the Knight Tour problem as an example using OpenMP interface. Comparison has been made with performance of serial and parallel algorithm. The comparison shows that the proposed parallel algorithm achieves good performance compared to serial algorithm.

그래픽 프로세서를 이용한 병렬연산 기반 해무 제거 고속화 (Acceleration for Removing Sea-fog using Graphic Processors and Parallel Processing)

  • 김영두;곽재민;서영호;최현준
    • 한국항행학회논문지
    • /
    • 제21권5호
    • /
    • pp.485-490
    • /
    • 2017
  • 본 논문에서는 그래픽 프로세서를 이용하여 고속으로 해무를 제거하는 기술을 제안한다. 이 기술은 호스트 프로세서(CPU)와 병렬처리가 가능한 여러 개의 그래픽 프로세서를 이용하여 입력영상에서 해무를 제거하는 것이다. 해무를 제거하는 과정 중에서 다크 채널 추출, 최대 밝기 채널 추출, 전달량 계산은 호스트 프로세서에서 수행하고, 양방향 필터를 적용하여 전달량을 정제하는 과정을 그래픽 프로세서를 기반으로 병렬처리하여 연산속도를 높였다. 제안한 병렬처리 기법의 검증을 위해 NVIDIA사의 GTX 1070 GPU를 3개를 사용하여 검증환경을 구성하였다. 구현결과 하나의 그래픽 프로세서로 구현하였을 때는 평균 140ms가 소요되고, OpenMP와 다중 GPGPU를 이용하여 구현하였을 때 26ms 소요되었다. 본 논문에서 제안하는 그래픽 프로세서 기반의 병렬연산 해무제거 기술은 선박의 안전항해, 항만 관제 분야에 사용될 수 있을 것이다.