• 제목/요약/키워드: Message Passing Interface(MPI)

검색결과 115건 처리시간 0.019초

A synchronous/asynchronous hybrid parallel method for some eigenvalue problems on distributed systems

  • 박필성
    • 한국전산응용수학회:학술대회논문집
    • /
    • 한국전산응용수학회 2003년도 KSCAM 학술발표회 프로그램 및 초록집
    • /
    • pp.11-11
    • /
    • 2003
  • 오늘날 단일 슈퍼컴퓨터로는 처리가 불가능한 거대한 문제들의 해법이 시도되고 있는데, 이들은 지리적으로 분산된 슈퍼컴퓨터, 데이터베이스, 과학장비 및 디스플레이 장치 등을 초고속 통신망으로 연결한 GRID 환경에서 효과적으로 실행시킬 수 있다. GRID는 1990년대 중반 과학 및 공학용 분산 컴퓨팅의 연구 과정에서 등장한 것으로, 점차 응용분야가 넓어지고 있다. 그러나 GRID 같은 분산 환경은 기존의 단일 병렬 시스템과는 많은 점에서 다르며 이전의 기술들을 그대로 적용하기에는 무리가 있다. 기존 병렬 시스템에서는 주로 동기 알고리즘(synchronous algorithm)이 사용되는데, 직렬 연산과 같은 결과를 얻기 위해 동기화(synchronization)가 필요하며, 부하 균형이 필수적이다. 그러나 부하 균형은 이질 클러스터(heterogeneous cluster)처럼 프로세서들의 성능이 서로 다르거나, 지리적으로 분산된 계산자원을 사용하는 GRID 환경에서는 이기종의 문제뿐 아니라 네트워크를 통한 메시지의 전송 지연 등으로 유휴시간이 길어질 수밖에 없다. 이처럼 동기화의 필요성에 의한 연산의 지연을 해결하는 하나의 방안으로 비동기 반복법(asynchronous iteration)이 나왔으며, 지금도 활발히 연구되고 있다. 이는 알고리즘의 동기점을 가능한 한 제거함으로써 빠른 프로세서의 유휴 시간을 줄이는 것이 목적이다. 즉 비동기 알고리즘에서는, 각 프로세서는 다른 프로세서로부터 갱신된 데이터가 올 때까지 기다리지 않고 계속 다음 작업을 수행해 나간다. 따라서 동시에 갱신된 데이터를 교환한 후 다음 단계로 진행하는 동기 알고리즘에 비해, 미처 갱신되지 않은 데이터를 사용하는 경우가 많으므로 전체적으로는 연산량 대비의 수렴 속도는 느릴 수 있다 그러나 각 프로세서는 거의 유휴 시간이 없이 연산을 수행하므로 wall clock time은 동기 알고리즘보다 적게 걸리며, 때로는 50%까지 빠른 결과도 보고되고 있다 그러나 현재까지의 연구는 모두 어떤 수렴조건을 만족하는 선형 시스템의 해법에 국한되어 있으며 비교적 구현하기 쉬운 공유 메모리 시스템에서의 연구만 보고되어 있다. 본 연구에서는 행렬의 주요 고유쌍을 구하는 데 있어 비동기 반복법의 적용 가능성을 타진하기 위해 우선 이론적으로 단순한 멱승법을 사용하여 실험하였고 그 결과 순수한 비동기 반복법은 수렴하기 어렵다는 결론을 얻었다 그리하여 동기 알고리즘에 비동기적 요소를 추가한 혼합 병렬 알고리즘을 제안하고, MPI(Message Passing Interface)를 사용하여 수원대학교의 Hydra cluster에서 구현하였다. 그 결과 특정 노드의 성능이 다른 것에 비해 현저하게 떨어질 때 전체적인 알고리즘의 수렴 속도가 떨어지는 것을 상당히 완화할 수 있음이 밝혀졌다.

  • PDF

MULTI-BLOCK 격자 기법을 이용한 초소형 비행체 주위 공력 특성 해석 (Numerical Investigation of Aerodynamic Characteristics around Micro Aerial Vehicle using Multi-Block Grid)

  • 김영훈;김우례;이정상;김종암;노오현
    • 한국항공우주학회지
    • /
    • 제31권6호
    • /
    • pp.8-16
    • /
    • 2003
  • 3차원 비정상, 비압축성 Navier-Stokes 방정식 해석코드를 이용하여, 초소형 비행체 주위에 형성되는 저 레이놀즈수 유동장의 공력 특성을 연구하였다. 비정상 유동장의 효율적인 계산을 위하여, 개발된 코드는 MPI 프로그래밍 기법을 이용하여 병렬처리 하였으며, single partitioning 방법을 적용하여 3차원 형상에 대한 multi-block 격자계를 효율적으로 해석 하였다. 비교적 형상이 복잡하지 않은 초소형 비행체 주위 날개에 대해 해석한 후 초소형 비행체 전 형상에 대해 받음각을 변화시키며 공력계수 및 정안정성을 살펴보았다. 해석 결과, 서울대학교 미소공기역학실험실에서 수행한 아음속 풍동 실험데이터와 비교하여 보았을 때 대체로 잘 일치하였으며, 개념 설계한 비행체가 공기역학적으로 정안정성을 갖고 있음을 보일 수 있었다.

PC Network Cluster를 사용한 대규모 재료 시뮬레이션에 관한 연구 (A Study on a large-scale materials simulation using a PC networked cluster)

  • 최덕기;류한규
    • 한국항공우주학회지
    • /
    • 제30권5호
    • /
    • pp.15-23
    • /
    • 2002
  • 분자 동역학 기법을 사용한 재료 파괴 시뮬레이션은 계산량의 방대함으로 인하여 극히 최근까지 활발한 연구가 진행되지 못하였으나 최근 컴퓨터의 성능향상으로 인하여 새로운 연구분야로 떠오르고 있다. 분자 동역학은 그 특성상 계산 집약적인 환경을 요구함으로 대규모의 연산을 위해서는 슈퍼컴퓨터나 클러스터(cluster)의 사용이 필수적이나 고가의 장비와 사용료로 인하여 많은 제한을 받아왔다. 본 연구에서는 PC를 사용하여 클러스터를 제작하고, 균열이 있는 시편을 사용하여 파괴현상에 대한 분자 수준의 거동을 시뮬레이션 하였으며, 클러스터의 노드(node) 수, 효율, 분자 수, 노드간의 통신시간 등의 상호관계를 파악하여 최적의 성능을 가진 클러스터를 구성하는 데 필요한 요소들을 분석하였다. 제작된 PC 클러스터를 사용하여 약 50,000개의 분자를 사용한 재료 파괴 시뮬레이션을 수행하였다.

COMPARISONS OF PARALLEL PRECONDITIONERS FOR THE COMPUTATION OF SMALLEST GENERALIZED EIGENVALUE

  • Ma, Sang-Back;Jang, Ho-Jong;Cho, Jae-Young
    • Journal of applied mathematics & informatics
    • /
    • 제11권1_2호
    • /
    • pp.305-316
    • /
    • 2003
  • Recently, an iterative algorithm for finding the interior eigenvalues of a definite matrix by CG-type method has been proposed. This method compares to the inverse power method. The given matrices A, and B are assumed to be large and sparse, and SPD( Symmetric Positive Definite) The CG scheme for the optimization of the Rayleigh quotient has been proven a very attractive and promising technique for large sparse eigenproblems for smallest eigenvalue. Also, it is very amenable to parallel computations, like the CG method for the linear systems. A proper choice of the preconditioner significantly improves the convergence of the CG scheme. But for parallel computations we need to find an efficient parallel preconditioner. Our candidates we ILU(0) in the wave-front order, ILU(0) in the multi-coloring order, Point-SSOR(Symmetric Successive Overrelaxation), and Multi-Color Block SSOR preconditioner. Wavefront order is a simple way to increase parallelism in the natural order, and Multi-coloring realizes a parallelism of order(N), where N is the order of the matrix. Another choice is the Multi-Color Block SSOR(Symmetric Successive OverRelaxation) preconditioning. Block SSOR is a symmetric preconditioner which is expected to minimize the interprocessor communication due to the blocking. We implemented the results on the CRAY-T3E with 128 nodes. The MPI (Message Passing Interface) library was adopted for the interprocessor communications. The test problem was drawn from the discretizations of partial differential equations by finite difference methods. The results show that for small number of processors Multi-Color ILU(0) has the best performance, while for large number of processors Multi-Color Block SSOR performs the best.

국내 옥수수 재배적지 예측을 위한 R 기반의 기후적합도 모델 병렬화 (R Based Parallelization of a Climate Suitability Model to Predict Suitable Area of Maize in Korea)

  • 현신우;김광수
    • 한국농림기상학회지
    • /
    • 제19권3호
    • /
    • pp.164-173
    • /
    • 2017
  • 기후변화에 대응하기 위해 다양한 작부체계 구축이 시도될 수 있다. 변화하는 기후조건에서 작물들이 최적의 재배지에 배치될 수 있도록 기후적합도를 평가하는 것이 중요하다. EcoCrop 모델과 같은 월별 기후자료를 사용하여 여러 작물의 재배적합도들 계산하는 모델을 사용할 경우, 고해상도의 전자기후도를 사용하여 우리나라의 복잡한 지형을 고려한 재배 적합도 계산이 가능하다. 그러나, 방대한 기후자료의 처리를 위해 여러 전산자원들을 동시에 사용할 수 있는 병렬처리 기술 개발이 선행되어야 한다. 본 연구에서는 공개용 통계분석 도구인 R을 기반으로 EcoCrop 모델을 병렬로 구동할 수 있는 스크립트를 개발하고, 이를 격자형 기후자료에 적용하여 옥수수의 재배적지를 예측하였다. 병렬 처리를 시도한 결과 CPU 코어 개수 증가에 따른 처리 시간 단축이 선형적으로 이루어지지는 않았으나 처리시간의 상당부분을 단축할 수 있었다. 예를 들어 16개의 CPU를 사용하였을 때 이상적인 시간보다 1.5배가 넘는 시간이 소모되었으나 총 시간이 90%정도 단축되었다. 이러한 기술들을 작물 생육 모델들이 개발되지 않은 작물들에 적용할 경우, 기후변화 조건에 적응할 수 있는 작부체계 설계를 지원할 수 있을 것이다. 또한, 본 연구에서 사용한 기술들은 CPU 코어가 많은 워크스테이션에서 작동이 가능하나, 여러 컴퓨터를 연결한 중형 컴퓨터에 사용할 수 있는 MPI 기술을 적용할 수 있는 기술개발이 필요할 것이다.