• 제목/요약/키워드: Conjugate Gradient method

검색결과 218건 처리시간 0.018초

A domain decomposition method applied to queuing network problems

  • Park, Pil-Seong
    • 대한수학회논문집
    • /
    • 제10권3호
    • /
    • pp.735-750
    • /
    • 1995
  • We present a domain decomposition algorithm for solving large sparse linear systems of equations arising from queuing networks. Such techniques are attractive since the problems in subdomains can be solved independently by parallel processors. Many of the methods proposed so far use some form of the preconditioned conjugate gradient method to deal with one large interface problem between subdomains. However, in this paper, we propose a "nested" domain decomposition method where the subsystems governing the interfaces are small enough so that they are easily solvable by direct methods on machines with many parallel processors. Convergence of the algorithms is also shown.lso shown.

  • PDF

영역분할법에 기반을 둔 병렬 유한요소해석 시스템 (Parallel Finite Element Analysis System Based on Domain Decomposition Method Bridges)

  • 이준성;염곡 강이;이은철;이양창
    • 한국전산구조공학회논문집
    • /
    • 제22권1호
    • /
    • pp.35-44
    • /
    • 2009
  • 본 논문에서는 대규모 3차원 구조해석에 필요한 병렬 유한요소해석을 위한 영역분할법의 적용에 대해 묘사하였다. 영역분할법을 사용한 병렬 유한요소법 시스템을 개발하였다. 절점 생성시, 절점들간의 거리가 특정절점에서의 공간함수와 같아지면 절점이 생성되어 진다. 이 절점공간함수는 퍼지지식처리에 의해 조절되어 진다. 기본적인 요소생성은 데로우니 삼각화 기법을 적용하였다. 자동요소생성 시스템을 이용한 영역분할법은 3차원 해석에 큰 도움이 된다. 공간함수와 유사하게 절점들간의 유한요소해석을 위한 병렬 수치 알고리즘으로서 영역분할법을 전체의 해석영역을 완전히 여러 개의 작은 영역으로 겹치지 않게 나누는 공역구배인 반복적 솔버와 결합시켰다. 개발된 시스템의 효용성에 대한 성능을 몇 가지 예를 통해 제시하였다.

AMG-CG method for numerical analysis of high-rise structures on heterogeneous platforms with GPUs

  • Li, Zuohua;Shan, Qingfei;Ning, Jiafei;Li, Yu;Guo, Kaisheng;Teng, Jun
    • Computers and Concrete
    • /
    • 제29권2호
    • /
    • pp.93-105
    • /
    • 2022
  • The degrees of freedom (DOFs) of high-rise structures increase rapidly due to the need for refined analysis, which poses a challenge toward a computationally efficient method for numerical analysis of high-rise structures using the finite element method (FEM). This paper presented an efficient iterative method, an algebraic multigrid (AMG) with a Jacobi overrelaxation smoother preconditioned conjugate gradient method (AMG-CG) used for solving large-scale structural system equations running on heterogeneous platforms with parallel accelerator graphics processing units (GPUs) enabled. Furthermore, an AMG-CG FEM application framework was established for the numerical analysis of high-rise structures. In the proposed method, the coarsening method, the optimal relaxation coefficient of the JOR smoother, the smoothing times, and the solution method for the coarsest grid of an AMG preconditioner were investigated via several numerical benchmarks of high-rise structures. The accuracy and the efficiency of the proposed FEM application framework were compared using the mature software Abaqus, and there were speedups of up to 18.4x when using an NVIDIA K40C GPU hosted in a workstation. The results demonstrated that the proposed method could improve the computational efficiency of solving structural system equations, and the AMG-CG FEM application framework was inherently suitable for numerical analysis of high-rise structures.

루프-스타(Loop-Star) 기저 함수와 전제 조건(Preconditioner)을 이용한 모멘트법의 계산 효율 향상에 대한 연구 (A Study for Improving Computational Efficiency in Method of Moments with Loop-Star Basis Functions and Preconditioner)

  • 염재현;박현규;이현석;진희철;김효태;김경태
    • 한국전자파학회논문지
    • /
    • 제23권2호
    • /
    • pp.169-176
    • /
    • 2012
  • 본 논문에서는 전계 적분 방정식 (Electric Field Integral Equation: EFIE)을 사용하는 모멘트 법의 저주파 오차(low frequency breakdown) 문제를 해결하기 위한 방법으로 루프-스타(loop-star) 기저 함수를 사용하였다. 또한, 모멘트 법의 해를 계산하기 위하여 conjugate gradient method(CGM)과 같은 반복법을 적용할 경우 반복 횟수를 줄이기 위한 기법으로 p-Type Multiplicative Schwarz preconditioner(pMUS)를 이용하였다. 헬름홀쯔 정리(Helmholtz theorem)에 기반한 루프-스타(loop-star) 기저 함수와 주파수 정규화 기법을 이용하여 전계 적분 방정식에서 Rao-Wilton-Glisson(RWG) 기저 함수를 사용하였을 때 발생하는 저주파 오차(low frequency instability) 문제를 해결할 수 있다. 하지만, RWG 기저 함수를 비발산(solenoidal) 성분과 비회전성(irroatational) 성분으로 분해함으로써 발생하는 행렬 방정식의 높은 조건 수(condition number)로 인하여 CGM과 같은 반복법을 사용할 경우 해를 계산하기 위하여 많은 반복 횟수가 요구된다. 본 논문에서는 이러한 문제점을 해결하기 위한 방안으로 pMUS 전제 조건 기법을 이용하여 CGM의 반복 횟수를 줄였다. 수치 해석 결과, pMUS와 같은 희소성(sparsity)을 가진 블럭 대각 전제 조건(Block Diagonal Precondtioner: BDP)과 비교하였을 때 pMUS는 BDP보다 빠르게 해를 계산할 수 있다.

CDMA 기지국에 설치된 평면 스마트 안테나의 성능 고찰 (Performance of a Rectangular Smart Antenna in CDMA Basestation)

  • 홍영진
    • 한국통신학회논문지
    • /
    • 제32권3C호
    • /
    • pp.323-330
    • /
    • 2007
  • CDMA 셀룰라 망의 기지국에 이용될 수 있는 선형 스마트 안테나를 이차원으로 확장시켜 성능의 척도인 출력 신호대잡음비(Output SNR: Output Signal to Noise Ratio), 출력신호대간섭비(Output SIR: Output Signal to Interference Ratio), 출력신호대간섭잡음비(Output SINR: Output Signal to Interference plus Noise Ratio)를 도출 하였다 Beam forming algorithm 으로 SCGM(Simplified Conjugate Gradient Algorithm)을 설정하고 입력신호대 잡음비, antenna element 숫자, 간섭신호의 분포 등을 변화시키며 평면 스마트 안테나의 성능을 simulate 하였다. 간섭신호들의 방위각(Azimuth angle)이 -90도 에서 +90도 사이에서 고르게 분포할 때, 평면 스마트 안테나의 성능은 같은 숫자의 element를 갖는 선형 스마트 안테나의 성능에 근접함을 보였다.

마이크로파 방송 중계기용 구형창 도파관 필터 설계 및 제작 (Design and Fabrication of Rectangular Iris Waveguide Filter for Microwave Broadcasting Transponder)

  • 문성익;양두영
    • 한국전자파학회논문지
    • /
    • 제10권4호
    • /
    • pp.530-538
    • /
    • 1999
  • 본 논문에서는 WR137 표준 도파관을 사용한 마이크로파 방성 중계기용 필터를 설계하기 위하여 구형 도파관의 불연속 특성해석에 적합한 수정된 ${TE^x}_{mn}$ 모드정합법을 적용하였다. 정확한 해와 수렴속도를 개선시키기 위해 수정된 ${TE^x}_{mn}$ 모드정합법에 공액경사(Conjugate Gradient) 최적화 방법을 적용하여 47 MHz 대역폭을 갖는 마이크로파 방송 중계기용 구형창 도파관 필터를 설계.제작하였다. 그 결과 통과대역 내에서 $S_{11}$$S_{21}$은 각각 최대 -28dB, -0.56dB로 나타났고, 정재파비는 1.02 이하로 나타나 양호한 구형창 필터를 제작할 수 있었다.

  • PDF

이더넷과 인피니밴드 네트워크 기반의 분산 메모리 시스템에서 병렬성능 분석 (PERFORMANCE ANALYSIS OF THE PARALLEL CUPID CODE IN DISTRIBUTED MEMORY SYSTEM BASED ETHERNET AND INFINIBAND NETWORK)

  • 전병진;최형권
    • 한국전산유체공학회지
    • /
    • 제19권2호
    • /
    • pp.24-29
    • /
    • 2014
  • In this study, a parallel performance of CUPID-code has been investigated for both Ethernet and Infiniband network system to examine the effect of cache memory and network-speed. Bi-conjugate gradient solver of CUPID-code has been parallelised by using domain decomposition method and message passing interface (MPI). It is shown that the parallel performance of Ethernet-network system is worse than that of Infiniband-network system due to the slow network-speed and a small cache memory. It is also found that the parallel performance of each system deteriorates for a small problem due to the communication overhead, but the performance of Infiniband-network system is better than Ethernet-network system due to a much faster network-speed. For a large problem, the parallel performance depends less on network system.

회전형 완전도체의 전자파 산란특성 (Electromagnetic Wave Scattering of the Perfect Conducting Body of Revolution)

  • Kim, Jung-Ki
    • 대한전자공학회논문지
    • /
    • 제25권2호
    • /
    • pp.130-138
    • /
    • 1988
  • The method of conjugate gradient (C.G.M.) is applied to the solution of current distribution from body of revolution(B.O.R.). Using the C.G.M., it is possible to analyze electrically large arbitratily oriented B.O.R.. The fundamental differencess between C.G.M. and moment are outlined. This method converge for any initial guess, and this techniqe guarantees a monotonic convegence. Numerical resulsts are presented for electromagnetic case which shows good agreements with moment solution.

  • PDF

BioFET 시뮬레이션을 위한 CUDA 기반 병렬 Bi-CG 행렬 해법 (CUDA-based Parallel Bi-Conjugate Gradient Matrix Solver for BioFET Simulation)

  • 박태정;우준명;김창헌
    • 전자공학회논문지CI
    • /
    • 제48권1호
    • /
    • pp.90-100
    • /
    • 2011
  • 본 연구에서는 연산 부하가 매우 큰 Bio-FET 시뮬레이션을 위해 낮은 비용으로 대규모 병렬처리 환경 구축이 가능한 최신 그래픽 프로세서(GPU)를 이용해서 선형 방정식 해법을 수행하기 위한 병렬 Bi-CG(Bi-Conjugate Gradient) 방식을 제안한다. 제안하는 병렬 방식에서는 반도체 소자 시뮬레이션, 전산유체역학(CFD), 열전달 시뮬레이션 등을 포함한 다양한 분야에서 많은 연산량이 집중되어 전체 시뮬레이션에 필요한 시간을 증가시키는 포아송(Poisson) 방정식의 해를 병렬 방식으로 구한다. 그 결과, 이 논문의 테스트에서 사용된 FDM 3차원 문제 공간에서 단일 CPU 대비 연산 속도가 최대 30 배 이상 증가했다. 실제 구현은 NVIDIA의 태슬라 아키텍처(Tesla Architecture) 기반 GPU에서 범용 목적으로 병렬 프로그래밍이 가능한 NVIDIA사의 CUDA(Compute Unified Device Architecture) 환경에서 수행되었으며 기존 연구가 주로 32 비트 정밀도(single floating point) 실수 범위에서 수행된 것과는 달리 본 연구는 64 비트 정밀도(double floating point) 실수 범위로 수행되어 Bi-CG 해법의 수렴성을 개선했다. 특히, CUDA는 비교적 코딩이 쉬운 반면, 최적화가 어려운 특성이 있어 본 논문에서는 제안하는 Bi-CG 해법에서의 최적화 방향도 논의한다.

직교가중치 탐색방법을 이용한 도착방향 추정 적응어레이 안테나 (Adaptive Antenna Array for DOA Estimation Utilizing Orthogonal Weight Searching)

  • 오정호;최승원;이현배;황영준
    • 한국전자파학회논문지
    • /
    • 제8권2호
    • /
    • pp.116-125
    • /
    • 1997
  • 본 논문에서는 신호원의 도착방향을 추정하기 위한 새로운 방안으로 직교가중치 탐색(OWS : Orthogonal Weight Searching)이라고 명명되어진 새로운 기술을 제안한다. 신호공간에 직교하는 가중치 벡터는 개선된 공액기울기 방식(Conjugate Gradient Method)을 이용하여 신호행렬로부터 직접 계산되어진다. 본 논문에서 제안되는 기술은 고유치 및 고유벡터를 구할 필요가 없으며, 어레이 입력신호의 개수가 웨이트의 수보다 크지 않다는 가정하에 신호갯수의 탐지과정을 포함하지 않는다. 제안기술이 탐지절차와는 무관하게 수행되기 때문에 어레이 입력의 개수가 몇개인지 성공적으로 파악할 수 없는 열악한 신호환경하에서 제안기술은 우수한 성능을 나타 낸다. 제안된 기술의 성능은 기존의 잘 알려진 고유분해방법과 신호대 잡음비에 따른 각해상도 변에서 비교되어 지고, 계산상의 복잡도 변에서도 기존의 알고리즘과 비교하여 우수함을 보인다.

  • PDF