• 제목/요약/키워드: hMETIS

검색결과 5건 처리시간 0.024초

계층적 분할 기법과 완화된 국부 탐색 알고리즘을 이용한 효율적인 광역 배치 (Efficient Global Placement Using Hierarchical Partitioning Technique and Relaxation Based Local Search)

  • 성영태;허성우
    • 대한전자공학회논문지SD
    • /
    • 제42권12호
    • /
    • pp.61-70
    • /
    • 2005
  • 본 논문에서는 "middle-down" 접근법에 기반한 기존의 표준 셀 배치기인 하이브리드 배치기$^{[25]}$의 단점을 보완한 효율적인 광역배치 알고리즘을 제안한다. hMETIS(클러스터링을 이용한 다단계 하이퍼그래프 분할기법)에 사용된 기법과 RBLS(Relaxation Based Local Search) 기법의 적절한 조합을 통해 기존 하이브리드 배치기의 광역배치 기능을 향상시킨다. hMETIS를 통한 분할기법을 "top-down" 방식으로 적용하고, 각 단계에서 RBLS를 사용하여 광역배치를 점진적으로 개선해 나가는 제안된 기법은 초기 배치에 크게 영향을 받는 기존 방법의 문제점을 해결하고, 실행 속도를 개선하면서도 배치의 질을 떨어뜨리지 않는 효과적인 기법이다. 제안한 알고리즘을 통해 구현된 개선된 배치기는 기존의 하이브리드 배치기나 FengShui와 같은 우수한 툴과 비교할 때 뒤지지 않는 성능을 보인다. 특별히 기존의 하이브리드 배치기에 비해 실행 속도 면에서 평균 5배 정도의 개선을 보였고, 큰 회로에 대해선 배선길이도 줄어드는 향상된 결과를 보였다.

효율적인 초기 배치를 이용한 개선된 Mongrel (Improved Mongrel with Efficient Initial Placements)

  • 성영태;허성우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.967-969
    • /
    • 2004
  • 본 논문에서는 표준 셀 배치기 Mongrel을 소개하고 두 가지 분할 기법(FM, hMETIS)을 통해 효율적인 초기 배치를 얻음으로써 Mongrel의 성능을 개선한다. Mongrel은 middle-down 방법론을 채택한 전역 배치와 상세 배치의 2단계 표준 셀 배치기이며 전역 배치 단계에서는 RBLS(Relaxation-Based Local Search)를, 그리고 상세 배치 단계에서는 최적 인터리빙(optimal interleaving) 기법을 통해 최적화 알고리즘을 수행한다. MCNC 벤치마크 회로를 이용한 실험을 통해 Mongrel의 성능을 평가하고 효율적인 초기배치가 최종 결과에 미치는 영향을 분석한다.

  • PDF

Mongrel : 계층적 분할 기법을 이용한 광역 배치 (Mongrel : Global Placement with Hierarchical Partitioning)

  • 성영태;허성우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.742-744
    • /
    • 2004
  • 본 논문에서는 표준 셀 배치기 Mongrel의 성능을 개선하기 위해 사용된 다양한 기법에 관해 살펴보고 top-down방식의 계층적 분할 기법을 이용한 광역 배치(Hierarchical Global Placement)를 제안한다. 계층적 분할 기법을 이용한 광역 배치는 RBLS(Relaxation Based Local Search) 기법과 더불어 Mongrel의 성능 개선에 결정적인 역할을 하고 있으며 분할 기법으로 hMETIS(클러스터링을 이용한 다단계 분할 기법)를 사용한다. 우리는 표준 벤치마크 회로를 이용한 실험을 통해 계층적 분할 기법을 이용한 광역 배치 기법이 안정적이면서 효율적인 배치 결과를 가져옴을 보인다.

  • PDF

Parallel Finite Element Analysis of the Drag of a Car under Road Condition

  • Choi H. G.;Kim B. J.;Kim S. W.;Yoo J. Y.
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2003년도 The Fifth Asian Computational Fluid Dynamics Conference
    • /
    • pp.84-85
    • /
    • 2003
  • A parallelized FEM code based on domain decomposition method has been recently developed for a large scale computational fluid dynamics. A 4-step splitting finite element algorithm is adopted for unsteady computation of the incompressible Navier-Stokes equation, and Smagorinsky LES(Large Eddy Simulation) model is chosen for turbulent flow computation. Both METIS and MPI library are used for domain partitioning and data communication between processors respectively. Tiburon of Hyundai-motor is chosen as the computational model at $Re=7.5{\times}10^{5}$, which is based on the car height. It is confirmed that the drag under road condition is smaller than that of wind tunnel condition.

  • PDF

병렬 유한요소 해석기법을 이용한 유동장 해석 (Parallel Finite Element Simulation of the Incompressible Navier-stokes Equations)

  • 최형권;김범준;강성우;유정열
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2002년도 춘계 학술대회논문집
    • /
    • pp.8-15
    • /
    • 2002
  • For the large scale computation of turbulent flows around an arbitrarily shaped body, a parallel LES (large eddy simulation) code has been recently developed in which domain decomposition method is adopted. METIS and MPI (message Passing interface) libraries are used for domain partitioning and data communication between processors, respectively. For unsteady computation of the incompressible Wavier-Stokes equation, 4-step splitting finite element algorithm [1] is adopted and Smagorinsky or dynamic LES model can be chosen fur the modeling of small eddies in turbulent flows. For the validation and performance-estimation of the parallel code, a three-dimensional laminar flow generated by natural convection inside a cube has been solved. Then, we have solved the turbulent flow around MIRA (Motor Industry Research Association) model at $Re = 2.6\times10^6$, which is based on the model height and inlet free stream velocity, using 32 processors on IBM SMP cluster and compared with the existing experiment.

  • PDF