• 제목/요약/키워드: Parallel Simulator

검색결과 159건 처리시간 0.025초

슈퍼스칼라 프로세서에서 동적 분류 능력을 갖는 혼합형 데이타 값 예측기의 설계 (Design of a Hybrid Data Value Predictor with Dynamic Classification Capability in Superscalar Processors)

  • 박희룡;이상정
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권8호
    • /
    • pp.741-751
    • /
    • 2000
  • 슈퍼스칼라 프로세서에서 명령어 수준 병렬성(Instruction Level Parallelism)을 적극적으로 활용하기 위해서는 명령들 사이에 존재하는 제어 종속관계 및 데이타 종속관계를 극복하는 것이 필수적이다. 데이타 값 예측은 하나의 명령 결과가 생성되기 전에 미리 결과 값을 예측하고 이 예측된 결과를 사용하여 데이타 종속관계가 있는 명령들을 투기적으로 실행(speculative execution)하는 기법이다. 본 논문에서는 동적 분류 능력을 갖는 혼합형 데이타 값 예측기를 제안한다. 제안된 예측기는 최근 값 예측기, 스트라이드 예측기 및 2 단계 예측기를 결합한 혼합형으로 구성되며, 예측되는 명령은 하드웨어에 의한 동적 분류에 의해 각 예측기로 할당된다. 각 명령들의 특성에 따라 각 예측기로 실행 시에 동적 분류됨으로써 각 예측기는 기존의 혼합형 방식보다도 더욱 효과적으로 활용될 수 있다. 제안된 방식의 타당성 검증을 위해 실행구동방식(execution-driven) 시뮬레이터를 사용하여 SPECint95 벤치마크를 시뮬레이션하여 비교한다. 실험 결과 Instruction Per Cycle 비교실험에서 2 단계 예측기 보다 0.36, 혼합형 예측기 보다 0.0l8의 성능을 보였고, 제안된 방식이 기존의 혼합형 방식보다 예측 정확도가 평균 16%가 향상되었고, 하드웨어 비용을 측정한 결과 45%의 감소효과를 얻었다.

  • PDF

DSP기능을 강화한 RISC 프로세서 core의 ASIC 설계 연구 (A Study on the Design of a RISC core with DSP Support)

  • 김문경;정우경;이용석;이광엽
    • 한국통신학회논문지
    • /
    • 제26권11C호
    • /
    • pp.148-156
    • /
    • 2001
  • 본 논문에서는 RISC 마이크로프로세서에 DSP프로세서를 추가하여 멀티미디어 기능이 강화된 응용에 알맞은 마이크로프로세서(YS-RDSP)를 제안한다. YS-RDSP는 최대 4개의 명령어를 동시에 병렬로 처리할 수 있다. 프로그램의 크기를 줄이기 위해 YS-RDSP는 16비트와 32비트의 두 가지 명령어 길이를 지원한다. YS-RDSP는 칩 하나로 RISC마이크로프로세서의 programmability 및 제어능력에 DSP의 처리능력을 제공하기 위하여 8-KByte ROM과 8-KByte RAM을 내장하고 있다. 칩 내에 있는 주변장치중 하나인 시스템 컨트롤러는 저전압 동작을 위한 3가지의 전압강하모드를 지원하며 SLEEP명령어는 CPU코어와 주변장치의 동작상태를 변환시킨다. YS-RDSP프로세서는 Verilog-HDL를 이용하여 하향식설계방식으로 구현되었고 C-언어로 작성된 사이클 단위 시뮬레이터를 이용하여 개선되고 검증되었다. 검증된 모델은 0.6um, 3.3V CMOS 표준 셀 라이브러리로 합성되었으며 자동화 P&R에 의해 10.7mm8.4mm코어 면적을 갖도록 레이아웃 되었다.

  • PDF

환기를 동반한 철도터널 화재 연기유속 및 온도장 해석 (The Analysis of Fire-Driven Flow and Temperature in The Railway Tunnel with Ventilation)

  • 장용준;이창현;김학범;이우동
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2008년도 춘계학술대회 논문집
    • /
    • pp.1794-1801
    • /
    • 2008
  • 2006년에 고시가 된 "철도시설 안전세부기준"(건설교통부고시 제2006-395호)에 의하면 1km 이상의 철도터널을 건설할 경우 철도터널에 대한 화재 시뮬레이션을 수행하여 철도터널 내부의 화재에 대한 안전성 분석을 실시하도록 되어있다. 철도터널에서 화재에 대한 안전성 분석을 하기 위해서는 실험적 방법과 수치해석을 이용한 방법이 있는데, 본 연구에서는 수치해석적 방법을 이용하여 터널에서의 화재유동 및 온도장 분포를 해석하였으며, 실험 결과와 비교하여 수치해석의 신뢰성 정도를 분석하였다. Fletcher 등이 수행한 모형 터널 실험을 대상으로 수치해석을 수행하였다. 터널 모형은 길이 182m, 높이 2.4m, 폭 5.4m으로 이루어져 있으며, 수치해석에서도 실험과 동일한 상황을 가정하여 해석을 하였다. 화재가 발생한 부분은 터널의 입구로부터 112m 지점이며, pool fire를 사용하였다. 화재 강도는 약 2.76MW이며, 화원으로써는 Octane을 사용하였다. 수치해석을 위하여 LES 기법을 이용한 FDS (Fire Dynamics Simulator)를 사용하였으며, 본 연구에서는 계산 속도를 증속시키고, 단일 CPU에서는 처리가 곤란한 격자수를 처리하기 위하여 여러 개의 CPU를 사용하는 병렬 처리 기법을 활용하였다. 본 연구에서 사용된 총 격자의 개수는 2.4백만개 이며, 사용된 CPU수는 7개 이다. 수치해석 결과와 실험 결과를 비교 분석하여 수치해석의 신뢰성과 FDS의 철도터널 안전성 분석에의 활용 가능성에 대하여 논하였다.

  • PDF

낸드 플래시 기반 저장장치의 피크 전류 모델링을 이용한 전력 최적화 기법 연구 (Power Optimization Method Using Peak Current Modeling for NAND Flash-based Storage Devices)

  • 원삼규;정의영
    • 전자공학회논문지
    • /
    • 제53권1호
    • /
    • pp.43-50
    • /
    • 2016
  • 낸드플래시 기반 저장장치는 성능 향상을 위해 다중 채널, 다중 웨이 구조를 통해 다수의 낸드 디바이스를 병렬 동작시키고 있다. 하지만 동시 동작하는 낸드 디바이스의 수가 늘어나면서 전력 소모 문제가 가시화되었으며, 특히 디바이스 간 복수의 피크 전류가 서로 중첩되면서 높은 전력소모로 인해 데이터 신뢰성과 시스템 안정성에 큰 영향을 미치고 있다. 본 논문에서는 낸드 디바이스에서 지우기, 쓰기, 읽기 동작에 대한 전류 파형을 측정, 이를 프로파일링하여 피크 전류에 대한 정의와 모델링을 진행하였고, 나아가 다수의 낸드에서 피크 전류 중첩 확률을 계산한다. 또한 시스템 수준의 TLM 시뮬레이터를 개발하여 다양한 시뮬레이션 시나리오를 주입하여 피크 전류 중첩 현상을 분석 한다. 본 실험 결과에서는 낸드간 피크 중첩 현상을 차단할 수 있는 간단한 전력 관리 기법을 적용하여 피크 전류 중첩과 시스템 성능 간의 관계를 살펴보고 이를 통해 성능 저하 최소화를 위한 피크 중첩 비율을 제시하였다.

유전 알고리즘을 이용한 스튜어트 플랫폼의 최적 PID 제어 게인 선정을 위한 실험적 접근 (Experimental approach for selecting an optimal PID control gain using genetic algorithm for stewart platform)

  • 박민규;홍성진;이민철
    • 제어로봇시스템학회논문지
    • /
    • 제6권1호
    • /
    • pp.73-80
    • /
    • 2000
  • The stewart platform manipulator proposed by stewart is the parallel manipulator which is composed of several independent actuators connecting the upper plate with the base plate and capable of executing a six degree of freedom motion. The manipulator has a structure of a closed loop form, and provides better load-to-weight ratio and ratio and rigidity than a serial manipulator with an open loop form. Moreover, the manipulator has high positional accuracy because position errors of actuators are not additive. Because of these advantages, this manipulator is widely used in many engineering applications such as a driving simulator, a tool of machining center, a force/torque sensor and so on. When this Stewart platform manipulator is controlled in joint space, it is difficult to design a controller using an analytic method due to nonhnearity and unknown parameters of actuators. Therefore, a PID controller is often used because of easiness in applications. To find the PID control gain, a trial-and-error method is generally used. This method is time-consuming, and does not guarantee a optimal gain. Thus, this paper proposes a GA-PID controller which selects an optimal PID control gain using genetic algorithms. And this proposed controller is evaluated experimentally and shows acceptable performance.

  • PDF

몬테카를로 방식에 의한 스퍼터율 계산에 관한 연구 (Calculation of Sputter Yield using Monte Carlo Techniques)

  • 반용찬;이제희;원태영
    • 전자공학회논문지D
    • /
    • 제35D권12호
    • /
    • pp.59-67
    • /
    • 1998
  • 본 논문에서는 몬테카를로 방식을 사용하여 이온의 에너지에 대한 타겟 원자의 스퍼터율(Sputter Yield), 이온의 주입 각도에 대한 스퍼터율, 이온의 주입에 따른 타겟 원자의 발산 분포를 3차원으로 시뮬레이션 하였다. 중(중)이온으로 (Ar/sup +/)을 사용하였고, 경(輕)이온으로 (H/sup +/)을 사용하여 10 eV에서 100 KeV 영역의 에너지에 따른 스퍼터율을 계산하였다. 또한, 스퍼터 타겟 물질로서 Cu, Al을 사용하여 계산하였고, 실험치와 일치함을 확인하였다. 스퍼터율은 입사 이온의 에너지가 증가함에 따라 증가하는 경향을 보이지만, 임계점 이후에는 점차적으로 감소하는 경향을 보였다. 중이온에 의한 스퍼터에서는 임계점이 10 KeV 영역이었고, 경이온에 의한 스퍼터에서는 1 KeV 이하 영역이었다. 또한, 이온의 주입 각도에 따라서 타겟의 스퍼터율은 점차적으로 증가하였고, 68° 부근에서 최대 스퍼터율을 기록하였다. 이온의 주입 각도에 따른 타겟 원자의 분포도에서는 각도가 커짐에 따라서 타겟 표면 법선 방향으로 방출되는 원자의 수가 많아짐을 확인하였다. 본 연구에서는, CRAY T3E 슈퍼컴퓨터에서 시뮬레이션을 수행하였으며, 구현된 몬테카를로 스퍼터 시뮬레이터의 GUI(Graphic User Interface) 환경을 구축하였다.

  • PDF

Influence of vacancy defects on vibration analysis of graphene sheets applying isogeometric method: Molecular and continuum approaches

  • Tahouneh, Vahid;Naei, Mohammad Hasan;Mashhadi, Mahmoud Mosavi
    • Steel and Composite Structures
    • /
    • 제34권2호
    • /
    • pp.261-277
    • /
    • 2020
  • The main objective of this research paper is to consider vibration analysis of vacancy defected graphene sheet as a nonisotropic structure via molecular dynamic and continuum approaches. The influence of structural defects on the vibration of graphene sheets is considered by applying the mechanical properties of defected graphene sheets. Molecular dynamic simulations have been performed to estimate the mechanical properties of graphene as a nonisotropic structure with single- and double- vacancy defects using open source well-known software i.e., large-scale atomic/molecular massively parallel simulator (LAMMPS). The interactions between the carbon atoms are modelled using Adaptive Intermolecular Reactive Empirical Bond Order (AIREBO) potential. An isogeometric analysis (IGA) based upon non-uniform rational B-spline (NURBS) is employed for approximation of single-layered graphene sheets deflection field and the governing equations are derived using nonlocal elasticity theory. The dependence of small-scale effects, chirality and different defect types on vibrational characteristic of graphene sheets is investigated in this comprehensive research work. In addition, numerical results are validated and compared with those achieved using other analysis, where an excellent agreement is found. The interesting results indicate that increasing the number of missing atoms can lead to decrease the natural frequencies of graphene sheets. It is seen that the degree of the detrimental effects differ with defect type. The Young's and shear modulus of the graphene with SV defects are much smaller than graphene with DV defects. It is also observed that Single Vacancy (SV) clusters cause more reduction in the natural frequencies of SLGS than Double Vacancy (DV) clusters. The effectiveness and the accuracy of the present IGA approach have been demonstrated and it is shown that the IGA is efficient, robust and accurate in terms of nanoplate problems.

메모리 상주 DBMS 기반의 OLTP 응용을 위한 다중프로세서 시스템 캐쉬 성능 분석 (Cache Performance Analysis of Multiprocessor Systems for OLTP Applications based on a Memory-Resident DBMS)

  • 정용화;한우종;윤석한;박진원;이강우;김양우
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권4호
    • /
    • pp.383-392
    • /
    • 2000
  • 다중프로세서 시스템에 대한 대부분의 기존 연구는 과학계산용 응용을 중심으로 수행되어 왔으며, 또 다른 응용 분야인 상용 응용을 이용한 연구는 아직까지 초보 단계에 머물고 있는 실정이다. 이는 상용 DBMS의 소스 프로그램을 액세스하기가 쉽지 않으며, POSTGRES와 같은 공개된 소스 프로그램을 액세스 할 수 있더라도 컴퓨터 구조 설계자가 수십만 라인의 그 소스 프로그램을 이해하여 의미있는 성능분석을 수행하기는 사실상 불가능하기 때문이다. 본 연구에서는 상용 응용을 이용하여 다중프로세서 시스템을 분석하기 위하여, SQL로 작성된 병렬 프로그램을 아키텍처 시뮬레이터 상에서 수행할 수 있는 EZDB라는 병렬 DBMS를 자체 개발하였다. EZDB가 POSTGRES와 다른점은 그 목적이 다중프로세서 시스템에서 상용 응용을 수행시키고 그 성능을 쉽게 분석할 수 있다는 점이다. EZDB의 유용함을 확인하기 위해, 본 논문에서는 다중프로세서 시스템에서 TPC-B 작업부하를 수행시켰을 때의 캐쉬 성능을 분석한다. 구축된 작업부하를 기반으로 프로그램 구동 시뮬레이션을 수행한 결과, 상용 응용에서 데이터 구조의 공유 특성이 매우 특별하며 국부성 및 작업 세트가 과학계산 응용의 경우와 매우 상이함을 확인하였다.

  • PDF

투사 및 역투사 방법에 따른 컴퓨터단층촬영 영상 비교 (Comparison Study on Projection and Backprojection Methods for CT Simulation)

  • 오오성;이승욱
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제37권4호
    • /
    • pp.323-330
    • /
    • 2014
  • 컴퓨터단층촬영에서 영상 재구성은 가장 중요한 과정 중 하나다. 그 중에서도 빠른 주사시간과 낮은 조사량을 위하여 반복적 재구성(iterative reconstruction)은 점점 중요시 되고 있다. 그리고 이러한 반복적 재구성을 적용하기 위해서 투사 및 역투사 과정은 필수적인 과정이 된다. 그로 인하여 최근 distance-driven approach가 투사 및 역투사 방법으로 제안되었고 주목받고 있다. 본 연구에서는 이 distance-driven approach의 특성을 이해하기 위한 여러 가지 시뮬레이션을 수행하였고 다른 두 가지의 투사 및 역투사 방법과 비교하였다. 우선, 정사각형 팬텀을 이용하여 한 각도에서 투사 및 역투사를 통한 기본적인 특성을 비교 및 분석하였다. 그 후, Shepp-Logan 팬텀을 이용하여 세 가지 투사 및 역투사 방법이 최종 재구성 영상화질에 미치는 영향을 분석하였다. 영상재구성법은 여과 후 역투사와 반복적 재구성(SART)의 두 가지 방법에 대하여 각각 세 가지 투사 및 역투사를 적용하였다. 시뮬레이션 결과 distance-driven approach는 투사 및 역투사시 최소의 아티팩트가 생가는 것을 정사각형 팬텀 시뮬레이션을 통해 확인할 수 있었다. 그리고 이를 이용하여 Shepp-Logan 팬텀의 영상재구성 결과에 적용한 결과 여과 후 역투사와와 반복적 재구성 두 가지 방법 모두에서 distance-driven approach를 통한 재구성영상의 화질이 다른 방법에 비하여 가장 우수함을 확인할 수 있었다. 본 연구를 통해서 distance-driven approach의 투사 및 역투사의 성능을 비교 분석 확인하였다.

부하 균형 유지를 고려한 파이프라인 해시 조인 방법 (A Pipelined Hash Join Method for Load Balancing)

  • 문진규;박노상;김평중;진성일
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.755-768
    • /
    • 2002
  • 다중 조인 연산의 파이프라인 방식 처리에서 조인 어트리뷰트의 자료 불균형(data skew)이 성능에 주는 영향을 연구하고, 자료 불균형을 대비하여 적재부하를 라운드-로빈 방식으로 정적 분할하는 방법과 자료분포도를 이용하여 적응적으로 분할하는 두 가지 파이프라인 해시 조인 알고리즘을 제안한다. 해시 기반 조인을 사용하면 여러 개의 조인을 파이프라인 방식으로 처리할 수 있다. 다중 조인의 파이프라인 방식 처리는 조인 중간 결과를 디스크를 통하지 않고 다른 프로세서에게 직접 전달하므로 효율적이다. 파이프라인 해시 조인 알고리즘이 자료 불균형을 대비한 부하 균형 유지 메커니즘을 갖고 있지 않다면 자료 불균형은 성능에 매우 심각한 영향을 줄 수 있다. 본 논문은 자료 불균형의 영향과 제안된 두 가지 기법을 비교하기 위하여 파이프라인 세그먼트의 실행 모형, 비용 모형, 그리고 시뮬레이터를 개발한다. 다양한 파라미터로 모의 실험을 한 결과에 의하면 자료 불균형은 조인 선택도와 릴레이션 크기에 비례하여 시스템 성능을 떨어뜨림을 보여준다. 그러나 제안된 파이프 라인 해시 조인 알고리즘은 다수의 버켓 사용과 분할의 조율을 통해 자료 불균형도가 심한 경우에도 좋은 성능을 갖게 한다.