• 제목/요약/키워드: Execution-Driven Simulation

검색결과 30건 처리시간 0.018초

NUMA 다중처리기에서 조정가능한 지연 카운터를 이용한 페이집 복사 기법 (Page replication mechanism using adjustable DELAY counter in NUMA multiprocessors)

  • 이종우;조유곤
    • 전자공학회논문지B
    • /
    • 제33B권6호
    • /
    • pp.23-33
    • /
    • 1996
  • NUMA(Non-Uniform Memory Access)구조의 공유 메모리 다중처리기 시스템에서 참조 국지성의 활용은 병렬 처리의 성능에 큰 영항을 미친다. 본 논문에서는 운영체제가 참조 국지성을 관리하는데 도움을 주기위한 개선된 하드웨어 메모리 참조 카운터를 제시한다. 제신된 참조 카운터 방식에서는 기존의 참조 카운터들과는 달리 운영체제의 페이지 복사 정책을 다양한 메모리 참조 패턴에 적응시키기 위해 카운터의 값이 동적으로 그리고 주기적으로 조정된다. 우리는 실제 병렬 응용 프로그램들을 사용한 실행 구동형 시뮬레이션을 통해 제시된 "조정가능한 지연 카운터"가 이들의 성능에 미치는 영향을 평가하였다. 이 성능평가를 통해 '조정가능한 자연 카운터"를 이용한 메모리 복사 정책이 기존의 카운터를 이용한 정책보다 나은 성능을 보인다는 것과 시뮬레이션에 사용된 대부분의 병렬 응용 프로그램에 대해 고른 성능을 나타낸다는 것을 확인하였다.

  • PDF

멀티코어 비순차 수퍼스칼라 프로세서의 성능 연구 (A Performance Study of Multi-core Out-of-Order Superscalar Processor Architecture)

  • 이종복
    • 전기학회논문지
    • /
    • 제61권10호
    • /
    • pp.1502-1507
    • /
    • 2012
  • In order to overcome the hardware complexity and power consumption problems, recently the multi-core architecture has been prevalent. For hardware simplicity, usually RISC processor is adopted as the unit core processor. However, if the performance of unit core processor is enhanced, the overall performance of the multi-core processor architecture can be further increased. In this paper, out-of-order superscalar processor is utilized for the multi-core processor architecture. Using SPEC 2000 benchmarks as input, the trace-driven simulation has been performed for the out-of-order superscalar cores between 2 and 16 extensively. As a result, the 16-core out-of-order superscalar processor for the window size of 16 resulted in 17.4 times speed up over the single-core out-of-order superscalar processor, and 50 times speed up over the single core RISC processor. When compared for the same number of cores on the average, the multi-core out-of-order superscalar processor performance achieved 3.2 times speed up over the multi-core RISC processor and 1.6 times speed up over the multi-core in-order superscalar processor.

고성능 마이크로프로세서에서 값 예측기의 성능평가 (Performance Evaluation of Value Predictor in High Performance Microprocessors)

  • 전병찬;김혁진;류대희
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.87-95
    • /
    • 2005
  • 고성능 마이크로프로세서에서 값 예측기는 한 명령어의 결과를 미리 예측하여 명령들 간의 데이터 종속관계를 극복하고 실행함으로써 명령어 수준 병렬성(Instruction Level Parallelism, ILP)을 향상시키는 기법이다. 본 논문에서는 ILP 프로세서 명령어 수준 병렬성의 성능향상을 위하섞 값을 미리 예측하여 병렬로 이슈하고 수행하는 값 예측기를 비교 분석하여 각 테이블 갱신 시점에 따른 예측기별 평균 성능향상과 예측률 및 예측정확도를 측정하여 평가한다 이러한 타당성을 검증하기 위해 실행구동방식 시뮬레이터를 사용하여 SPECint95 벤치마크를 시뮬레이션하여 비교한다.

  • PDF

Numerical study of the flow and heat transfer characteristics in a scale model of the vessel cooling system for the HTTR

  • Tomasz Kwiatkowski;Michal Jedrzejczyk;Afaque Shams
    • Nuclear Engineering and Technology
    • /
    • 제56권4호
    • /
    • pp.1310-1319
    • /
    • 2024
  • The reactor cavity cooling system (RCCS) is a passive reactor safety system commonly present in the designs of High-Temperature Gas-cooled Reactors (HTGR) that removes heat from the reactor pressure vessel by means of natural convection and radiation. It is one of the factors responsible for ensuring that the reactor does not melt down under any plausible accident scenario. For the simulation of accident scenarios, which are transient phenomena unfolding over a span of up to several days, intermediate fidelity methods and system codes must be employed to limit the models' execution time. These models can quantify radiation heat transfer well, but heat transfer caused by natural convection must be quantified with the use of correlations for the heat transfer coefficient. It is difficult to obtain reliable correlations for HTGR RCCS heat transfer coefficients experimentally due to such a system's size. They could, however, be obtained from high-fidelity steady-state simulations of RCCSs. The Rayleigh number in RCCSs is too high for using a Direct Numerical Simulation (DNS) technique; thus, a Reynolds-Averaged Navier-Stokes (RANS) approach must be employed. There are many RANS models, each performing best under different geometry and fluid flow conditions. To find the most suitable one for simulating an RCCS, the RANS models need to be validated. This work benchmarks various RANS models against three experiments performed on the HTTR RCCS Mockup by the Japanese Atomic Energy Agency (JAEA) in 1993. This facility is a 1/6 scale model of a vessel cooling system (VCS) for the High Temperature Engineering Test Reactor (HTTR), which is operated by JAEA. Multiple RANS models were evaluated on a simplified 2d-axisymmetric geometry. They were found to reproduce the experimental temperature profiles with errors of up to 22% for the lowest temperature benchmark and 15% for the higher temperature benchmarks. The results highlight that the pragmatic turbulence models need to be validated for high Rayleigh natural convection-driven flows and improved accordingly, more publicly available experimental data of RCCS resembling experiments is needed and indicate that a 2d-axisymmetric geometry approximation is likely insufficient to capture all the relevant phenomena in RCCS simulations.

항공기 제조업에서 생산계획 동기화를 통한 데이터기반 구매조달 및 재고관리 방안 연구 (A Scheme of Data-driven Procurement and Inventory Management through Synchronizing Production Planning in Aircraft Manufacturing Industry)

  • 유경열;최홍석;정대율
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제30권1호
    • /
    • pp.151-177
    • /
    • 2021
  • Purpose This paper aims to improve management performance by effectively responding to production needs and reducing inventory through synchronizing production planning and procurement in the aviation industry. In this study, the differences in production planning and execution were first analyzed in terms of demand, supply, inventory, and process using the big data collected from a domestic aircraft manufacturers. This paper analyzed the problems in procurement and inventory management using legacy big data from ERP system in the company. Based on the analysis, we performed a simulation to derive an efficient procurement and inventory management plan. Through analysis and simulation of operational data, we were able to discover procurement and inventory policies to effectively respond to production needs. Design/methodology/approach This is an empirical study to analyze the cause of decrease in inventory turnover and increase in inventory cost due to dis-synchronize between production requirements and procurement. The actual operation data, a total of 21,306,611 transaction data which are 18 months data from January 2019 to June 2020, were extracted from the ERP system. All them are such as basic information on materials, material consumption and movement history, inventory/receipt/shipment status, and production orders. To perform data analysis, it went through three steps. At first, we identified the current states and problems of production process to grasp the situation of what happened, and secondly, analyzed the data to identify expected problems through cross-link analysis between transactions, and finally, defined what to do. Many analysis techniques such as correlation analysis, moving average analysis, and linear regression analysis were applied to predict the status of inventory. A simulation was performed to analyze the appropriate inventory level according to the control of fluctuations in the production planing. In the simulation, we tested four alternatives how to coordinate the synchronization between the procurement plan and the production plan. All the alternatives give us more plausible results than actual operation in the past. Findings Based on the big data extracted from the ERP system, the relationship between the level of delivery and the distribution of fluctuations was analyzed in terms of demand, supply, inventory, and process. As a result of analyzing the inventory turnover rate, the root cause of the inventory increase were identified. In addition, based on the data on delivery and receipt performance, it was possible to accurately analyze how much gap occurs between supply and demand, and to figure out how much this affects the inventory level. Moreover, we were able to obtain the more predictable and insightful results through simulation that organizational performance such as inventory cost and lead time can be improved by synchronizing the production planning and purchase procurement with supply and demand information. The results of big data analysis and simulation gave us more insights in production planning, procurement, and inventory management for smart manufacturing and performance improvement.

멀티코어 순차 수퍼스칼라 프로세서의 성능 연구 (Performance Study of Multi-core In-Order Superscalar Processor Architecture)

  • 이종복
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권5호
    • /
    • pp.123-128
    • /
    • 2012
  • 최근에 이르러 디지털 시스템의 성능을 극대화하기 위하여, 멀티코어 프로세서가 상용화 되어 널리 이용되고 있다. 이러한 멀티코어 프로세서를 구성하는 단위 코어의 성능을 높이면, 적은 개수의 코어를 가지고 시스템의 성능을 크게 향상시킬 수가 있다. 본 논문에서는 순차실행 방식의 수퍼스칼라를 단위 코어로 하는 멀티코어 프로세서 아키텍쳐를 제안하였다. 그리고, 윈도우 크기가 4에서 16이고 2-코어에서 16-코어로 구성되는 멀티코어 수퍼스칼라 프로세서에 대하여, SPEC 2000 벤치마크를 입력으로 하는 광범위한 모의실험을 수행하였다. 모의실험 결과, 윈도우의 크기가 16일 때 16-코어 수퍼스칼라 프로세서는 1-코어 수퍼스칼라 프로세서보다 8.4배의 성능 향상을 가져왔다. 또한, 같은 코어 개수를 가진 멀티 코어 수퍼스칼라 프로세서의 성능이 멀티코어 RISC 프로세서의 성능의 2 배를 기록하였다.

다중처리기 시스템에서 거짓 공유 완화를 위한 메모리 할당 기법 (Memory Allocation Scheme for Reducing False Sharing on Multiprocessor Systems)

  • 한부형;조성제
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권4호
    • /
    • pp.383-393
    • /
    • 2000
  • 공유 메모리 다중처리기 시스템에서 거짓 공유는 서로 다른 처리기에 의해 참조되는 데이타객체들이 동일한 일관성 유지 블록에 공존하기 때문에 발생하는 현상으로 메모리 일관성 유지비용을 증가시키는 주요 원인이다. 본 논문에서는 주 처리기가 공유 데이타 객체를 총괄하여 할당하는 병렬 응용들을 대상으로 거짓 공유를 감소시켜 주는 새로운 메모리 할당 기법을 제시한다. 제시한 기법에서는 일단 공유객체를 임시 주소공간에 할당한 다음, 나중에 각 객체를 처음으로 참조한 처리기의 주소공간으로 정식 배치한다. 이렇게 함으로써 각 객체를 요청한 처리기별로 별도의 페이지에 각 객체가 할당되며, 서로 다른 처리기에서 요구한 데이타 객체들이 동일 공유 페이지에 섞이지 않게 된다. 본 기법의 효용성을 검증하기 위해 실제 병렬 응용을 사용하여 실행-기반 시뮬레이션을 수행하였다. 실험 결과 제시한 기법은 적은 오버헤드로 기존의 기법들에 비해 거짓 공유 현상을 적게 유발한다는 것을 확인하였다

  • PDF

버퍼 오버플로우 공격에 대한 마이크로구조적 방어 및 복구 기법 (Microarchitectural Defense and Recovery Against Buffer Overflow Attacks)

  • 최린;신용;이상훈
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권3호
    • /
    • pp.178-192
    • /
    • 2006
  • 버퍼 오버플로우 공격은 Code Red나 SQL Stammer와 같은 최근의 웜의 발발에서 알 수 있는 것과 같이 가장 강력하고 치명적인 형태의 악성 코드 공격이다. 버퍼 오버플로우 공격은 일반적으로 시스템에 비정상적인 증상들을 유발한다. 버퍼 오버플로우 공격에 대한 기존의 대처방안들은 심각한 성능 저하를 초래하거나, 다양한 형태의 버퍼 오버플로우 공격을 모두 방지하지 못했으며, 특히 일반적으로 사용되는 소프트웨어 패치를 사용하는 방법은 버퍼 오버플로우 입의 확산을 효과적으로 차단하지 못한다. 이러한 문제를 해결하고자 본 논문에서는 적은 하드웨어 비용과 성능 저하만으로 거의 모든 악성 코드 공격을 탐지하고 피해를 복구할 수 있도록 하는 복귀 주소 포인터 스택 (Return Address Pointer Stack: RAPS) 과 변조 복구 버퍼 (Corruption Recovery Buffer: CRB)라는 마이크로 구조 기술들을 제안한다. 버퍼 오버플로우 공격으로 인한 비정상적인 증상들은 RAPS를 통해 프로세스 실행 중 메모리 참조의 안전성을 점검함으로써 쉽게 탐지될 수 있으며, 이는 그러한 공격들에 의한 잠재적인 데이타 흑은 제어 변조를 피하는 것을 가능하게 한다. 안전 점검 장치의 사용으로 인한 하드웨어 비용과 성능 손실은 거의 발생하지 않는다. 또한, RAPS에 비해 더욱 강도 높은 방법인 CRB를 이용하여 보안 수준을 더욱 향상시킬 수 있다. 변조 복구 버퍼는 안전 점검 장치와 결합되어 버퍼 오버플로우 공격에 의해 발생했을 가능성이 있는 의심스러운 쓰기들을 저장함으로써 공격이 탐지되는 경우 메모리의 상태를 공격 이전의 상태로 복구시킬 수 있다. SPEC CPU2000 벤치마크 중에서 선정한 프로그램들에 대해 상세한 시뮬레이션을 수행함으로써, 제안된 마이크로구조 기술들의 효율성을 평가할 수 있다. 실험 결과는 안전 점검 장치를 사용하여 공격으로 인한 복귀 주소 변조로부터 스택 영역을 방어하는 것이 시스템의 이상 증상들을 상당 부분 감소시킬 수 있다는 것을 보여준다. 또한, 1KB 크기의 작은 변조 복구 버퍼를 안전 점검 장치와 함께 사용할 경우 스택 스매싱 공격으로 인해 발생하는 추가적인 데이타 변조들까지 막아낼 수가 있는데, 이로 인한 성능 저하는 2% 미만에 불과하다.

3G 네트워크에서 MPEG-4 스케일러블 비디오의 실시간 방송을 위한 실행시간 예측 기반 MAC계층 오류제어 (MAC-Layer Error Control for Real-Time Broadcasting of MPEG-4 Scalable Video over 3G Networks)

  • 강경태;노동건
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.63-71
    • /
    • 2014
  • 본 논문에서는 CDMA2000 1xEV-DO의 매체 접근 제어 계층에서 현재 순방향 오류 정정 방법으로 사용되고 있는 리드-솔로몬 복호화 과정의 수행 시간을 다양한 채널 조건에서 분석하였다. 그 결과, 트래픽 채널의 패킷 손실률이 특정 수준 이상으로 높을 경우 리드-솔로몬 복호기의 수행 시간이 길어져 MPEG-4 비디오의 시간 제약을 보장할 수없음을 확인하였다. 이러한 문제를해결하기 위해서본 연구에서는3가지의 기법을제시하였다. 첫째, 정적기법은 패킷 손실률이 특정 임계값 이상일 경우 리드-솔로몬 복호를 생략함으로써 MPEG-4의 시간 제약을 맞춘다. 두 번째 동적 기법은 패킷 손실률이 높더라도 모든 리드-솔로몬 복호를 생략하지는 않고MPEG-4의 시간 제약을 맞출 수 있는 범위 안에서 최대한으로 복구를 수행한다. 마지막 기법인 비디오 인지 동적 기법은 동적 기법과 비슷하지만 비디오 복호에 대한 기여도에 따른 우선 순위 기반으로 복구를 함으로써 비디오의 품질을 더욱 향상시키는 것이다. 우리는 본 논문에서 제안한 기법들을 활용하는 것이 실시간 비디오방송의 서비스 품질을 크게 향상시킬 수 있음을 다양한 실험을 통해 입증하였다.

분산 공유 메모리 시스템에서 거짓 공유를 줄이는 호출지 추적 기반 공유 메모리 할당 기법 (Call-Site Tracing-based Shared Memory Allocator for False Sharing Reduction in DSM Systems)

  • 이종우
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권7호
    • /
    • pp.349-358
    • /
    • 2005
  • 거짓 공유는 공유 메모리 다중 처리기 시스템에서 여러 처리기들이 일관성 유지의 단위 메모리 영역을 공유함으로 인해 발생하는 현상으로써, 메모리 일관성 유지의 정확성에는 아무런 도움을 주지 못하면서 그 비용만 증가시키는 주요 요인이다. 특히 메모리 일관성 유지의 단위가 커질수록 그 피해가 더 커진다고 할 수 있다. 페이지-기반 분산 공유 메모리 시스템에서 거짓 공유를 줄이기 위해서는 공유 페이지에 할당되는 객체들의 특성을 미리 예측하여 참조 패턴이 상이한 객체들이 하나의 공유 페이지에 섞이는 것을 방지하는 것이 필수적이다. 본 논문에서는 병렬 응용 프로그램의 코드 내에서 공유 메모리 할당자를 호출한 위치를 추적하여 서로 다른 호출지에서 요청된 공유 객체가 같은 공유 페이지에 할당되는 것을 방지하는 호출지-추적 기반 거짓 공유 감소 기법(CSTallocator)을 제시한다. CSTallocator는 서로 다른 코드 위치에서 할당 요청된 공유 객체들은 각각 상이한 참조 패턴을 보일 것이라는 가정에 기반하고 있다 이 기법의 효용성을 검증하기 위해 기존 거짓 공유 감소 할당 기법들의 성능과 비교한 결과 기존 방식에 비해 훨씬 더 많은 거짓 공유 폴트를 감소시킨다는 것을 알 수 있었다. 실험은 실제 병렬 응용에 기반한 실행-기반 시뮬레이션 기법을 사용하였다.