• 제목/요약/키워드: 다중프로세서 시스템

검색결과 281건 처리시간 0.079초

다중코어 시스템의 메쉬구조 상호연결망이 성능에 미치는 영향 (The Effect of Mesh Interconnection Network on the Performance of Manycore System.)

  • 김한이;김영환;서태원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.116-119
    • /
    • 2011
  • 다중코어(Many-Core) 시스템은 많은 코어들이 상호연결망을 통해서 연결되어있는 시스템으로, 단일코어나 멀티코어 시스템에 비해 보다 많은 병렬 컴퓨팅 자원을 지원한다. Amdahl 의 법칙에 의하면 병렬화되어 처리하는 부분은 이론적으로 프로세서의 개수에 비례하게 가속화 될 수 있지만, 상호연결망에서의 전송 지연을 비롯한 많은 요인에 의해서 성능의 가속화가 저해된다. 특히 캐시 일관성 규약(Cache Coherence Protocol)을 지원하는 대부분의 다중코어 시스템에서는 병렬화를 함에 있어서 캐시 미스로 인해 발생하는 데이터의 전송 지연이 성능에 많은 영향을 미칠 수 있다. 따라서 효과적인 병렬 프로그램을 위해서는 캐시 구조에 대한 이해를 바탕으로 상호연결망에 대한 연구가 필요하다. 본 논문에서는 메쉬(Mesh) 구조의 64 코어 다중코어 시스템인 TilePro64 를 이용하여 상호연결망의 데이터 전송 지연에 따른 프로그램 성능의 민감도를 측정하였다. 결과적으로 코어간 거리(Hop)가 늘어날수록 작업의 수행시간이 평균적으로 4.27%씩 선형적으로 증가하는 관계가 있는 것으로 나타났다.

OSF/1 AD 운영체제의 프로세스 이전 기법 (Process Migration Facility in OSF/1 AD)

  • 조일연;이재경;김해진
    • 전자통신동향분석
    • /
    • 제12권4호통권46호
    • /
    • pp.31-38
    • /
    • 1997
  • OSF/1 AD는 여러 대의 워크스테이션을 연결한 클러스터링 시스템에서부터 인텔 파라곤(Paragon)과 같은 massively parallel(MPP) 시스템에 이르는 다양한 시스템 상에서 단일시스템 이미지를 효과적으로 제공하는 다중컴퓨터용 운영체제이다. 본 고에서는 OSF/1 AD 운영체제의 기본구조와 분산 시스템의 부하 분산 기능 구현의 핵심 요소인 프로세서 이전 기법의 구현 방법에 대하여 살펴보았다.

다중프로세서 시스템에서 고장 감내 실시간 스케줄 기법 (Fault tolerant real-time task scheduling approach in Multiprocessor Systems)

  • 구현우;홍영식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.280-282
    • /
    • 2003
  • 많은 산업 분야에서 사용되는 실시간 시스템은 논리적 정확성뿐만 아니라 시간적 정확성을 요구한다. 그래서 실시간 시스템에서 동작하는 작업들은 항상 마감시간을 지키기 위해 작업에 대한 스케줄링이 매우 중요한 요소가 된다. 그리고 시스템의 신뢰도를 높이기 위해서는 고장 감내가 반드시 필요하다. 특히. 현대 기술의 발달로 일부 분야에서 사용되어 지던 실시간 시스템이 실시간 내장형 시스템 형태로 다양한 분야에 사용되어 진다. 내장형 시스템을 개발하는데 있어 자원의 절약 또한 하나의 중요한 요소이다. 따라서 본 논문에서는 실시간 시스템에서의 작업들이 마감 시간을 만족하며 고장 감내를 보장하는 시간 중복 기법과 백업 기법을 혼합하여 주기적으로 동작하는 작업들의 신뢰도와 자원의 효율 및 절약을 높이는 스케줄링 기법을 제안하고 실험한다.

  • PDF

클러스터 데이터 매핑을 위한 혼합형 휴리스틱 (A Hybrid Heuristic for Clustered Data Mapping)

  • 박경모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.662-664
    • /
    • 2000
  • 병렬 컴퓨팅에서 중요 문제의 하나는 다중 태스크를 다중 프로세서 병렬 시스템의 여러 노드에 대한 최적의 매핑을 찾는 것이다. 이러한 매핑의 목적은 솔루션 품질에 손상 없이 총 실행시간을 최소화시키는 것이다. 이 분야에서는 많은 휴리스틱 방법들을 사용하여 나름대로 매핑 문제를 해결해 왔다. 본 논문에서는 효율적인 클러스터 데이터 매핑을 위한 혼합형 휴리스틱 기법에 대하여 기술한다. 제시하는 휴리스틱 기법은 유전알고리즘과 평균장어닐링 알고리즘을 혼합시킨 것으로 두 가지 방법의 장점들을 합하여 성능을 향상시킬 수 있음을 보여준다. 혼합형 휴리스틱 알고리즘의 솔루션과 실행시간을 기존 매핑 알고리즘들과 비교한 시뮬레이션 결과를 보고한다.

  • PDF

다중프로세서 방식의 자동조립시스템을 위한 관리제어 (Supervisory Control for Multi-Processor-Based Automatic Assembly System)

  • 이재혁;유범재;오상록
    • 대한전기학회논문지
    • /
    • 제39권8호
    • /
    • pp.888-897
    • /
    • 1990
  • In this paper, a multi-processor-based supervisory control for automatic assembly system is presented. The proposed supervisory control is organized in terms of C-language and with structured and easily expandable characteristics. Also the controller is designed to possess diagnostic capability including self-diagnosis of processor module. The developed supervisory control has been shown to be very useful via a high speed automatic assembly system with vision capability.

  • PDF

다중프로세서 시스템을 위한 블로킹 없는 하이퍼큐브 구조와 루팅 알고리즘 (Nonblocking Hypercube Architectures And Routing Algorithms For Multiprocessor Systems)

  • Sang Bang Choi
    • 전자공학회논문지B
    • /
    • 제30B권5호
    • /
    • pp.1-9
    • /
    • 1993
  • In this paper, we develop enhanced hypercube architectures and routing algorithms to realize arbitrary permutations in circuit switching. We prove that a hypercube is rearrangeable if one additional pair of links (one full-duplex communication line) is provided in only one dimesion of connections. We also prove that if each connection between two neighboring nodes consists of two pairs of links, the hypercube can handle two independent permutations simultaneously.

  • PDF

상용 작업부하를 이용한 다중프로세서 컴퓨터 시스템 성능 평가 (Performance Evaluation for a Multiprocessor Computer System Using a Commercial Workload)

  • 박진원
    • 한국시뮬레이션학회논문지
    • /
    • 제8권1호
    • /
    • pp.35-49
    • /
    • 1999
  • The CC-NUMA based, distributed shared memory is an emerging architecture for multiprocessor computer systems because of its scalability and easy of programming. In this paper, we analyzed performance of a ring-based, CC-NUMA multiprocessor computer system using a commercial workload targeted for popular OLTP applications. Based on the traces collected from real machines, the characteristics of the commercial workload could be obtained. The simulation results showed that the bottleneck on the ring could be effectively removed by using a dual ring structure. We believe our simulation methodology and results will help us to design better multiprocessor computer systems for commercial application domains.

  • PDF

다중프로세서 시스템을 \ulcorner나 상호결합 네트워크의 성능 분석 (Performance Analysis of Interconnection Network for Multiprocessor Systems)

  • 김원섭;오재철
    • 대한전기학회논문지
    • /
    • 제37권9호
    • /
    • pp.663-670
    • /
    • 1988
  • Advances in VLSI technology have made it possible to have a larger number of processing elements to be included in highly parallel processor system. A system with a large number of processing elements and memory requires a complex data path. Multistage Interconnection networks(MINS) are useful in providing programmable data path between processing elements and memory modules in multiprocessor system. In this thesis, the performance of MINS for the star network has been analyzed and compared with other networks, such as generalized shuffle network, delta network, and referenced crossbar network.

  • PDF

네트워크 프로세서 기반 고성능 네트워크 침입 탐지 엔진에 관한 연구 (An Implementation of Network Intrusion Detection Engines on Network Processors)

  • 조혜영;김대영
    • 한국정보과학회논문지:정보통신
    • /
    • 제33권2호
    • /
    • pp.113-130
    • /
    • 2006
  • 초고속 인터넷 망이 빠른 속도로 구축이 되고, 네트워크에 대한 해커나 침입자들의 수가 급증함에 따라, 실시간 고속 패킷 처리가 가능한 네트워크 침입 탐지 시스템이 요구되고 있다. 본 논문에서는 일반적으로 소프트웨어 방식으로 구현된 침입 탐지 시스템을 고속의 패킷 처리에 뛰어난 성능을 가지고 있는 네트워크 프로세서를 이용하여 재설계 및 구현하였다. 제한된 자원과 기능을 가지는 다중 처리 프로세서(Multi-processing Processor)로 구성된 네트워크 프로세서에서 고성능 침입 탐지 시스템을 실현하기 위하여, 최적화된 자료구조와 알고리즘을 설계하였다. 그리고 더욱 효율적으로 침입 탐지 엔진을 스케줄링(scheduling)하기 위한 침입 탐지 엔진 할당 기법을 제안하였으며, 구현과 성능 분석을 통하여 제안된 기법의 적절성을 검증하였다.

효율적인 영상데이터 처리를 위한 SIMD기반 매니코어 프로세서 구현 (Implementation of SIMD-based Many-Core Processor for Efficient Image Data Processing)

  • 최병국;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.1-9
    • /
    • 2011
  • 최근 모바일 멀티미디어 기기들의 사용이 증가하면서 고성능, 저전력 멀티미디어 프로세서에 대한 필요성이 높아지고 있는 추세이다. 주문형반도체 (ASIC)는 모바일 멀티미디어에서 요구되는 고성능을 만족시키지만 다양한 형태의 멀티미디어 애플리케이션에서 요구되는 범용성을 만족시키지 못한다. 반면 DSP기반의 시스템은 범용성에 기인하여 다양한 형태의 애플리케이션에서 사용될 수 있으나, 주문형반도체 보다 높은 가격, 전력소모 및 낮은 성능을 가진다. 이러한 문제점을 해결하기 위해 본 논문에서는 범용성을 유지하면서 고성능, 저전력으로 영상데이터 처리가 가능한 단일 명령어 다중 데이터(Single Instruction Multiple Data, SIMD)처리 방식의 매니코어 프로세서를 제안한다. 제안한 SIMD기반 매니코어 프로세서는 16개의 프로세싱 엘리먼트(processing element, PE)로 구성되어 영상데이터 처리에 내재한 무수한 데이터 레벨 병렬성을 높인다. 모의 실험한 결과, 제안한 SIMD기반 매니코어 프로세서는 현재 상용 고성능 프로세서보다 평균 22배의 성능, 7배의 에너지 효율 및 3배의 시스템 면적 효율을 보였다.