• 제목/요약/키워드: 다중프로세서 시스템

검색결과 281건 처리시간 0.045초

캐시 메모리 동기화 전력 감소를 위한 이벤트 메커니즘에 대한 연구 (Research on Event Mechanism for Reducing Power Overheads in Cache Memory Synchronization)

  • 박영진;정하영;이용석
    • 전자공학회논문지CI
    • /
    • 제48권3호
    • /
    • pp.69-75
    • /
    • 2011
  • 본 논문에서는 다중 프로세서 구조에서 캐쉬 메모리 동기화 시 생기는 전력 오버헤드를 줄이기 위한 애니캐스트 방식의 이벤트 드리븐(Event Driven) 동기화 방법을 제안한다. 제안하는 동기화 방법은 기본적인 동기화 프로토콜에서 SHI(Snoop Hit Invalidate) 또는 SHR(Snoop Hit Read) 발생 시, 락 권한 획득에 실패 하였을 때 발생하는 불필요한 폴링 동작을 줄여 줌으로서 버스 대역폭이 낭비되는 것을 막아주고, 통신에 의한 전력 오버헤드를 감소시켜준다. 더 나아가 브로드캐스트 방식의 이벤트 드리븐 동기화 방법에 비해 불필요한 절전 상태 변화로 인하여 생기는 트랜지션 전력을 줄여 전력 소모를 더욱 감소시킬 수 있다는 장점이 있다. 시뮬레이션 결과 기존 스핀-락 방식에 비해 15.3% 정도의 에너지 절감효과를 얻을 수 있었고 브로드캐스트 방식에 비해서 4.7%의 에너지 절감 효과를 얻을 수 있었다. 따라서 제안하는 동기화 방법은 저전력 다중 프로세서 시스템에 적합한 방식이라고 할 수 있다.

칩 멀티쓰레딩 서버에서 OpenMP 프로그램의 성능과 확장성 (Performance and Scalability of OpenMP Programs on Chip-MultiThreading Server)

  • 이명호;김용규
    • 정보처리학회논문지A
    • /
    • 제13A권2호
    • /
    • pp.137-146
    • /
    • 2006
  • 최근 Chip-level MuitiThreading(CMT) 기술을 내장한 프로세서 들이 출시되면서 그들을 기반으로 하는 공유 메모리 다중 프로세서(SMP: Shared Memory Multiprocessor) 서버 또한 그 사용이 점점 더 보편화 되고있다. OpenMP는 그 사용의 효율성으로 인하여 SMP 시스템을 위한 응용 프로그램의 병렬화를 위한 표준이 되었다. 고성능 컴퓨팅(HPC: High Performance Computing) 응용프로그램 분야에서 더욱 더 빠른 컴퓨터의 처리 능력에 대한 요구가 증가함에 따라, OpenMP 지시어를 사용하여 병렬화된 HPC 응용 프로그램 들의 성능과 확장성을 높이는 일은 그 중요성이 점차 증대되고 있다. 본 논문에서는 CMT 기술을 내장한 대용량 SMP서버인 Sun Fire E25K에서 OpenMP 지시어를 사용하여 병렬화된 HPC 응용 프로그램 들의 suite인 SPEC OMPL(OpenMP를 위한 표준 벤치마크 suite)의 성능과 확장성에 관해 연구했다. 본 논문에서는 또한 SPEC OMPL에 대한 CMT 기술의 효능을 평가하였다.

Parsec 기반 시뮬레이터를 이용한 다중처리시스템의 성능 분석 (Performance Analysis of a Multiprocessor System Using Simulator Based on Parsec)

  • 이원주;김선욱;김형래
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.35-42
    • /
    • 2006
  • 본 논문에서는 Parsec을 이용하여 병렬디지털신호처리용 분산공유메모리 다중처리시스템의 성능 분석을 위한 시뮬레이터를 구현한다. 이 시뮬레이터의 특징은 TMS320C6701 DSP 칩의 DMA 기능과 빠른 접근시간을 가진 지역메모리를 사용하는 시스템의 시뮬레이션에 적합하다는 것이다. 또한 시스템의 성능 매개변수 수정과 하드웨어 구성요소들에 대한 재구성이 쉽기 때문에 다양한 실행 환경에서 시스템의 성능을 분석할 수 있다. 시뮬레이션에서는 DSP 알고리즘에서 널리 사용하는 FET, 2D FET, Matrix Multiplication, Fir Filter를 사용하여 프로세서의 수 데이터 크기, 하드웨어 요소의 변화에 따른 실행 시간을 측정한다. 그리고 그 결과를 비교함으로써 본 논문에서 구현한 시뮬레이터의 성능을 검증한다.

  • PDF

링 구조 NUMA 시스템에서 디스크 입출력의 성능 향상을 위한 효율적인 방안 (Efficient Schemes for Enhancing Performance of Disk I/O in Ring based NUMA Systems)

  • 김철홍;김명주;장성태;엄성용;전주식
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권3호
    • /
    • pp.134-143
    • /
    • 2001
  • NUMA 구조 다중 프로세서 시스템에서는 상호 연결망으로서의 버스의 제약을 극복하기 위해 지점간 링크를 이용한 링 구조가 제안되었다. 링 구조 NUMA 시스템에서, 전송이 페이지 단위(2K 바이트 이상)로 이루어지는 디스크 입출력 요구는 지점간 링크에 대한 오랜 접근을 요구하여 지점간 링크의 트래픽을 증가시키는 원인으로 작용한다. 본 논문에서는 지점간 링크의 트래픽을 줄이기 위한 방안으로 입출력 전용 채널을 사용하는 세 가지 디스크 입출력 구조를 제시한다. 제시되는 디스크 입출력 구조를 사용하는 시스템은 디스크 입출력 요구로 인한 지점간 링크의 접근을 없앰으로써 기존 시스템에 비해 트랜잭션의 수행시간을 줄일 수 있다는 장점이 있다. 중앙집중형, 병렬형, 분산형의 세 가지 디스크 입출력 구조를 설계하기 위한 고려 사항과 구현 비용 등을 생각해 본 후, 노드수, 원격 디스크 접근 확률, 디스크 입출력 전송 데이터 크기 등을 달리한 여러 시스템 환경에서의 각 구조의 성능을 비교, 분석해 본다.

  • PDF

하이퍼 큐브 컴퓨터에서 효과적인 오류 허용 다중전송기법 (Efficient Fault-Tolerant Multicast on Hypercube Multicomputer System)

  • 명훈주;김성천
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권5_6호
    • /
    • pp.273-279
    • /
    • 2003
  • 하이퍼큐브 컴퓨터는 정규적 구조(regular structure)와 짧은 지름(short diameter) 등 병렬 처리에 적합한 특징을 지니고 있기 때문에 이에 대해 많은 연구가 있어 왔다. 하이퍼큐브의 성능을 좌우하는 중요한 요소 중 하나는 프로세서간의 통신인데, 이 중 다중전송(multicast)은 하나의 전송데이터의 복제, 신호처리 둥과 같은 다양한 응용 프로그램에서 이용되는 중요한 통신패턴이다. 병렬 컴퓨터에서 프로세서의 수가 증가함에 따라 구성요소들이 오류가 날 확률도 높아졌다. 이러한 이유로, 오류 난 구성요소들이 있어도 다중 전송이 가능하게 효율적으로 설계하는 것이 중요하다. 이러한 오류 허용 라우팅과 다중 전송은 오류 정보에 따라, 국지적 오류 정보를 바탕으로 하는 전략, 전역적 오류 정보를 바탕으로 하는 전략, 제한된 오류 정보를 바탕으로 하는 전략 등이 있는데, 이 중에서 후자가 정보 수집비용이 적으면서도 좋은 성능을 보인다. 본 논문에서는 최근에 제안된 완전 도달성 정보와 새로 추가한 국지적 정보를 이용해서 라우팅 알고리즘을 제안하고, 이것을 바탕으로 다중 전송 성공률이 높은 새로운 다중 전송 알고리즘을 제안한다. 제안 기법은 완전 도달성 정보와 국지적 정보를 이용하여 우회하는 경우와 다중전송 실패하는 경우를 줄임으로써, 기존의 기법보다 통신량의 차이는 거의 없으면서도 다중전송 성공률을 향상시킬 수 있음을 시뮬레이션을 통해 검증하였다.

자동화재탐지설비의 신뢰성 개선에 관한 연구 (Research on the Reliability Improvement of Automatic Fire Alarm System)

  • 손영진;이영일;이상현
    • 한국화재소방학회논문지
    • /
    • 제22권4호
    • /
    • pp.42-49
    • /
    • 2008
  • 본 연구에서는 기존의 자동화재탐지설비의 오동작(비화재보, 실보)과 빈번한 오동작으로 인한 전원의 차단 등의 문제점을 해결하고 보다 높은 신뢰성을 갖는 자동화재탐지설비를 구성하기 위한 방안을 제시한다. 제안된 방식은 다중센서를 이용한 마이크로프로세서-기반의 디지털 제어시스템으로서 화재 시 발생되는 여러 가지 연소생성물을 감지하기 위해서 열, 연기, CO 센서 등을 복합적으로 사용한다. 이와 같은 방식에 따라 자동화재탐지설비의 오동작 발생 가능성을 줄인 화재감지시스템을 구성하였고, 다중센서 화재감지장치의 화재 감지 및 판별 알고리즘에 의해서 화재발생의 여부를 디지털 제어시스템에 의해서 신뢰도 높게 판단함을 실제 시험을 통해 검증하였다. 실제 화재감지시스템을 구성하였고, 화재시험을 통해서 제안 된 방식의 향상된 신뢰도를 검증하였다.

계층 클러스터 구조를 위한 캐쉬 일관성 프로토콜의 설계 및 구현 (A Design and Implementation of Cache Coherence Protocol for Hierarchical Cluster Architecture)

  • 박신민;최창훈;김성천
    • 한국통신학회논문지
    • /
    • 제19권7호
    • /
    • pp.1282-1295
    • /
    • 1994
  • 본 논문에서는 계층 버스 구조를 기반으로 하는 계층 클러스터 다중프로세서 시스템(hierarchical cluster multiprocessor system)을 제안하고, 이 구조에 효율적인 캐쉬 일관성 프로토콜을 설계 및 구현한다. 계층 클러스터 구조는 클러스터 수의 증가에 따라 버스 계층을 추가함으로써 기존의 단일 버스 시스템에서의 병목 현상(bottleneck)을 없애주어 시스템 확장이 용이하게 된다. 제안된 캐쉬 프로토콜은 일반적인 N-레벨 (N>2) 계층 클러스터 구조에 적용할 수 있도록 설계되었다. 이를 시스템 버스에 구현하기 위하여 기존의 팬디드 프로토콜을 확장하였고 캐쉬 일관성 동작들을 확장된 팬디드 프로토콜상에서 설명한다.

  • PDF

운영체제 시각화를 위한 GUI 구현 (GUI Implementation for operating system visualization)

  • 김동휘;박연택;정해람;양길모;주용완;이준동
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.729-731
    • /
    • 2023
  • 운영체제(Operating System)는 사용자의 하드웨어, 시스템 자원(System Resources)을 제어하고 프로그램에 대한 일반적 서비스를 지원하는 시스템 소프트웨어(System Software)이다. 시스템 하드웨어를 관리할 뿐 아니라 응용 소프트웨어를 실행하기 위하여 하드웨어 추상화 플랫폼과 공통 시스템 서비스를 제공한다. 최근에는 가상화 기술의 발전에 힘입어 실제 하드웨어가 아닌 가상 머신(HyperVisor) 위에서 실행되기도 한다. 본 연구에서는 다중 코어 프로세서를 타겟으로 한 소규모 운영체제 개발 프로젝트의 일환으로 화면 모드를 전환해 주고, 화면을 그리는 기능을 작성해 주었다. 이를 잘 활용하면 고해상도 그래픽모드에서의 보다 심도 있는 그래픽의 구현, 나아가 임베디드 시스템, IOT 등 다양한 분야에 이용할 수 있다.

  • PDF

가상 실험실 구현을 위한 시스템 설계 (System Design for the Implementation of Virtual Laboratory)

  • 송민규
    • 한국산학기술학회논문지
    • /
    • 제6권6호
    • /
    • pp.547-554
    • /
    • 2005
  • Virtual Laboratory는 네트워크 기술의 발전에 따라 제어 및 계측 분야에서 등장하게 된 새로운 개념으로서 현재 여러 대학 및 연구기관에서 폭넓게 사용되고 있다. Virtual Laboratory를 통하여 사용자는 언제 어디서든지 인스트루먼트에 대한 제어 및 모니터링을 할 수 있는데 이러한 특징은 기존의 실험실에서는 얻을 수 없었던 사용자 효율성 및 향상된 성능을 제공한다. 본 논문에서는 먼저 이러한 Virtual Laboratory의 개념 및 필요성에 대해 간략히 살펴본 후 이를 구현하기 위한 방안에 대해 논의하고자 한다. 사용자가 네트워크상에서 원격의 인스트루먼트를 조작 및 운용할 수 있는 클라이언트-서버 기반의 Virtual Laboratory 구현을 위한 프레임워크 설계를 하고자 하며 단일 프로세서는 물론이고 네트워크상에서 대칭적 다중 프로세서 기반의 제어 및 계측 기능을 수행할 수 있는 시스템 모델을 제안하고자 한다.

  • PDF

하이퍼큐브에서 최대오차가 [{1} over {2} logn] 인 양자화된 부하의 동적 재분배 기법 (Dynamic Method wiht a Maximum Difference [{1} over {2} logn] for Redistributing of Quantized Loads on Hypercubes)

  • 임화경;장주욱;김성천
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권9호
    • /
    • pp.1064-1072
    • /
    • 1999
  • 크기가 n인 하이퍼큐브 다중컴퓨터를 위한 대표적인 동적인 재분배 방법인 DEM(Dimension Exchange Method) 기법으로 양자화된 부하를 분배할 때 분배 후 각 프로세서가 갖는 부하의 크기는 최악의 경우, logn~단위부하 만큼 분배오차를 갖게 된다. 이러한 오차를 억제하기 위하여 본 논문에서는 두 프로세서간에 부하를 분배할 때, 가능하면 동일 유형(홀수개 또는 짝수개)의 단위부하를 동일 방향으로 재분배하는 기법을 제안하였다. 그 결과 최대 분배 오차를 LCEIL logn over {2} RCEIL 까지 줄일 수 있었다. 시뮬레이션에 의한 실험을 통해 기존 DEM 방법에 비해 약 30% 정도 시스템의 속도가 향상됨을 보임으로써 제안된 기법이 DEM 기법보다 타당성함을 입증하였다.