• 제목/요약/키워드: 병렬 통신

검색결과 1,126건 처리시간 0.022초

유전 알고리즘을 이용한 다중프로세서 시스템에서의 선형 스케쥴링 알고리즘 구현 (An Implementation of the Linear Scheduling Algorithm in Multiprocessor Systems using Genetic Algorithms)

  • 배성환;최상방
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권2호
    • /
    • pp.135-148
    • /
    • 2000
  • 본 논문에서는 유전 알고리즘을 이용하여 다중프로세서 시스템을 위한 선형 스케쥴링 알고리즘을 제안하였다. 일반적으로 유전 알고리즘은 초기세대를 임의로 생성하기 때문에, 문제에 적합하지 않은 개체들의 영향으로 긴 천이시간과 느린 수렴속도를 갖는다. 제안된 알고리즘은 프로세서간의 통신비용을 고려하며, 초기세대를 생성할 때 현재 노드를 기준으로 직접 후임노드만을 동일 프로세서에 할당함으로써 선형 스케쥴링을 하게 되고, 교배연산과 변이연산에서도 기준 노드의 직접 전임노드나 직접 후임노드의 결합을 변화시킴으로써 선형성을 유지하게 된다. 선형 스케쥴링은 비선형에 비해 프로그램의 병렬성을 최대한 활용할 수 있을 뿐 아니라, 코오스 그레인(coarse grain) 방향성 비순환 그래프(directed acyclic graph: DAG)에서 항상 우수한 스케쥴ㄹㅇ 결과를 생성한다. 본 논문의 목적은 유전 알고리즘의 실시간 사용 가능성에 중점을 두었으며, 시뮬레이션 결과 제안된 알고리즘은 대부분의 DAG에서 50세대 내의 빠른 수렴속도를 나타내었다.

  • PDF

GEN_BLOCK간 재분산을 위한 통신 스케줄 (Communication Schedule for GEN_BLOCK Redistribution)

  • 육현규;박명순
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권5호
    • /
    • pp.450-463
    • /
    • 2000
  • 배열 재분산은 분산 메모리 컴퓨팅 환경에서 응용 프로그램의 수행 속도를 빠르게 하기 위해 많이 사용되고 있다. 특히 GEN BLOCK간 재분산은 동적으로 부하가 변화하는 경우 최적화된 성능을 보이기 위해 필요하다. 배열 재분산에 관한 기존 연구들은 대부분 CYCLIC(N)등과 같은 정규 분산 패턴간 재분산에 대해서만 이루어져 왔다. 그러나 GEN BLOCK등과 같은 비정규 분산 패턴간 재분산에서 발생하는 메시지패싱들은 정규 분산 패턴간 재분산과는 다른 특정을 보이기 때문에 이에 대한 새로운 연구가 필요하다. 본 논문은 GEN BLOCK간 재분산에서 발생하는 메시지패싱들에 정규 분산 패턴간 재분산에서 발견되 는 규칙성은 없는 반면 공간 지역성 (spacial locality)이 존재함을 보이고, 이를 기반으로 최소 스텝 정리와 최소 크기 정리가 재분산의 성능을 향상시키는데 중요함을 증병하였으며, 기존의 리스트 스케줄링 방식에 재구성 단계(relocation phase)를 추가함으로써 최적 스케줄을 생성하는 알고리즘을 제시하였다. 마지막으로 제안한 알고리즘의 성능을 평가하기 위해 , CRAY T3E와 IBM SP2에서 성능 평가를 수행 하였으며, 그 결과 분산 메모리 병렬 머신에서 최소 스텝 정리와 최소 크기 정리를 만족하는 스케줄이 GEN BLOCK간 재분산의 성능 향상에 중요함을 보였다.

  • PDF

이동통신 단말기를 위한 재구성 가능한 구조의 H.264 인코더의 움직임 추정기와 3차원 그래픽 렌더링 가속기 설계 (Reconfigurable Architecture Design for H.264 Motion Estimation and 3D Graphics Rendering of Mobile Applications)

  • 박정애;윤미선;신현철
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권1호
    • /
    • pp.10-18
    • /
    • 2007
  • 휴대용 단말기에서의 동영상 및 3차원 영상을 처리하는 것이 일반화되면서, H.264 및 3차원 그래픽 가속기 데이타를 처리하기 위한 연산량이 크게 증가하고 있다. 본 연구에서는 H.264 인코더의 움직임 추정기 및 디코더의 움직임 보상기와 3차원 그래픽 렌더링 가속기를 재구성 가능하도록 설계하였다. 움직임 추정기는 효율적인 데이타 스캐닝 방법과 DAU, FDVS 알고리즘을 사용하여, JM8.2에 제시된 다중 프레임 움직임 추정보다 연산량을 평균적으로 70% 이상 감소시키면서 화질 열화가 없도록 하였다. 3차원 그래픽 렌더링 가속기는 중심선 트래버셜 알고리즘을 사용하여 병렬 처리하도록 함으로써 처리량을 증가시켰다. 움직임 추정기와 3차원 렌더링 가속기의 메모리를 재구성 가능한 구조로 설계하여, 2.4Mbits (47%)의 메모리를 공유하였으며, 메모리를 8개의 블록으로 분산시켜 사용되지 않는 부분의 전력 소모를 최소화 할 수 있도록 하였다. 또한, 움직임 보상기와 3차원 렌더링 가속기의 픽셀 프로세서를 공유하여 약 7%의 하드웨어면적을 감소 시켰다.

KDSM(KAIST Distributed Shared Memory) 시스템의 설계 및 구현 (Design and Implementation of KDSM(KAIST Distributed Shared Memory) System)

  • 이상권;윤희철;이준원;맹승렬
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권5호
    • /
    • pp.257-264
    • /
    • 2002
  • 본 논문에서는 KDSM(KAIST Distributed Shared Memory) 시스템의 설계 및 구현에 관해서 설명한다. KDSM은 Linux 2.2.13 상에서 실행되는 사용자 수준 라이브러리로 구현되었고, TCP/IP를 기반 통신 구조로 사용한다. KDSM은 페이지 기반 무효화 프로토콜(page-based invalidation protocol)과 다중 쓰기 프로토콜(multiple writer protocol)을 기반으로 하고, HLRC(Home-barred Lazy Release Consistency) 메모리 일관성 모델을 사용한다. KDSM의 성능을 측정하기 위해서 4개의 과학계산용 응용 프로그램을 실행하여 JIAJIA와 성능 비교를 하였다. 그 결과, 2개의 응용은 같은 결과를 냈고, 나머지 2개는 KDSM의 성능이 우수하였다.

계산 그리드에서의 시변 쿼럼 상태 예측을 기반으로 한 QoS 제약 자원 재구성 방법 (QoS-Constrained Resource Reconfiguration Scheme based on Temporal Quorum Status Estimation in Computational Grids)

  • Byungsang, Kim;Dong Su, Nam;Bong Hwan, Lee
    • 한국정보과학회논문지:정보통신
    • /
    • 제31권5호
    • /
    • pp.460-468
    • /
    • 2004
  • Quality of Service (QoS) 제약을 통한 자원관리 정책은 사용자에 의해 요구되는 서비스를 보장해줄 수 있는 장점을 가지고 있다. 쿼럼 시스템은 중복되어 저장되어 있는 데이타의 무결성과 가용성을 보장해 줄 수 있는 특성을 의미한다. 이 논문에서 우리는 사용자의 응용프로그램이 요구하는 시스템 자원 및 네트워크 자원의 QoS를 만족시킬 수 있는 쿼럼 기반의 자원관리방법을 제안한다. 또한 우리는 쿼럼 시스템내의 자원에서 실행되고 있는 응용프로그램의 실행시간을 통하여 자원의 상태예측을 하고 기대되는 자원의 서비스 수준을 유지하기 위한 자원의 재구성기법을 제안하고 있다. 자원의 재구성은 현재의 가용한 쿼럼내의 자원의 집합을 요구되는 서비스 수준으로 새롭게 재구성하는 것을 의미한다. 자원 재구성 정책의 효율성을 평가하기 위해서 우리는 인공심장혈류해석 병렬 프로그램을 사용하였다. 실험결과는 자원의 재구성 방식이 자원의 재구성 방식을 채택하지 않은 경우와 비교해서 응용프로그램의 실행완료시간을 감소시킬 뿐 아니라 실행환경의 안정성을 증가시키고 있다.

신뢰적인 멀티캐스트 전송 프로토콜을 위한 Top-Down 기반의 제어 트리 구축 방안 (A Top-down based Control Tree Construction Mechanism for Reliable Multicast Transport Protocols)

  • 김은숙;고석주;강신각;최종원
    • 한국정보과학회논문지:정보통신
    • /
    • 제28권4호
    • /
    • pp.611-620
    • /
    • 2001
  • 최선의 전송(Best Effort) 서비스를 제공하는 현재의 IP 멀티캐스트 서비스의 특성상 신뢰전송을 요구하는 각종 응용들의 요구를 만족시키기 위해서는 추가적인 신뢰전송 프로토콜이 필요하다. 이러한 요구에 따라 신뢰적인 멀티캐스트 전송 프로토콜에 대한 연구가 수행되고 있는 가운데, 계층적 트리를 구축하여 신뢰성을 보장하는 노력이 활발하게 진행되고 있다. 계층적 트리 기반의 방식은 높은 확장성을 보장하면서 효율적으로 신뢰성을 보장하지만 전송단계에서 효율적인 논리 트리 구축 방안이 제공되어야 한다. 논리적인 제어 트리 구축은 수신자 기반의 상향식 (bottom-up) 방식이 주로 사용되어 왔으나 이 방법은 병렬적 트리 구성을 통하여 신속한 트리 구축을 할 수 있다는 장점이 있지만 제어 트리 상에 루프 (loop)가 발생할 수 있다는 단점과 메시지 부하가 커지는 단점이 있다. 이에 본 논문은 하향식(top-down) 기반의 제어 트리 구축 방안을 제안한다. 하향식 방식은 단계적인 트리 구축을 통하여 루프 발생을 방지 할 수 있다. 또한 성능평가를 통하여 메시지 부하를 줄일 수 있다는 것을 보였다. 본 논문은 응용의 요구 사항에 맞추어 상향식과 하향식을 선택적으로 사용할 것을 제안한다.

  • PDF

저가의 그래픽스 장치를 이용한 GPU 클러스터 시스템 구현 (Implementation of a GPU Cluster System using Inexpensive Graphics Devices)

  • 이종민;이중화;김성우
    • 한국멀티미디어학회논문지
    • /
    • 제14권11호
    • /
    • pp.1458-1466
    • /
    • 2011
  • 최근 들어 GPU 성능이 급격하게 향상됨에 따라서 그래픽 처리가 아닌 일반 계산 분야에도 활용하기 위하여 GPGPU 분야에 대한 연구에 많이 이루어지고 있다. 본 논문에서는 저가의 그래픽스 장치에 내재된 GPU를 활용하여 비용 대비 성능이 높은 시스템을 구현하기 위하여 기존의 슈퍼컴퓨터 구조를 벤치마킹한 시스템 구조를 제안하고, 8개의 GPU를 사용하는 GPU 클러스터 시스템을 구현한다. 또한 이를 위한 소프트웨어 환경을 구축하여 n-body 문제를 사용하여 시스템 성능을 분석한다. 성능 평가 결과 사용하는 GPU 수가 많아질수록 통신경비로 인하여 문제 크기가 충분히 커야 효율적임을 알 수 있었다. 그리고 GPU내 자원 부족 문제 때문에 발생하는 문제 크기 제약을 블록 단위로 계산하여 완화할 수 있는 방법을 적용하여 최대 팔백만 개의 천체에 대한 계산을 할 수 있었다.

초광대역 대역통과여파기의 설계와 제작에 관한 연구 (A Study on the Design and Fabrication of the UWB Bandpass Filter)

  • 국정형;최병하;김규철;박정률;함민수
    • 한국항행학회논문지
    • /
    • 제13권1호
    • /
    • pp.41-47
    • /
    • 2009
  • 이 논문에서는 마이크로스트립을 이용하여 차단주파수가 10.2 GHz인 계단형 임피던스 구조의 저역 통과 여파기를 설계하고, 차단주파수 3.2 GHz인 병렬 스터브를 이용한 고역 통과 여파기를 설계하여 서로 결합하고 삽입하여 소형화하는 방식으로 UWB 대역을 포함하는 대역통과여파기를 설계, 제작하였다. 설계에 사용된 기판의 유전율은 2.2, 높이 0.508mm, loss tangent 0.0009이고, 대역통과 여파기의 넓이는 약 3 cm의 소형으로 제작되었다. 통과 대역에서의 측정 결과 -10 dB 대역폭은 7.5 GHz, -3dB 이하의 삽입손실의 특성을 보였다. 이 연구의 결과 UWB 통신 시스템과 MIC/MMIC, RFIC 시스템에 충분히 이용될 수 있을 것이다.

  • PDF

비규칙 토폴로지 스위치 기반 클러스터 시스템을 위한 메쉬 프로세스의 인접 기반 매핑 (Adjacency-Based Mapping of Mesh Processes for Switch-Based Cluster Systems of Irregular Topology)

  • 모상만
    • 전자공학회논문지CI
    • /
    • 제47권2호
    • /
    • pp.1-10
    • /
    • 2010
  • 가상의 프로세스 토폴로지를 물리적인 프로세서 토폴로지로 매핑하는 문제는 병렬 프로그래밍에서 가장 중요한 이슈 중의 하나이다. 그러나 이 매핑은 토폴로지 비규칙성 및 라우팅 복잡성으로 인해 어려운 문제로 여겨지고 있다. 본 논문에서는 프로세스간 통신 패턴으로 2차원 메쉬 프로세스 토폴로지를 가정하여, 비규칙 클러스터 시스템을 위한 새로운 프로세스 매핑 기법인 인접 기반 매핑(AM)을 제안한다. 클러스터 시스템은 전통적인 규칙성 네트워크에서는 달성하기 어려운 상호연결 유연성과 시스템 확장성을 제공하기 때문에 여러 해 동안 활발히 연구 개발되어 오고 있다. 제안한 AM은 가상 프로세스 토폴로지에서 이웃하는 프로세스를 물리적인 프로세서 토폴로지의 인접한 프로세서에게 매핑시킨다. 시뮬레이션 결과에 따르면, 제안한 AM은 기존 방법에 비하여 매핑 품질이 우수하고 프로세스간 지연시간이 감소하는 결과를 나타낸다.

마스터와 슬레이브에 따른 싱글버스와 다중버스 토폴로지의 성능분석 (Performance Analysis of Single and Multiple Bus Topology Due to Master and Slave)

  • 이국표;윤영섭
    • 대한전자공학회논문지SD
    • /
    • 제45권9호
    • /
    • pp.96-102
    • /
    • 2008
  • SoC의 버스 구조에는 싱글버스와 다중버스로 구분된다. 싱글버스는 전송을 원하는 여러 개의 마스터 중 선택된 하나의 마스터만이 데이터 트랜잭션을 수행할 수 있다. 반면에 다중버스는 개별적으로 동작이 가능한 버스를 브리지를 통해 연결하여 각각의 버스에서 여러 데이터를 병렬 처리할 수 있다. 그러나 현재의 버스에서 다른 버스로 데이터 통신을 수행할 경우, 레이턴시가 급격하게 증가할 수 있다. 게다가, 다중버스의 성능은 마스터의 개수, 슬레이브의 종류 등에 따라 쉽게 바뀔 수가 있다. 이에 본 논문에서는 TLM(Transaction Level Model) 시뮬레이션 방법을 이용하여 마스터의 개수, SDRAM, SRAM, 레지스터 등의 슬레이브 종류에 따른 싱글버스와 다중버스 아키텍처의 성능을 정량적으로 비교 분석하였다.