• Title/Summary/Keyword: 병렬 구현

Search Result 1,474, Processing Time 0.029 seconds

Implementation and Translation of Major OpenMP Directives for Chip Multiprocessor without using OS (단일 칩 다중 프로세서상에서 운영체제를 사용하지 않은 OpenMP 구현 및 주요 디렉티브 변환)

  • Jeun, Woo-Chul;Ha, Soon-Hoi
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.34 no.4
    • /
    • pp.145-157
    • /
    • 2007
  • OpenMP is an attractive parallel programming model for a chip multiprocessor because there is no standard parallel programming method for a chip multiprocessor and it is easy to write a parallel program in OpenMP. Then, chip multiprocessor systems can have various architectures according to target application programs. So, we need to implement OpenMP in different way for each system. In this paper, we propose the implementation and the effective translation of major OpenMP directives for a chip multiprocessor without using OS to improve the performance without using special hardware and without extending the OpenMP directives. We present the experimental results on our target platform CT3400.

Implementation and Performance Analysis of PC Clusters using Fast PCs& High Speed Network (초고속 네트워크를 이용한 PC 클러스터의 구현과 성능 평가)

  • Kim, Young-Tae;Lee, Yonh-Hee;Choi, Jun-Tae;Oh, Jai-Ho
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.29 no.2
    • /
    • pp.57-64
    • /
    • 2002
  • We implemented two fast PC clusters using fast PCs and high speed network. First. we built the first generation of 16 PC cluster and have used it for real-time operation at Cheju Regional Meteorological Office. Next, we built the second generation of 16PC with dual CUs cluster which was efficiently improved based on performance analysis of the first generation of cluster. In this research we also analyzed performance of two different clusters, which have different CPUs and communication devices using the parallel model MM5 which has been used for the real-time weather forecasting.

Hardware Implementation for MLP Based Text Detection (MLP 기반의 문자 추출을 위한 하드웨어 구현)

  • Kyoung, Dong-Wuk;Jung, Kee-Chul
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.766-771
    • /
    • 2006
  • 현재 많은 신경망의 하드웨어 구현은 부동 소수점 연산에 비해서 적은 면적과 빠른 수행시간을 가지는 고정소수점 연산을 많이 사용하지만, 소프트웨어에서는 일반적으로 높은 정확도를 가지는 부동소수점 연산을 사용한다. 신경망의 하드웨어 구현에서 많이 사용하는 고정소수점 연산은 부동소수점 연산에 비해서 빠른 처리속도와 적은 면적으로써 쉽게 하드웨어 구현에 용이하지만, 부동소수점 연산에 비해서 낮은 정확도와 기존의 부동소수점 연산을 사용하는 소프트웨어 신경망을 쉽게 적용할 수 없는 단점을 가진다. 본 논문에서는 부동소수점 연산을 사용하여 문자 추출 MLP의 데이터 변환 없이 적용할 수 있는 전체 파이프라이닝 설계 구조를 제안한다. 제안된 설계방법은 신경망의 전체 구조를 입력층과 은닉층을 링크 병렬화 방법과 은닉층과 출력층을 뉴런 병렬화 방법을 개선하여 쉽게 파이프라이닝 구조로 설계함으로써 신경망 처리는 은닉층 뉴런수와 동일한 주기로 처리되며, 기존의 문자추출 소프트웨어 신경망을 제안된 하드웨어 설계방법으로 구현하였을 때 11배의 빠른 성능을 나타낸다.

  • PDF

An implementation of parallel search system based on MPI Middleware (MPI 미들웨어에 기반한 병렬검색 시스템 구현)

  • 이정훈;강미경
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.52-54
    • /
    • 2003
  • 본 논문은 MPI 미들웨어에 기반하여 데이터베이스에 포함되어 웹에 의해 제공되는 정보들을 고속으로 검색할 수 있는 분산 병렬 검색 시스템을 구현한다. 지리적으로 산재한 막대한 양의 정보를 다루어야 히는 생물정보 분야 응용의 요구에 부합하기 위하여, LINUX를 탑재한 3 대의 PC로 구성된 클러스터를 구축하고 CGI 구동 프로그램, 마스터와 슬레이브로 구성된 MPI 프로세스를 구현하였으며 메시지 큐. MPI 프리미티브. HTTP 1.1 프로토콜에 의해 서로 통신한다. 마스터는 CGI의 요청에 따라 슬레이브에게 명령을 내려 동시에 해당 웹 페이지에 대한 검색을 수행하며 이를 통합하여 CGI에게 전달한다. 마스터는 다수의 CGI 요청들을 직렬화할 뿐 아니라 슬레이브들과의 동기화에 의해 최종적인 검색 결과를 수행한다. 본 논문에서 구현된 클러스터는 특정 어댑터의 추가 구현에 의해 새로운 데이터베이스에 대한 검색 기능을 추가할 수 있으며 동일한 운영체제와 미들웨어를 갖는 노드를 추가함으로써 협력 검색에 있어서 보다 많은 컴퓨터를 참여시킬 수 있다.

  • PDF

Design and Implementation of Real-Time Parallel Engine for Discrete Event Wargame Simulation (이산사건 워게임 시뮬레이션을 위한 실시간 병렬 엔진의 설계 및 구현)

  • Kim, Jin-Soo;Kim, Dae-Seog;Kim, Jung-Guk;Ryu, Keun-Ho
    • The KIPS Transactions:PartA
    • /
    • v.10A no.2
    • /
    • pp.111-122
    • /
    • 2003
  • Military wargame simulation models must support the HLA in order to facilitate interoperability with other simulations, and using parallel simulation engines offer efficiency in reducing system overhead generated by propelling interoperability. However, legacy military simulation model engines process events using sequential event-driven method. This is due to problems generated by parallel processing such as synchronous reference to global data domains. Additionally. using legacy simulation platforms result in insufficient utilization of multiple CPUs even if a multiple CPU system is under use. Therefore, in this paper, we propose conversing the simulation engine to an object model-based parallel simulation engine to ensure military wargame model's improved system processing capability, synchronous reference to global data domains, external simulation time processing, and the sequence of parallel-processed events during a crash recovery. The converted parallel simulation engine is designed and implemented to enable parallel execution on a multiple CPU system (SMP).

An Optimizing Compiler for VLIW Microcontrollers (VLIW형 마이크로컨트롤러를 위한 최적화 컴파일러의 구현)

  • 홍승표;문수묵
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.759-761
    • /
    • 1998
  • 90년대 중반 이후 고성능의 프로세서들은 성능 향상을 위해 명령어 수준의 병렬성을 이용하고 있다. 특히 실행화일의 호환성을 고려할 필요가 없는 마이크로컨트롤에서는 같은 하드웨어로 더 많은 함수유닛을 가질 수 있는 VLIW 구조가 널리 사용된다. 이러한 VLIW형의 마이크로컨트롤러에서는 병렬성을 추출하는 역할이 전적으로 소프트웨어에 있으므로 컴파일어가 성능향상에 매우 큰 영향을 미치게 된다. 본 논문에서는 마이크로컨트롤러의 구조와 그룹짓기 조건을 분석하고 선택 스케쥴링과 소프트웨어 파이프라이닝을 이용한 VLIW형 마이크로컨트롤러용 최적화 컴파일러를 구현하고 그 성능을 측정한다.

  • PDF

Performance Analysis of a Sonar Signal Processing System using TMS320C40 (TMS320C40을 이용한 소나 신호처리시스템의 성능분석)

  • 박광철;문병표;전창호;박성주;이동호
    • Proceedings of the IEEK Conference
    • /
    • 1998.06a
    • /
    • pp.643-646
    • /
    • 1998
  • 소나 시스템과 같이 방대한 양의 연산을 요구하는 고속 신호처리기를 구현하기 위해서는 상용 DSP 칩의 병렬 처리방법은 필요 불가결하다. 본 논문에서는 TI사의 TMS320C40을 이용한 병렬 신호 처리 시스템을 소개한다. TI사의 TMS320C40을 이용한 소나 시스템 신호처리부의 기본 모델을 제시하고, TI에서 제공하는 FFT구현 소스의 분석을 통한 연산의 수학적인 모델을 제시하고 이를 근거로 제안된 모델의 성능을 분석하였다.

  • PDF

Design and Overhead Analysis of A Parallel MPEG-2 Encoder using Web Computing (웹컴퓨팅을 이용한 병렬 분산 MPEG-2 인코더의 설계 및 오버헤드 분석)

  • 석종인;장주욱
    • Proceedings of the IEEK Conference
    • /
    • 1999.06a
    • /
    • pp.411-416
    • /
    • 1999
  • 소프트웨어로 실시간 구현이 어려운 MPEG-1, MPEG-2 인코딩을 LAN이나 전용선에서 클러스터 컴퓨터나 병렬 처리로 구현한 연구가 있어 왔다. 네트워크의 대역폭이 증가하고 라우터가 고속화됨에 따라 본 논문에서는 MPEG-2인코딩을 WAN으로 확장하는 기법을 제안하고 실험을 통하여 속도 개선 효과를 입증하였다.

  • PDF

Serial Algorithm for D-Class computation with an Improved Inner Loop on the Linux Platform (내부 순환문 개선을 통한 Linux 기반의 D-클래스 계산 고효율 순차 알고리즘)

  • Shin, Chul-Gyu;Han, Jae-Il
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2005.05a
    • /
    • pp.526-531
    • /
    • 2005
  • D-클래스는 보안에 응용될 수 있는 가능성을 가지고 있으나 D-클래스의 계산은 NP-완전문제로서 행렬크기 증가에 의한 연산 량 증가 문제 해결을 위해 병렬 컴퓨팅 환경에서의 병렬 알고리즘 설계 및 구현이 필요하다. 본 논문은 그리드 컴퓨팅 환경에서의 D-클래스 계산을 위해 Globus 가 설치된 클러스터를 구축하고. MPICH를 이용 효율적인 D-클래스 계산 알고리즘을 설계 및 구현, 실행 결과 그리고 연산 량을 줄일 수 있는 수식 연구와 연구한 수식에 기반한 순차 알고리즘을 논한다.

  • PDF

AspectHPJ: Aspect-Oriented Parallel Programming Model in Java (AspectHPJ: 자바기반의 관심 지향적 병렬 프로그래밍 모델)

  • Kim, Myoung-Jin;Lee, Han-Ku;Lee, Dong-Keun;Lee, Won-Sa
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06b
    • /
    • pp.531-535
    • /
    • 2008
  • 최근의 융합학문의 발전으로 생물, 물리, 화학, 천문, 우주학, 지구과학 분야에서도 병렬 프로그램을 이용한 대용량 데이터를 처리하는 빈도가 높아졌다. 그러나 병렬 프로그래밍은 병렬환경의 전문성을 가지고 있지 않는 다른 학문의 전문가가 사용하기는 어려운 것이 현실이다. 이에 본 논문에서는 병렬환경의 비전문가도 사용하기 용이한 관심 지향적 병렬 프로그래밍 모델과 자바 기반으로 구현된 AspectHPJ 시스템을 제안한다. 본 시스템의 첫 번째 특징은 일반사용자가 Sequential 코드로 프로그램을 작성하고 병렬화 하고자 하는 코드영역에 병렬마크를 사용하여 병렬코드로 전환하는 특징을 가지고 있다. 두 번째는 병렬환경 요소 (프로세서 개수, 분산배열 속성)를 AOP 개념의 관심 (aspect)으로 추출하여 사용자가 보다 용이하게 병렬환경 요소를 설정할 수 있게 해주는데 있다.

  • PDF