• 제목/요약/키워드: Parallel Programs

검색결과 217건 처리시간 0.027초

데이타 배열을 사용하는 병렬 프로그램에서 그레인 크기를 이용한 데이타 선인출 기법 (A Data Prefetching Scheme Exploiting the Grain Size in Parallel Programs using Data Arrays)

  • 정인범;이준원
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권1호
    • /
    • pp.101-108
    • /
    • 2000
  • 데이타 선인출 방법은 데이타 참조와 프로세서 계산의 중첩을 이용하여 주메모리 접근 지연시간을 줄여주는 효과적인 방법이다. 그러나 선인출된 데이타가 캐쉬 메모리에 있는 다른 유용한 데이타들을 대체시키거나 또한 선인출된 데이타가 사용되지 않는 무익한 선인출일 경우 프로그램의 성능은 저하된다. 이러한 현상은 향후 사용되는 데이타들에 대한 정확한 예측이 부족하므로 발생된다. 병렬 프로그램이 계산을 위하여 데이타 배열들을 사용할 때 그레인 크기는 향후 사용되는 데이타 지역의 범위를 나타내므로 데이타 선인출을 위한 유용한 정보이다. 이런 정보를 기반으로 본 논문에서는 병렬 프로그램의 그레인 크기를 이용한 새로운 데이타 선인출 방법을 제안한다. 모의시험에서 제안된 선인출 방법은 기존의 선인출 방법들보다 버스 트랜잭션을 감소시킬 뿐만 아니라 유용한 선인출의 증가로 시험된 병렬 프로그램들의 성능을 향상시킨다.

  • PDF

그래픽 사용자 인터페이스를 이용한 병렬 프로그래밍 환경 설계 및 구현 (A Design and Implementation of Parallel Programming Environment using Graphical User Interface)

  • 이원용;박두순
    • 한국멀티미디어학회논문지
    • /
    • 제4권6호
    • /
    • pp.579-587
    • /
    • 2001
  • 본 논문은 그래픽 사용자 인터페이스를 이용하여 병렬 프로그래밍 환경을 설계하고 구현하였다. 병렬 프로그램은 다양한 하드웨어의 특성에 따라 또는 프로그램의 특성에 따라 사용자가 병렬 프로그램을 작성하여야 하기 때문에 사용자가 병렬 프로그램을 작성하는 것은 매우 어렵다. 본 논문에서는 이런 문제를 도와주기 위하여 기존의 병렬 컴파일러에서 제공되고 있는 텍스트 위주의 병렬화 정보 대신에 그래픽 사용자 인터페이스를 이용하여 편안하고 쉽게 병렬화 정보를 제공하는 병렬 프로그래밍 환경을 제안하고, 구현하였다. 본 논문의 병렬 프로그래밍 환경은 종속성 분석, CFG, HTG, 루프 병렬화 등의 기능을 제공한다.

  • PDF

Performance Comparison of Parallel Programming Frameworks in Digital Image Transformation

  • Shin, Woochang
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제11권3호
    • /
    • pp.1-7
    • /
    • 2019
  • Previously, parallel computing was mainly used in areas requiring high computing performance, but nowadays, multicore CPUs and GPUs have become widespread, and parallel programming advantages can be obtained even in a PC environment. Various parallel programming frameworks using multicore CPUs such as OpenMP and PPL have been announced. Nvidia and AMD have developed parallel programming platforms and APIs for program developers to take advantage of multicore GPUs on their graphics cards. In this paper, we develop digital image transformation programs that runs on each of the major parallel programming frameworks, and measure the execution time. We analyze the characteristics of each framework through the execution time comparison. Also a constant K indicating the ratio of program execution time between different parallel computing environments is presented. Using this, it is possible to predict rough execution time without implementing a parallel program.

A Study on the Automatic Parallelization Method and Tool Development

  • Shin, Woochang
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제12권3호
    • /
    • pp.87-94
    • /
    • 2020
  • Recently, computer hardware is evolving toward increasing the number of computing cores, not increasing the clock speed. In order to use the performance of parallelized hardware to the maximum, the running program must also be parallelized. However, software developers are accustomed to sequential programs, and in most cases, write programs that operate sequentially. They also have a lot of difficulty designing and developing software in parallel. We propose a method to automatically convert a sequential C/C++ program into a parallelized program, and develop a parallelization tool that supports it. It supports open multiprocessing (OpenMP) and parallel patterns library (PPL) as a parallel framework. Perfect automatic parallelization is difficult due to dynamic features such as pointer operation and polymorphism in C/C++ language. This study focuses on verifying the conditions of parallelization rather than focusing on fully automatic parallelization, and providing advice to developers in detail if parallelization is not possible.

Design and Implementation of a Massively Parallel Multithreaded Architecture: DAVRID

  • Sangho Ha;Kim, Junghwan;Park, Eunha;Yoonhee Hah;Sangyong Han;Daejoon Hwang;Kim, Heunghwan;Seungho Cho
    • Journal of Electrical Engineering and information Science
    • /
    • 제1권2호
    • /
    • pp.15-26
    • /
    • 1996
  • MPAs(Massively Parallel Architectures) should address two fundamental issues for scalability: synchronization and communication latency. Dataflow architecture faces problems of excessive synchronization overhead and inefficient execution of sequential programs while they offer the ability to exploit massive parallelism inherent in programs. In contrast, MPAs based on von Neumann computational model may suffer from inefficient synchronization mechanism and communication latency. DAVRID (DAtaflow/Von Neumann RISC hybrID) is a massively parallel multithreaded architecture which takes advantages of von Neumann and dataflow models. It has good single thread performance as well as tolerates synchronization and communication latency. In this paper, we describe the DAVRID architecture in detail and evaluate its performance through simulation runs over several benchmarks.

  • PDF

MPI 병렬 프로그램의 순환 디버깅을 위한 인과관계 재실행 (Causal Replay for Cyclic Debugging of MPI Parallel Programs)

  • 홍철의;김영준
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권9호
    • /
    • pp.424-433
    • /
    • 2001
  • 메세지 전달 병렬 프로그램은 프로세스 사이의 메세지 경합에 의하여 실행의 비결정성이 발생하여 순차 프로그램에서 널리 사용되는 순환 디버깅 기법을 사용하기 어렵다. 본 논무은 MPI 병렬 프로그램에서 비결정적 실행에 영향을 미치는 메세지 전달 사건을 정의한 후, 기본실행에서의 사건의 발생순서가 다음의 재실행시 똑 같이 유지되도록 병행실행을 순차생행으로 변환하여 결정적 재실행을 보장함으로써 실행시 마다 같은 오류가 재현되도록 한다. 또한 MPI 병렬 프로그램의 디버깅을 보다 쉽게 하기 위하여 임의의 프로세스를 정짓켰을 때, 다른 모든 프로세스는 정지점 이전에 발생한 모든 사건을 반영하는 최초의 상태에 정지하게 하는 인과관계 정지점을 구현한다. 따라서 인과관계 재실행 기법을 이용하여 병렬 프로그램에서도 순차 프로그램 환경에서와 같이 순환 디버깅 기법을 사용할 수 있게 한다.

  • PDF

A Study on Distributed System Construction and Numerical Calculation Using Raspberry Pi

  • Ko, Young-ho;Heo, Gyu-Seong;Lee, Sang-Hyun
    • International journal of advanced smart convergence
    • /
    • 제8권4호
    • /
    • pp.194-199
    • /
    • 2019
  • As the performance of the system increases, more parallelized data is being processed than single processing of data. Today's cpu structure has been developed to leverage multicore, and hence data processing methods are being developed to enable parallel processing. In recent years desktop cpu has increased multicore, data is growing exponentially, and there is also a growing need for data processing as artificial intelligence develops. This neural network of artificial intelligence consists of a matrix, making it advantageous for parallel processing. This paper aims to speed up the processing of the system by using raspberrypi to implement the cluster building and parallel processing system against the backdrop of the foregoing discussion. Raspberrypi is a credit card-sized single computer made by the raspberrypi Foundation in England, developed for education in schools and developing countries. It is cheap and easy to get the information you need because many people use it. Distributed processing systems should be supported by programs that connected multiple computers in parallel and operate on a built-in system. RaspberryPi is connected to switchhub, each connected raspberrypi communicates using the internal network, and internally implements parallel processing using the Message Passing Interface (MPI). Parallel processing programs can be programmed in python and can also use C or Fortran. The system was tested for parallel processing as a result of multiplying the two-dimensional arrangement of 10000 size by 0.1. Tests have shown a reduction in computational time and that parallelism can be reduced to the maximum number of cores in the system. The systems in this paper are manufactured on a Linux-based single computer and are thought to require testing on systems in different environments.

병렬 모집단 진화프로그램을 이용한 강의시간표 작성에 관한 연구 (A Study on the Timetable Using Parallel Population Evolution Programs)

  • 박유석;김병재
    • 산업경영시스템학회지
    • /
    • 제22권52호
    • /
    • pp.275-284
    • /
    • 1999
  • The TTP(TimeTabling Problem) for a university which should be made every term is very difficult problem to schedule because each component must satisfy all fixed constraints. This TTP, therefore, is solved by several heuristic methods. In this paper, applying PPEP(Parallel Population Evolution Programs) for the TTP, we try to find the approximated optimal solution by maintaining independence of each subpopulation and by searching the wide feasible solution. In addition, we present the problem to be appeared when used PMX(Partially mapped crossover)operator for the long chromosomes and then propose GBX (Gene_Based crossover)operator which can complement it. Finally, experimental results are presented comparing EP(Evolution Programs) and PPEP, then GBX which has the random genes and the selected genes on a real TTP.

  • PDF

PERFORMANCE OF A KNIGHT TOUR PARALLEL ALGORITHM ON MULTI-CORE SYSTEM USING OPENMP

  • VIJAYAKUMAR SANGAMESVARAPPA;VIDYAATHULASIRAMAN
    • Journal of applied mathematics & informatics
    • /
    • 제41권6호
    • /
    • pp.1317-1326
    • /
    • 2023
  • Today's computers, desktops and laptops were build with multi-core architecture. Developing and running serial programs in this multi-core architecture fritters away the resources and time. Parallel programming is the only solution for proper utilization of resources available in the modern computers. The major challenge in the multi-core environment is the designing of parallel algorithm and performance analysis. This paper describes the design and performance analysis of parallel algorithm by taking the Knight Tour problem as an example using OpenMP interface. Comparison has been made with performance of serial and parallel algorithm. The comparison shows that the proposed parallel algorithm achieves good performance compared to serial algorithm.

한국형 일학습병행제 대학 계약학과의 NCS기반 표준운영모델 개발 및 적용 (Development and Application of a NCS-based Reference Operation Model for Contract Departments of the Korean Work-and-Study Parallel Colleges)

  • 강기호;김의정;엄기용
    • 실천공학교육논문지
    • /
    • 제11권1호
    • /
    • pp.61-73
    • /
    • 2019
  • 국내 평생직업능력개발 체계는 국가직무능력표준(NCS: National Competency Standards)을 중심으로 변화를 추진 중이다. NCS 중심의 직업훈련 체계가 성공적으로 정착하고 제 기능을 발휘하기 위해서는 고등교육의 중심인 4년제 대학에도 잘 적용되어야 한다. 그러나 4년제 대학의 경우 교과과정의 현장성 부재 문제가 지속적으로 제기되어 있고, 새롭게 출범한 대학연계형 일학습병행제 계약학과는 NCS기반의 자격을 교육과정의 중심에 두고 운영하도록 되어 있으나, 한국 기업의 현실을 고려한 표준모델의 부재로 인해 대학들이 신규 가입을 주저하고 있는 실정이다. 본 논문에서는 현재 운영 중인 코리아텍 일학습병행대학을 연구대상으로 하여 NCS기반 자격과 연계된 한국형 일학습병행대학의 표준모델을 개발하고, 이를 코리아텍 일학습병행대학 내 "기계설계공학과"에 실제 적용한 사례를 보인다. 또한 NCS기반 일학습병행대학 표준모델의 성공적 확산에 요구되는 다양한 시행방안을 관련 법 제도의 틀 안에서 도출하여 제시한다. 이러한 결과는 한국형 일학습병행대학의 확산을 촉진하고, 대학 및 기업의 참여동기를 제고하며, 궁극적으로는 NCS기반 일학습병행대학들이 평생직업능력개발의 한 축을 담당하는 데 크게 기여할 것으로 기대된다.