• Title/Summary/Keyword: openMP

Search Result 178, Processing Time 0.026 seconds

A Performance Analysis on Task Scheduling Mechanisms Using CPU Pinning in OpenMP Based on Xen Virtualization (Xen 가상화 기반 OpenMP 환경에서 물리 CPU 지정에 따른 태스크 스케줄링 기법들의 성능 분석)

  • Song, ChungGeon;Myung, Rohyoung;Choi, HeeSeok;Yu, HeonChang;Lee, EunYoung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.223-226
    • /
    • 2015
  • 최근 클라우드를 지원하는 Xen 가상화 환경에서 HPC를 구현하는 서비스의 수가 증가하고 있다. 따라서 SMP기반의 병렬컴퓨팅 구현을 위한 표준 라이브러리인 OpenMP 연산효율의 중요성이 높아지고 있다. 본 논문에서는 Xen 가상화 기반 OpenMP 환경에서 CPU Pinning 적용 여부에 따라 다양한 태스크 스케줄링의 성능 변화를 측정하기 위한 실험을 수행하였다. 실험결과, CPU Pinning을 적용했을 시정적 스케줄링은 3.7%, 동적 스케줄링은 3.4%, 태스크 지시자 스케줄링은 3.8%의 성능 향상을 보였다. 이러한 결과는 Xen 가상화 환경에서 효율적인 병렬 컴퓨팅 기법 설계를 위한 방향을 제시한다.

Vehicle Headlight Alignment Calibration and Classification Using OpenMP (OpenMP를 이용한 차량 헤드라이트 얼라인먼트 보정 및 분류 방법)

  • Moon, Chang-Bae;Kim, Kun-Hong;Kim, Byeong-Man;Oh, Dukhwan
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.22 no.2
    • /
    • pp.61-70
    • /
    • 2017
  • In This Paper, the Classification Speed of Vehicle Headlight Modules is Improved by a CPU-based Parallel Processing Using OpenMP. Also, a Classification Method of Headlight Modules which Extracts their Features after Revising their Alignment is Proposed. To Analyze the Performance of the Proposed Method, the Discrimination Accuracy and the Processing Speed were Compared with the Method Using Gray Image and the Method Using Line Detection. As the Results of the Analysis, in the Discrimination Accuracy, the Proposed Method and the Line Detection Method Showed good Performance, but the Proposed Method Showed Better Performance than the Line Detection Method by the Processing Speed. Also, the Gray-based Method was the Best in Processing Speed, but the Proposed Method is Better than the Gray-based Method in the Discrimination Accuracy.

High Resolution Depth-map Estimation in Real-time using Efficient Multi-threading (효율적인 멀티 쓰레딩을 이용한 고해상도 깊이지도의 실시간 획득)

  • Cho, Chil-Suk;Jun, Ji-In;Choo, Hyon-Gon;Park, Jong-Il
    • Journal of Broadcast Engineering
    • /
    • v.17 no.6
    • /
    • pp.945-953
    • /
    • 2012
  • A depth map can be obtained by projecting/capturing patterns of stripes using a projector-camera system and analyzing the geometric relationship between the projected patterns and the captured patterns. This is usually called structured light technique. In this paper, we propose a new multi-threading scheme for accelerating a conventional structured light technique. On CPUs and GPUs, multi-threading can be implemented by using OpenMP and CUDA, respectively. However, the problem is that their performance changes according to the computational conditions of partial processes of a structured light technique. In other words, OpenMP (using multiple CPUs) outperformed CUDA (using multiple GPUs) in partial processes such as pattern decoding and depth estimation. In contrast, CUDA outperformed OpenMP in partial processes such as rectification and pattern segmentation. Therefore, we carefully analyze the computational conditions where each outperforms the other and do use the better one in the related conditions. As a result, the proposed method can estimate a depth map in a speed of over 25 fps on $1280{\times}800$ images.

An Efficient Tool for Verifying Races in OpenMP Directive Programs without Interthread Synchronization (스레드 동기화가 없는 OpenMP 디렉티브 프로그램을 위한 효율적인 경합검증 도구)

  • Ha, Ok-Kyoon;Kang, Moon-Hye;Kim, Young-Joo;Jun, Yong-Ki
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.14 no.3
    • /
    • pp.301-305
    • /
    • 2008
  • Races must be detected for debugging OpenMP programs with directives, because they may cause unintended nondeterministic results of programs. Intel Thread Checker, an existing tool that can detects races, can not verify the existence of races and is often time-consuming and tends to require large space. To solve these problems, we developed a tool that verifies the existence of races using user requirements and analyzed model of programs. However, the tool does not have optimal performance in programs which have no synchronization for interthread coordination. This paper presents an optimal tool that applies the optimum labeling and protocol for program models without interthread coordination. For synthetic programs without interthread synchronization, the tool verifies races over 250 times faster than the previous tool on the average, even if the maximum parallelism increases in every case of which the number of total accesses are identical.

Improving the Calculation Speed of Ray-tracing Based Simulator for Analyzing an Integrating Sphere with OpenMP Directive and Guaranteeing the Randomness of Monte Carlo Method (광선추적법 기반의 적분구 분석 시뮬레이터에서 OpenMP 지시어를 이용한 속도 향상 및 몬테카를로 방법의 무작위성 보장)

  • Kim, Seung-Yong;Kim, Dae-Chan;O, Beom-Hoan;Park, Se-Geun;Lee, El-Hang;Lee, Seung-Gol
    • Korean Journal of Optics and Photonics
    • /
    • v.22 no.2
    • /
    • pp.83-89
    • /
    • 2011
  • In order to improve the calculation speed of an integrating-sphere simulator based on a ray-tracing method, parallel processing with OpenMP directive was implemented into the simulator and the randomness of Monte Carlo method was guaranteed by utilizing a parallel random number generator. It was confirmed that simulation results obtained with more than $10^7$ rays showed good agreement with theoretical results within the error range of 0.5%, and that the calculation speed improved as the number of threads increased. Finally, the spatial response distribution functions of a real integrating sphere were simulated and compared with previous results.

High Speed OpenMP Method in SIFT Algorithm for VR Image Stitching (VR 영상 스티칭을 위한 SIFT 알고리즘에서의 OpenMP 고속화 방법)

  • Lee, Yong-Seok;Kang, I-Seul;Seo, Young-Ho;Kim, Dong-Wook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.06a
    • /
    • pp.349-351
    • /
    • 2016
  • 본 논문에서는 VR 영상의 스티칭을 위한 특징점 추출 방식의 하나인 SIFT 알고리즘의 고속화 방법을 제안한다. 이 방법은 SIFT 의 각 단계 모두에 최적화 방법을 적용하여 CPU 에 최적화된 알고리즘을 구축하였다. 그리고 비독립적인 과정들로 이루어진 SIFT 특징점 추출 연산을 병렬화하기 위한 방법으로, 영상 분할 방법을 제시하며 SIFT 의 새로운 병렬화 방법을 제안한다. 특히 최적화 과정을 통해 Scale-space Extrema Detection 과 Orientation Assignment 과정에서 큰 시간 단축 효과를 보여 총 75.5%의 시간을 단축하였다. 이를 OpenMP 와 영상 분할 방법을 활용한 CPU 병렬화로 FullHD($1920{\times}1080$)해상도 영상에서 약 4000 개의 특징점을 추출하는 데 평균 91ms 의 성능을 보이며 기존 GPU 고속화 논문 대비 약 30%의 성능 개선 효과를 보였다.

  • PDF

Automatic Generation of Race Debugging Environment for OpenMP Programs (OpenMP프로그램을 위한 경합디버깅 환경의 자동생성)

  • 강문혜;김영주;전용기
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.601-603
    • /
    • 2002
  • 공유메모리 병렬프로그램에서 경합은 프로그램의 비결정적인 수행을 초래하므로 디버깅을 위해서 반드시 탐지되어져야 한다. 경합을 수행 중에 디버깅하기 위한 기존의 도구들은 경합탐지 엔진과 시각화 엔진으로 구성된 경합디버깅 엔진을 특정 프로그램 모델에 의존적으로 적용하여 경합디버깅 환경을 구성한다. 이러한 도구들은 프로그램 모델의 변경 시에 경합디버깅 환경이 최적의 경합 디버깅 엔진으로 구성되지 못한다는 문제점이 있다. 본 논문에서는 OpenMP 병렬프로그랭에서 각 프로그램 모델에 따라 효과성, 효율성, 확장성 등을 고려한 경합탐지 엔진과 추상성을 고려한 시각화 엔진으로 경합디버깅 환경을 자동으로 생성하는 도구를 제안한다. 이 도구는 디버깅 대상이 되는 프로그램의 모델에 최적인 경합디버깅 엔진을 적용하므로 경합탐지 목적에 부합하는 최적의 성능과 효과적인 시각화를 제공한다. 따라서, 본 도구는 디버깅 환경을 생성하기 위한 부담을 줄여서 효과적인 디버깅을 할 수 있게 한다.

  • PDF

Implementation of FDTD simulation using OpenMP and MPI for semiconductor process (반도체 공정을 위한 OpenMP와 MPI 기반의 FDTD 시뮬레이션 연산 환경 구축)

  • Lee, seung-il;Lee, cheol-hoon
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2015.05a
    • /
    • pp.59-60
    • /
    • 2015
  • 반도체 공정에서는 소자 내부의 물리량 계산을 통해 결점를 검출하는 시뮬레이션을 수행하게 된다. 이를 위해 3차원적 형상을 표현하여 물리적 미분 방정식을 계산하는 유한 차분 시간 영역 알고리즘(Finite-Difference Time-Domain, 이하 FDTD)과 같은 수치해석 기법이 사용된다. 반도체 테스트 범위의 확장으로 인해 시뮬레이션 사이즈 또한 커지고 있는 추세이다. 이에 따라 하나의 프로세서에서 수행할 수 없는 문제가 발생하기도 한다. 이를 해결하기 위해 본 논문에서는 openMP와 MPI를 이용한 하이브리드 컴퓨팅 기법을 바탕으로 다중 GPU 제어를 통해 시뮬레이션 환경을 구축하였으며 정상 동작함을 확인하였다.

  • PDF

제내지 침수해석을 위한 병렬연산기법의 비교

  • Park, Jae-Hong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.296-296
    • /
    • 2017
  • 본 연구에서는 대규모 유역에서 발생하는 침수 현상을 모의하기 위한 강력하고 정확하며 연산효율이 뛰어난 수치해석 모형을 개발하는 데 있다. 개발된 모형은 확산파 모형을 기본으로 하였고 다수의 코어를 동시적으로 해석하는 병렬연산 기법을 부가하였다. 홍수로 인한 대규모 유역에서의 침수해석은 오랜 시간의 연산 비용을 필요로 한다. 특히 수치화된 지형정보의 이용이나 고정밀 사진 측량 등의 방법을 이용하여 정밀하고 넓은 유역의 디지털 지형자료를 이용한 2 차원 침수해석은 연산 연산의 문제를 더욱 어렵게 할 수 있다. 그러므로 본 연구에서는 제내지나 하류 유역에 발생하는 홍수로 발생된 빠른 침수모의를 위해 병렬화된 침수 해석 모형을 이용하여 병렬 해석 모형의 적용성을 검토하고자 하였다. 연구를 위해 MPI 및 OpenMP 기법을 이용하여 2 차원 침수해석 프로그램의 원시코드를 개선하고 실제 제내지 및 실제 댐 하류유역에 적용하였다. 개발된 모형은 실제 제내지에 적용한 결과를 MPI, OpenMP 병렬해석 기법과 기존의 순차적 모형의 결과를 비교하였다. 모형들의 결과를 제내지의 침수양상, 침수 속도벡터의 방향 및 크기 등의 계산 결과 순차적 모형, MPI 및 OpenMP 모형과의 비교하여 연산 시간은 병렬 해석 모형이 우월함을 보였다.

  • PDF

Fast Generation of Digital Hologram Based on Multi-GPU (Multi-GPU 기반의 고속 디지털 홀로그램 생성)

  • Song, Joong-Seok;Park, Jung-Sik;Seo, Young-Ho;Park, Jong-Il
    • Journal of Broadcast Engineering
    • /
    • v.16 no.6
    • /
    • pp.1009-1017
    • /
    • 2011
  • Fast generation of digital hologram is of importance for real-time holography broadcasting. In this paper, we propose such a method that parallelizes the Computer-Generated Holography (CGH) algorithm for digital hologram generation and make it faster using Multi Graphic Processing Unit (Multi-GPU) with help of the Compute Unified Device Architecture (CUDA) and the Open Multi-Processing (OpenMP). In addition, we propose optimization methods such as fixation variable, vectorization, and loop unrolling for making the CGH algorithm much faster. Experimental results show that our method is about 9,700 times faster than a CPU-based one.