• 제목/요약/키워드: openMP

검색결과 178건 처리시간 0.028초

멀티 스레딩 기반 병렬 프로그램의 효과적인 디버깅을 위한 추상적 시각화 (Abstract Visualization for Effective Debugging of Parallel Programs Based on Multi-threading)

  • 김영주
    • 한국정보통신학회논문지
    • /
    • 제20권3호
    • /
    • pp.549-557
    • /
    • 2016
  • 효과적인 시각화는 일반적으로 대용량의 디버깅 정보와 프로그램의 추상적 수행모델을 표현하는 것이 중요하다. 본 논문에서는 스레드들간의 논리적 병행성 관계를 나타내는 부분순서 수행그래프를 이용하여 내포병렬성과 임계구역을 가진 OpenMP 병렬 프로그램의 수행양상과 경합정보의 효과적 디버깅을 위해서 효과적으로 제공하는 추상적 시각화 도구를 제안한다. 본 도구는 수행중 추적선택 기법으로 시각화 정보를 위한 공간적 복잡성을 줄이고, 추적된 시각화 정보에 프로그램의 내포병렬성과 임계구역 동기화를 위한 그래프 추상화를 제공하여 시각적 복잡성을 해결한다. 그래프 추상화를 통한 스레드들간의 부분순서 관계와 경합탐지 정보는 프로그램의 제어흐름과 경합의 위치를 구조적으로 파악할 수 있게 하므로 프로그램 수행의 이해와 경합 탐지 및 수정에 효과적이다.

그래픽 프로세서를 이용한 병렬연산 기반 해무 제거 고속화 (Acceleration for Removing Sea-fog using Graphic Processors and Parallel Processing)

  • 김영두;곽재민;서영호;최현준
    • 한국항행학회논문지
    • /
    • 제21권5호
    • /
    • pp.485-490
    • /
    • 2017
  • 본 논문에서는 그래픽 프로세서를 이용하여 고속으로 해무를 제거하는 기술을 제안한다. 이 기술은 호스트 프로세서(CPU)와 병렬처리가 가능한 여러 개의 그래픽 프로세서를 이용하여 입력영상에서 해무를 제거하는 것이다. 해무를 제거하는 과정 중에서 다크 채널 추출, 최대 밝기 채널 추출, 전달량 계산은 호스트 프로세서에서 수행하고, 양방향 필터를 적용하여 전달량을 정제하는 과정을 그래픽 프로세서를 기반으로 병렬처리하여 연산속도를 높였다. 제안한 병렬처리 기법의 검증을 위해 NVIDIA사의 GTX 1070 GPU를 3개를 사용하여 검증환경을 구성하였다. 구현결과 하나의 그래픽 프로세서로 구현하였을 때는 평균 140ms가 소요되고, OpenMP와 다중 GPGPU를 이용하여 구현하였을 때 26ms 소요되었다. 본 논문에서 제안하는 그래픽 프로세서 기반의 병렬연산 해무제거 기술은 선박의 안전항해, 항만 관제 분야에 사용될 수 있을 것이다.

멀티코어 CPU를 갖는 공유 메모리 구조의 대규모 병렬 유한요소 코드에 대한 설계 고려 사항 (Design Considerations on Large-scale Parallel Finite Element Code in Shared Memory Architecture with Multi-Core CPU)

  • 조정래;조근희
    • 한국전산구조공학회논문집
    • /
    • 제30권2호
    • /
    • pp.127-135
    • /
    • 2017
  • 멀티코어 CPU와 BLAS, LAPACK을 구현한 최적 수치라이브러리, 직접 희소 솔버의 대중화 등 PC나 워크스테이션 수준에서도 대규모 유한요소 모델을 해석할 수 있도록 컴퓨팅 환경이 급속도로 변화되었다. 이 논문에서는 멀티코어 CPU를 갖는 공유 메모리 구조에 대한 병렬 유한요소 프로그램 설계시 고려사항으로 (1) 최적화된 수치라이브러리의 사용, (2) 최신 직접 희소 솔버의 사용, (3) OpenMP를 이용한 병렬 요소 강성 행렬의 계산, (4) 희소행렬 저장방식의 일종인 triplet을 이용한 어셈블 기법 등을 제시하였다. 또한 대규모 수치모델을 통해 많은 시간이 소요되는 작업을 기준으로 병렬화 효과를 검토하였다.

신속한 오염사고 대응을 위한 입자 분산 모형의 속도 개선 및 평가 (Particle Dispersion Model Speed Improvement and Evaluation for Quick Reaction to Pollutant Accidents)

  • 신재현;성호제;박인환;이동섭
    • 한국콘텐츠학회논문지
    • /
    • 제20권12호
    • /
    • pp.537-546
    • /
    • 2020
  • 본 연구에서는 오염물 사고에 대한 신속한 대응을 위하여 입자 분산 모형을 개발 및 개선하고 병렬 프로그램을 적용한 모의 속도 증가와 그 분석을 통하여 속도개선 결과를 평가하였다. 개발된 모형은 전단류 분산이론을 따르면서 수평 혼합 과정은 전단이송, 연직 혼합 과정은 연직배열 알고리즘을 이용한 난류 및 입자 확산을 구현하였다. 오염사고에 신속하게 대응하기 위해 모형 속도 개선을 위하여 OpenMP를 활용한 병렬 프로그래밍으로 멀티코어 적용 알고리즘을 적용하였다. 병렬 프로그래밍 적용 결과, 가상 사행수로에서 기준 소요시간 내로 모의가 가능한 입자 및 활용 코어 개수의 관계를 도출할 수 있었다. 이 연구 결과로 신속한 수질 오염사고 사고대응을 위한 적절한 모의 조건을 구성할 수 있게 되어 모형의 활용성을 증대할 수 있었다.

열린사슬운동과 닫힌사슬운동이 큰가슴근과 위팔세갈래근의 근활성도에 미치는 영향 (The Effect of Open and Close Kinetic Chain Exercise on the Muscle Activity of Pectoralis Major and Triceps)

  • 김주오;장상훈
    • 대한물리치료과학회지
    • /
    • 제25권1호
    • /
    • pp.52-61
    • /
    • 2018
  • Background: The purpose of this study was to investigate the effect of open and close kinetic chain exercise on the muscle activity of pectoralis major and triceps. Method: Twenty healthy male college students were assessed three times over two weeks. The participants were randomly assigned to OKCE(Open Kinetic Chain Exercise) and CKCE(Close Kinetic Chain Exercise). On the first day, the 7th day and the last day, The MP(mean power) and PT(peak torque) of the PM(pectoralis major) and TR(triceps) during the exercise were measured with an electromyography device and the study was compared. Result: In the present study, it was found that Statistical analysis of the measured values at the end of experimental period revealed statistically significant differences in the MP and PT values of TR and PM. Conclusion: These findings suggest that CKCE and OKCE may be an effective physical therapy intervention for strengthening muscular activity in patients with low activity in the upper limb, including normal subjects, although it is not suitable for effective exercise by selecting either CKCE or OKCE.

CUDA 연산을 이용한 개선된 영상 매칭 방법에 관한 연구 (A Study on Improved Image Matching Method using the CUDA Computing)

  • 조경래;박병준;윤태복
    • 한국산학기술학회논문지
    • /
    • 제16권4호
    • /
    • pp.2749-2756
    • /
    • 2015
  • 최근 데이터의 질이 높아짐에 따라 영상을 처리하는데 많은 시간이 소모되는 문제가 제기되어 영상 처리 알고리즘의 가속화가 필요하게 됨으로써, 기존의 CPU와 CUDA(Compute Unified Device Architecture) 기반의 인식 시스템에서 연산속도와 성능이득 비교를 위해 OpenMP를 가지고 측정할 수 있는 문자 인식시스템으로 학습된 문자데이터가 입력되면 매칭이 가장 잘 되는 영상의 영역을 인식하는 환경으로 구현하여 각 영문 알파벳의 글씨체가 일정하고 크기가 규격화 되어 있으므로 문자를 학습하고 문자 정합도를 계산하기 위한 영상 매칭 방법을 구현하게 되었다. GPGPU(General Purpose GPU)프로그래밍 플랫폼 기술인 CUDA연산 기법을 이용하여 알고리즘을 빠르고 효율적으로 처리하는 OpenMP에서 인텔 i5 2500의 네 개의 코어를 사용하여 인식 할 때, 기존 CPU의 성능보다 4배의 속도가 나오지 않고 데이터의 분할과 병합 연산의 지연으로 인해 약 3.2배의 속도로 향상되는 가속화 방법을 제안하고 그래픽카드에서 처리하는 병렬처리 결과, 순차적 연산을 수행하였던 CPU 기반의 처리에 비해 성능이득이 약 21X(배)로 향상됨을 확인하였다.

대용량 위성영상의 무감독 분류를 위한 K-means 군집화 알고리즘의 병렬처리 (Parallel Processing of K-means Clustering Algorithm for Unsupervised Classification of Large Satellite Imagery)

  • 한수희
    • 한국측량학회지
    • /
    • 제35권3호
    • /
    • pp.187-194
    • /
    • 2017
  • 본 연구는 대용량 위성영상의 신속한 무감독 분류를 위해 k-means 군집화 알고리즘을 병렬처리하는 방법을 소개한다. K-means 군집화 알고리즘은 대표적인 무감독분류 알고리즘으로서 주로 감독분류의 전처리 단계로 활용되지만 연산 집약적이고 사용자의 개입이 적어 병렬처리의 효과를 분명하게 나타낼 수 있다. 병렬처리 코드는 OpenMP 기반의 멀티쓰레딩을 이용하여 구현하였다. 실험은 1대의 PC에서 시행하였으며 이 PC의 CPU에는 8개의 멀티코어가 집적되어 있다. 실험 영상으로는 7개 밴드로 구성한 30m 해상도의 LANDSAT 8 OLI 영상과 8개 밴드로 구성한 10m 해상도의 Sentinel-2A 영상을 사용하였다. 각각 10개 군집을 사용하여 순차처리 및 병렬처리를 수행한 결과 병렬처리가 순차처리에 비해 6배 내외의 속도를 나타내었다. 순차처리와 병렬처리 결과의 일치성 평가를 위해 각 군집의 중심값과 분류된 화소의 수를 비교하고 분류 결과 영상간 차분을 수행하였고 결과로 모든 정보가 일치하였다. 본 연구는 병렬처리를 통해 대용량 위성영상의 처리 속도를 상당히 향상시킬 수 있음을 입증하고 있다는 점에서 의미가 있다고 판단된다. 아울러 OpenMP 기반의 멀티쓰레드를 이용하면 비교적 쉽게 병렬처리를 구현할 수 있지만 false sharing의 발생을 억제하도록 코드를 설계하는데 주의를 기울여야 함도 확인할 수 있었다.

범용 그래픽스 하드웨어 기반 여과후 역투사 최적화 기법에 관한 연구 (An Optimized GPU based Filtered Backprojection method)

  • 박종현;이병훈;이호;신영길
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.436-442
    • /
    • 2009
  • 삼차원 재구성 기법은 대상을 파괴하지 않고도 그 내부 구조의 공간적 해석을 가능하게 해주는 단층 영상을 생성해주기 때문에, 산업, 의료분야에서 널리 사용되고 있다. 최근 영상 장비의 성능 향상으로 고해상도의 CT 영상을 얻을 수 있게 되었으나, 대용량 데이터를 재구성하기 위해 많은 시간이 소요된다. 본 논문에서는 재구성에서 가장 많은 시간이 소요되는 여과와 역투사 과정을 범용 그래픽스 하드웨어를 사용하여 최적화하는 방법을 제안한다. 여과에서는 네 장의 영상을 압축하여 동시에 처리하는 기법을 적용하고, 역투사 과정에서는 깊이 테스트를 이용하여 계산량을 줄이는 방법을 사용한다. 제안된 방법으로 구현된 GPU 기반 프로그램은 OpenMP 를 사용하여 최적화 된 CPU 기반 프로그램에 비해 약 50 배 이상 속도가 향상되었다.

  • PDF

NUMA구조를 가진 고성능 컴퓨팅 시스템에서의 메쉬 재배열의 라플라시안 스무딩에 대한 효과 (The Effect of Mesh Reordering on Laplacian Smoothing for Nonuniform Memory Access Architecture-based High Performance Computing Systems)

  • 김지범
    • 전자공학회논문지
    • /
    • 제51권3호
    • /
    • pp.82-88
    • /
    • 2014
  • 우리는 고성능 컴퓨팅 (high performance computing) 시스템에서 메쉬 재배열이 라플라시안 스무딩에 대해서 어떠한 효과가 있는지 연구한다. 구체적으로, 우리는 nonuniform memory access (NUMA) 구조의 고성능 컴퓨팅 시스템에서 Reverse-Cuthill Mckee 알고리즘을 사용하여 메쉬를 재배열하고 메쉬질을 높이기 위하여 라플라시안 스무딩을 사용한다. 먼저 하나의 코어를 사용하여 메쉬 재배열의 라플라시안 스무딩에 대한 속도 향상을 조사한 후에 NUMA구조의 멀티코어 시스템에서 OpenMP를 이용하여 병렬화할 경우 메쉬 재배열의 라플라시안 스무딩에 대한 속도 향상에 대하여 조사한다.