• 제목/요약/키워드: 병렬 방법

검색결과 1,838건 처리시간 0.032초

병렬 프로그램의 적응형 실행 기법 (Adaptive Execution Techniques for Parallel Programs)

  • 이재진
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권8호
    • /
    • pp.421-431
    • /
    • 2004
  • 본 논문은 병렬 프로그램을 실행할 때 계산량이 작은 병렬 루프를 병렬로 실행하는 경우에 생기는 프로그램의 성능 저하를 피하기 위하여, 컴파일 시나 실행 시에 성능 예측 모델을 이용하여 병렬 루프의 성능을 예측한 다음 적응형 실행 기법을 이용하여 병렬 프로그램을 실행하는 방법을 소개한다. 성능예측 알고리즘과 적응형 실행 알고리즘은 컴파일러 전처리기에 구현이 되었으며, 이 전처리기는 병렬 루프가 실행되는 방식을 컴파일 시나 실행 시에 결정하는 코드를 원래의 병렬 프로그램에 삽입한다. Fortran77로 씌어진 다섯 개의 대표적인 과학 수치계산 병렬 벤치마크 프로그램을 32개의 프로세서로 구성된 분산 공유 메모리 병렬 컴퓨터(SGI Origin2000)에 실행하여 본 논문에서 제안한 방법의 성능 평가를 하였을 때, 제안한 기법을 적응한 경우가 32, 16, 8, 및 4개의 프로세서에서 원래의 병렬 프로그램 보다 각각 26%, 20%, 16%, 및 10% 빨리 실행되었다. 이중 한 프로그램은 원래 병렬 프로그램 보다 32개 프로세서에서 두 배 이상 빠르게 실행되었다.

고속 네트웍 기반의 분산병렬시스템에서의 성능 향상 분석 모델 (Speedup Analysis Model for High Speed Network based Distributed Parallel Systems)

  • 김화성
    • 한국통신학회논문지
    • /
    • 제26권12C호
    • /
    • pp.218-224
    • /
    • 2001
  • 분산병렬처리의 목적은 다양한 내재 병렬 형태의 특징을 갖는 연산 집약적 문제를 고속 네트웍으로 연결되어진 다수의 고성능 및 병렬 컴퓨터들의 각기 다른 능력을 최대한 이용하여 해결함에 있다. 본 논문에서는 분산병렬시스템을 이용하는 경우의 성능 향상 분석을 위해 일반적인 그래프 표현 방법을 포함하는 계산 모델을 제안하고 프로그램의 수행을 위한 스케쥴링 시에 성능 향상이 어떠한 요인에 의해 달성되는지를 분석한다. 제안된 표현 방법은 동기종 및 이기종 시스템 모두에 적용되어질 수 있다. 분산병렬 시스템에서 스케줄링을 통하여 더 많은 속도향상을 얻기 위해서는 태스크와 병렬 컴퓨터간의 병렬특성의 일치가 주의 질게 다루어져야 하며 태스크의 이동으로 인한 통신 오버 헤드가 최소화 되어야 한다.

  • PDF

비균일 단일루프에서의 효율적인 루프 분할 방법 (An Efficient Loop Splitting Method on Single Loop with Non-uniform Dependences)

  • 정삼진
    • 한국콘텐츠학회논문지
    • /
    • 제5권4호
    • /
    • pp.204-211
    • /
    • 2005
  • 본 논문은 비균일 단일루프의 병렬성을 향상시키기 위해서 지금까지 개발된 최소 종속 거리 분할 방법, Polychronopoulous 분할 방법, 그리고 최초 종속 분할 방법과 같은 세 가지 루프 분할 방법을 소개하며, 기존의 분할 방법의 문제점들을 제시한다. 그리고, 기존의 세 가지 루프 분할 방법 중에서 가장 효과적인 최초 종속 분할 방법을 확장하여 병렬성을 향상시킨 보다 강력한 루프 분할 방법을 제안한다 제안된 알고리즘은 역 종속성일 경우와 gcd(최대공약수)값이 1보다 클 경우와 같이 최초 종속 분할 방법에서 해결하지 못한 문제점들을 해결하였다.

  • PDF

병렬화를 위한 논리 프로그램의 증명 방법 (A Proof Method of Logic Programs in Parallel Environment)

  • 이원석
    • 한국통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.425-438
    • /
    • 1993
  • 기존의 논리 프로그램을 병렬로 실행하는 방법들은 병렬화의 제약이 되었던 공유 변수들의 생산변수-사용변수의 의존관계로 인해 서술적인 표현력이 강한 논리 언어에 잠재된 병렬성을 살리지 못했다. 이 논문에서는 공유 변수의 의존 관계를 제거하기 위해 논리 프로그램의 실행을 증명 나무의 생성 단계와 사실을 처리하는 두 단계로 분리하는 방법을 제시한다. 첫단계에서는 변수마다 유일한 번호를 붙여 증명 나무에 생성되는 연구들을 변수 수열로 차별화하고, 사실 처리시 각 변수의 값을 차별화된 변수로 구하여 증명 나무의 성공 여부를 확인할 수 있다. 따라서, 생산 변수가 값을 생산한 후 사용 변수가 있는 술어의 처리가 가능했던 기존의 병렬 처리 방식보다 더 높은 병렬성을 이룰 수 있다.

  • PDF

고성능 병렬화일 시스템을 위한 디스크 할당 방법 (A Disk Allocation Scheme for High-Performance Parallel File System)

  • 박기현
    • 한국정보처리학회논문지
    • /
    • 제7권9호
    • /
    • pp.2827-2835
    • /
    • 2000
  • 최근, 멀티미디어 정보처리와 같은 대규모 데이터 처리에 필수적인 입출력 시스템의 성능을 높이기 위하여 많은 관심이 집중되고 있으며, 고성능 병렬화일 시스템에 관한 연구도 이런 노력에 속한다. 본 연구에서는 고성능 병렬화일 시스템을 위한 효율적인 디스크 할당 방법을 제안한다. 즉, 병렬화일의 자료 분산(data declustering)특성을 이용하여 병렬화일에 대한 병렬도 개념을 정의하고, 이를 기반으로 여러 병렬화일들이 동시에 처리되는 경우에, 최대의 작업처리량(throughput)을 얻기 위한 각 병렬화일에 적합한 디스크상의 자료 분산 정도를 계산하는 방법을 제안한다. 또한 동시에 처리되는 병렬화일들이 많이 늘어날수록, 최대의 작업처리량을 얻기 위한 계산이 너무 복잡해지므로, 효율적인 근사 디스크 할당 알고리즘도 아울러 제안한다. 제안된 근사 알고리즘은 계산이 간단하고, 특히 입출력 작업부하(workload)가 높은 환경에서는 매우 효율적임을 보여준다. 또한 입출력 요구들의 도착 비율이 무한대일 경우, 근사 알고리즘만을 이용하여도 최대 작업처리량을 위한 최적 디스크 할당을 얻을 수 있음을 증명하였다.

  • PDF

클러스터 컴퓨팅 환경에서 병렬루프 처리를 위한 재구성 가능한 부하 및 성능 균형 방법 (A Reconfigurable Load and Performance Balancing Scheme for Parallel Loops in a Clustered Computing Environment)

  • 김태형
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권1호
    • /
    • pp.49-56
    • /
    • 2004
  • 부하 불균형은 병렬처리에 있어서 좋은 성능을 얻기 위한 주요한 방해 요소 중의 하나이다. 전역(全域) 부하균형 기법은 하나의 응용에서 발생된 병렬 태스크를 취급하는데 적절하지 않다. 동적 루프 스케줄링 기법은 공유 메모리 멀티프로세서 병렬구조에서 병렬 루프의 부하균형에 효과적인 것으로 알려져있다. 하지만 이 기법의 중앙집중적 특성은 워크스테이션 클러스터 환경에서 프로세서 수가 상대적으로 많지 않은 경우에도 병목현상을 일으킬 수 있는 요인이 된다. 워크스테이션 클러스터 환경에서의 통신 오버헤드는 공유 메모리 멀티프로세서 병렬 구조와 비교할 때 수십배의 차이가 생기기 때문이다. 더구나 병렬 루프에서 발생하는 단위 태스크가 불규칙적인 작업량을 갖는 경우에는 기본 루프 스케줄링 기법의 단점을 보완한 개선된 방법들을 적용할 수가 없다. 본 논문에서는 이러한 불규칙적인 작업량을 갖는 병렬루프를 서로 다른 성능을 갖는 워크스테이션들의 네트워크 환경에서 효율적으로 부하를 분배하기 위한 재구성 가능한 분산 부하 균형 기법을 제시한다. 이러한 재구성 가능한 기법은 전통적인 부하균형 방법과 함께 성능균형을 가능하게 함으로써 전체수행시간을 최소화할 수 있음을 보였다.

Unregulated Power Bus 시스템 적용을 위한 컨버터 모듈화 연구

  • 박성우;장성수;장진백;이상곤
    • 항공우주기술
    • /
    • 제2권1호
    • /
    • pp.89-95
    • /
    • 2003
  • 본 연구에서는 전력 컨버터를 병렬 사용하는 여러 가지 모듈화 방법과 전류제어 방법, 컨버터를 병렬 사용할 경우 발생하는 모듈 간 전류 불균형(current unbalance)의 원인과 해결 방법에 대해서 알아보며, 각각의 모듈화 방법의 장단점과 전류 제어방법의 특성을 해석한다. 기존의 모듈화 및 전류 제어방법에서 unregulated bus 방식을 사용하는 위성의 solar power regulator용 컨버터의 모듈화에 적용 가능한 응용 방법을 검토한다. 마지막으로 적용 가능한 응용방법을 2-병렬 모듈 컨버터에 적용하여 시뮬레이션과 prototype 제작을 통한 실험으로 적용 가능성을 확인한다.

  • PDF

유한체 $GF(2^n)$에서 낮은 공간복잡도를 가지는 새로운 다중 분할 카라슈바 방법의 병렬 처리 곱셈기 (A New Low Complexity Multi-Segment Karatsuba Parallel Multiplier over $GF(2^n)$)

  • 장남수;한동국;정석원;김창한
    • 전자공학회논문지SC
    • /
    • 제41권1호
    • /
    • pp.33-40
    • /
    • 2004
  • 유한체 $GF(2^n)$에서 두 원소의 곱셈을 수행하는 공간 복잡도가 낮은 병렬 처리 곱셈기의 구현에 있어서 divide-and-conquer 방법은 유용하게 사용된다. 이를 이용한 가장 널리 알려진 알고리듬으로는 카라슈바 (Karatsuba-Ofman) 알고리듬과 다중 분할 카라슈바(Multi-Segment Karatsuba) 알고리듬이 있다. Leo ne은 카라슈바 알고리듬의 최적화된 반복 횟수를 제안하였고, Ernst는 다중 분할 카라슈바 방법을 이용한 일반적이고 확장 가능한 유한체 곱셈기를 제안하였다. 본 논문에서는 Ernst가 제시한 다중 분할 카라슈바 병렬 처리 곱셈기의 복잡도를 제시한다. 또한 기존 방법의 병렬 처리 곱셈기와 시간 복잡도는 같지만 공간 복잡도는 낮은 새로운 다중 분할 카라슈바 방법의 병렬 처리 곱셈기를 제안하며 그에 따른 최적화된 반복 횟수를 제안한다. 나아가서 제안하는 곱셈기가 몇몇 유한체에서 카라슈바 방법의 병렬 처리 곱셈기 보다 공간 복잡도에서 효과적임을 제시한다.

다중 공간 조인의 병렬 처리 (Parallel Processing of Multi-Way Spatial Join)

  • 류우석;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.256-268
    • /
    • 2000
  • GIS에서 사용하는 다중 공간 조인은 두 개 이상의 공간 조인이 중첩된 표현이다. 이는 공간 조인에 비해 보다 많은 수행 사간을 필요로 하는데 이를 빠르게 처리하기 위한 병렬화 알고리즘에 대한 연구가 없었다. 이 논문에서는 다중 공간 조인을 다중 공간 여과와 다중 공간 정제로 나누어서 병렬화한다. 그리고, 정제 단계에서 효율적인 정제 수행을 위해 2단계 실행 방법을 제시하는데, 첫번째가 다중 공간 여과의 결과인 후보 객체 테이블에서 발생하는 객체 및 연산의 중복을 제거하기 위한 그래프 생성이고, 두번째가 그래프의 분할에 의한 병렬 정제이다. 그래프에 의한 정제가 그렇지 않은 방법에 비해 매우 높은 성능 향상을 보였으며 병렬 정제를 위한 태스크 생성 방법은 객체를 정점으로 표현하는 그래프에서의 중복 최소화 분할방법이 가장 좋은 성능을 나타내었다.

  • PDF

VR 영상 스티칭을 위한 SIFT 알고리즘에서의 OpenMP 고속화 방법 (High Speed OpenMP Method in SIFT Algorithm for VR Image Stitching)

  • 이용석;강이슬;서영호;김동욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.349-351
    • /
    • 2016
  • 본 논문에서는 VR 영상의 스티칭을 위한 특징점 추출 방식의 하나인 SIFT 알고리즘의 고속화 방법을 제안한다. 이 방법은 SIFT 의 각 단계 모두에 최적화 방법을 적용하여 CPU 에 최적화된 알고리즘을 구축하였다. 그리고 비독립적인 과정들로 이루어진 SIFT 특징점 추출 연산을 병렬화하기 위한 방법으로, 영상 분할 방법을 제시하며 SIFT 의 새로운 병렬화 방법을 제안한다. 특히 최적화 과정을 통해 Scale-space Extrema Detection 과 Orientation Assignment 과정에서 큰 시간 단축 효과를 보여 총 75.5%의 시간을 단축하였다. 이를 OpenMP 와 영상 분할 방법을 활용한 CPU 병렬화로 FullHD($1920{\times}1080$)해상도 영상에서 약 4000 개의 특징점을 추출하는 데 평균 91ms 의 성능을 보이며 기존 GPU 고속화 논문 대비 약 30%의 성능 개선 효과를 보였다.

  • PDF