• 제목/요약/키워드: Multiprocessors system

검색결과 30건 처리시간 0.027초

다중프로그래밍 공유메모리 다중프로세서 시스템을 위한 퍼지 기반 프로세서 할당 기법 (Fuzzy-based Processor Allocation Strategy for Multiprogrammed Shared-Memory Multiprocessors)

  • 김진일;이상구
    • 한국지능시스템학회논문지
    • /
    • 제10권5호
    • /
    • pp.409-416
    • /
    • 2000
  • 공유메모리 다중프로세서 시스템은 전체적인 시스템 이용률을 높이기 위하여 병렬 작업시 시분할(time-sharing), 공간분할(space-sharing), 갱스케줄링과 같은 프로세서 자원 공유 기법을 사용한다. 최근에는 주어진 작업의 병렬 코드 부분의 실행을 위해서 시스템 작업부하를 기준으로 프로세서의 수를 동적으로 조절하는 루프단계 프로세스 제어(LLPC)할당 기법이 제안되었다. 이 기법은 작업에 가능한 많은 프로세서를 할당하기 때문에, 나중에 도착하는 작업의 병렬부분을 수행해야 할 프로세서를 남겨 두지 않는다. 이러한 문제를 해결하기 위해, 본 논문에서는 작업부하량, 작업수행예상시간, 프로세스의 수를 퍼지화하여 시스템의 부하량에 따른 퍼지규칙으로 새로운 프로세서 할당 기법인 FPA(Fuzzy-based Processor Allocation)를 제안한다. 또한, 시스템의 과부하 없이 각 작업에 대한 최대한의 병렬 가능성을 제공함으로써 기존의 할당 기법에 비해 우수한 성능을 보인다.

  • PDF

0/1 제약조건을 갖는 부정확한 실시간 태스크들의 총오류를 최소화시키는 효율적인 알고리즘 (An Efficient Algorithm to Minimize Total Error of the Imprecise Real Time Tasks with 0/1 Constraint)

  • 송기현
    • 한국컴퓨터산업학회논문지
    • /
    • 제7권4호
    • /
    • pp.309-320
    • /
    • 2006
  • 부정확한 실시간 시스템은 시간적으로 긴급한 태스크들을 융통성있게 스케쥴링해 줄 수 있다. 총 오류를 최소화시키면서 0/1 제약조건과 시간적 제약조건들을 모두 만족시키는 대부분의 스케쥴링문제들은 선택적태스크들이 임의의 수행시간을 갖고 있을 때 NP-complete이다. Liu는 단일처리기상에서 0/1제약조건을 갖는 태스크들을 총 오류가 최소화되도록 스케쥴링시킬 수 있는 합리적인 전략을 제시하였다 또한, 송 등은 다중처리기상에서 0/1제약조건을 갖는 태스크들을 총 오류가 최소화되도록 스케줄링 시킬 수 있는 합리적인 전략을 제시하였다. 그러나, 이러한 알고리즘들은 모두 오프라인 알고리즘들이다. <중략> 두 알고리즘들 사이의 성능비교의 결과로서, 선택적 태스크들이 그들의 실행요구시간의 임의의 순서대로 스케쥴될 때는 제안된 알고리즘이 NORA 알고리즘과 비슷한 총오류를 산출하지만 특별히 선택적 태스크들이 그들의 실행요구시간의 오름차순으로 스케쥴될 때는 제안된 알고리즘이 NORA 알고리즘보다 더 적은 총오류를 산출할 수 있음이 밝혀졌다. 본 논문에서 제시된 알고리즘은 레이다의 추적, 이미지 처리, 미사일 제어 등의 응용에서 효과적으로 적용될 수 있다.

  • PDF

다중 프로세서 환경에서 연결구조에 무관한 휴리스틱 부하평형 알고리즘 (A Topology Independent Heuristic Load Balancing Algorithm for Multiprocessor Environment)

  • 송의석;성영락;오하령
    • 전자공학회논문지CI
    • /
    • 제42권1호
    • /
    • pp.35-44
    • /
    • 2005
  • 본 논문에서는 다중 프로세서 시스템을 위한 효율적인 휴리스틱 부하 평형 알고리즘을 제안한다. 제안 알고리즘은 부하이동을 여러 링크로 분산시켜, 사용하지 않는 링크의 수를 최소화하고 그에 따라 통신비용이 감소한다. 각각의 프로세서는 모든 이웃한 프로세서에게 단위부하를 보내거나 받는 과정을 반복적으로 시도한다. 그리나 실제의 부하 이동은 모든 계산이 이루어진 후 수행된다. 이것은 불필요한 부하 이동을 막아 전체적으로 부하이동의 수가 감소한다. 제안된 알고리즘은 약간의 수정만으로 다양한 연결 구조를 갖는 다중 프로세서 시스템에 적용한 수 있다. 본 논문에서는 하이퍼큐브 구조, 메쉬 구조, k-ary n-cube 구조와 일반 그래프 구조에 제안 알고리즘을 적용해 보았다. 알고리즘의 성능평가를 위하여 모의실험을 하였다. 제안된 알고리즘과 잘 알려진 알고리즘을 구현하여 비교하였다. 그 결과 안된 알고리즘은 모든 경우에서 완전한 부하평형에 도달하였다. 또한 기존의 알고리즘과 비교하여 하이퍼큐브 구조에서는 약 77%, 메쉬 구조에서는 약 74%, 또한 k-ary 2,3-cube 구조에서는 약 73% 정도 통신비용을 감소시켰다.

다중처리기 시스템에서 데드라인과 여유시간을 통합한 실시간 스케줄링 기법 (Integrating Deadline with Laxity for Real-time Scheduling in Multiprocessor Systems)

  • 조성제
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권11호
    • /
    • pp.611-621
    • /
    • 2002
  • 실시간 시스템에서 많은 요청을 처리하기 위해 다중처리기 구조가 필수적이 되었다. EDF나 LLA와 같은 기존의 실시간 온라인 스케줄링 알고리즘들은 다중처리기 시스템에서 실시간 태스크들을 스케줄링하는 데 적합하지 않다. EDF의 경우 문맥교환 오버헤드가 낮지만 다중처리기 이상현상을 보이며, LLA의 경우 준최적이지만 문맥교환 오버헤드가 높다. EDZL은 두 알고리즘의 문제점을 일부 해결하였으나 세 개 이상의 처리기에서는 준최적이 아니다. EDA2는 과부하 단계에서 좋은 성능을 보이지만 준최적이 아니다. 본 논문에서는 새로운 두개의 온라인 스케줄링 알고리즘 ED/LL과 ED2/LL을 제안한다. ED/LL은 다중처리기에서 준최적이며, 정상부하 단계에서 낮은 문맥교환 오버헤드와 높은 성공률을 보인다. 그러나, 시스템이 과부하 상태가 되면 ED/LL은 비효율적이다. 이를 해결하기 위해, ED2/LL은 정상 부하 단계에서는 ED/LL 또는 EDZL을 사용하고 과부하 단계에서는 EDA2를 사용한다. 실험을 통해 ED2/LL이 정상부하 단계에서는 물론 과부하 단계에서도 좋은 성능을 보임을 확인할 수 있었다.

디렉토리를 이용한 캐쉬 일관성 유지 기법에서 무효화 힌트를 이용한 읽기 접근 시간 감소 (Reduction of Read Access Latency by Invalid Hint in Directory-Based Cache Coherence Scheme)

  • 오승택;이윤석;맹승렬;이준원
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권4호
    • /
    • pp.408-415
    • /
    • 2000
  • 대규모 분산 공유메모리 다중처리기는 공유메모리 접근 지연시간이 크다는 약점을 지니고 있다. 이러한 다중처리기에서 모든 메모리 요청이 홈노드를 통해 이루어지는 디렉토리 기반의 캐쉬 일관성 유지 기법의 사용은 메모리 접근 지연시간을 더욱 크게 하는 요인으로 작용한다. 뿐만 아니라 메모리 접근 지연시간은 시스템의 규모가 커질수록 전체 성능에 중요한 요소로 작용하므로, 대규모 시스템에서 이를 줄이기 위해서 많은 연구들이 있었다. 본 논문에서는 메모리 읽기 지연시간을 줄이는 새로운 캐쉬 일관성 유지 기법을 제안한다. 제안된 기법은 무효화힌트를 이용하여 구현되었다. 무효화힌트는 어떤 노드가 전에 캐쉬블록을 무효화 시켰는가에 관한 정보이며, 메모리블록이 필요한 노드는 이 정보를 이용하여 홈노드의 도움 없이 직접 메모리 요청을 할 수 있다. 제안된 프로토콜의 성능을 측정하기 위하여 모의실험을 하였다. 모의실험 결과는 제안된 프로토콜에서 읽기 지연시간이 감소하는 것을 나타낸다.

  • PDF

인쇄 악보의 인식과 병렬 알고리즘에 관한 연구 (A Study of Printed Score Recognition and its Parallel Algorithm)

  • 황영길;김성천
    • 한국통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.959-970
    • /
    • 1994
  • 본 논문에서는 핸디 스캐너를 사용하여 인쇄 악보를 읽어들여서 이를 최종적으로 매쉬 컴퓨터에서 병렬 수행 하도록 한다. 일차적으로 특정 패턴에 따란 분류하고, 지식을 기반으로하여 인식하게 된다. 본 논문에서 제안하는 알고리즘은 전처리 과정을 최소화하고 단순한 연산을 사용한다. 인쇄 악보의 악상 기호 크기는 여러 가지가 허용되도록하며 악상 기호의 종류의 다양성 때문에 모든 기호를 인식하는 것은 어려운 일이므로 우선 사용 빈도수가 높은 몇가지 기호를 인식하도록 한다. 인식된 결과는 미디 표준파일 형식으로 변환하도록 한다. 영상 처리의 고속성이 요구되므로 다중프로세서를 갖는 병렬처리 시스템이 필요하다. 이차원적인 디지털화된 영상은 SIMD 메쉬 컴퓨터 구조에서 처리되기에 적합하므로 이 구조에 대해서 설명하고 n의 프로세서를 갖는 SIMD 메쉬 컴퓨터 구조상에서의 시간복잡도가 0(n)인 병렬 알고리즘을 기술한다.

  • PDF

IPC-based Dynamic SM management on GPGPU for Executing AES Algorithm

  • Son, Dong Oh;Choi, Hong Jun;Kim, Cheol Hong
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.11-19
    • /
    • 2020
  • 최신 GPU는 GPGPU를 활용하여 범용 연산이 가능하다. 뿐만 아니라, GPU는 내장된 다수의 코어를 활용하여 강력한 연산 처리량을 제공한다. AES 알고리즘은 다수의 병렬 연산을 요구하지만 CPU 구조에서는 효율적인 병렬처리가 이뤄지지 않는다. 따라서, 본 논문에서는 강력한 병력 연산 자원을 활용하는 GPGPU 구조에서 AES 알고리즘을 수행함으로써 AES 알고리즘 처리시간을 줄여보았다. 하지만, GPGPU 구조는 AES 알고리즘 같은 암호알고리즘에 최적화되어 있지 않다. 그러므로 AES 알고리즘에 최적화될 수 있도록 재구성 가능한 GPGPU 구조를 제안하고자 한다. 제안된 기법은 SM의 개수를 동적으로 할당하는 IPC 기반 SM 동적 관리 기법이다. IPC 기반 SM 동적 관리 기법은 GPGPU 구조에서 동작하는 AES의 IPC를 실시간으로 반영하여 최적의 SM의 개수를 동적으로 할당한다. 실험 결과에 따르면 제안된 동적 SM 관리 기법은 기존의 GPGPU 구조와 비교하여 하드웨어 자원을 효과적으로 활용하여 성능을 크게 향상시켰다. 일반적인 GPGP 구조와 비교하여, 제안된 기법의 AES의 암호화/복호화는 평균 41.2%의 성능 향상을 보여준다.

다중 TMS320C31 DSP를 사용한 3-D 비젼센서 Implementation (A 3-D Vision Sensor Implementation on Multiple DSPs TMS320C31)

  • V.옥센핸들러;A.벤스하이르;P.미셰;이상국
    • 센서학회지
    • /
    • 제7권2호
    • /
    • pp.124-130
    • /
    • 1998
  • 독립적인 로보트나 자동차 제어 응용을 위하여 고속 3-D 비젼시스템들은 매우 중요하다. 이 논문은 다음과 같은 세가지 과정으로 구성되는 stereo vision process 개발에 대하여 논술한다 : 왼쪽과 오른쪽 이미지의 edges 추출, matching coresponding edges와 3-D map의 계산. 이 process는 VME 150/40 Imaging Technology vision system에서 이루어졌다. 이것은 display, acqusition, 4Mbytes image frame memory와 세 개의 연산 카드로 구성되는 modular system이다. 40 MHz로 작동하는 프로그래머불 연산 모듈은 $64{\times}32$ bit instruction cache와 두개의 $1024{\times}32$ bit RAM을 가진 TMS320C31 DSP에 기초를 두고 있다. 그것들은 각각 512 Kbyte static RAM, 4 Mbyte image memory, 1 Mbyte flash EEPROM과 하나의 직렬 포트로 구성되어있다. 모듈간의 데이터 전송과 교환은 8 bit globalvideo bus와 세 개의 local configurable pipeline 8 bit video bus에 의하여 이루어졌고, system management를 위하여 VME bus가 쓰였다. 두 개의 DSP는 왼쪽 및 오른쪽 이미지 edges 검출을 위하여 쓰였고 마지막 processor는 matching process와 3-D 연산에 사용되었다. $512{\times}512$픽셀 이미지에서 이 센서는 scene complexity에 따라 1Hz정도의 조밀한 3-D map을 생성했다. 특수목적의 multiprocessor card들을 사용하면 결과를 향상시킬 수 있을 것이다.

  • PDF

MIN-based 다중 처리 시스템을 위한 효율적인 병렬 Branch-and-Bound 알고리즘 설계 및 성능 분석 (Design and Performance Analysis of a Parallel Optimal Branch-and-Bound Algorithm for MIN-based Multiprocessors)

  • 양명국
    • 전기전자학회논문지
    • /
    • 제1권1호
    • /
    • pp.31-46
    • /
    • 1997
  • 본 논문에서는 다층 연결 구조(Multistage Interconnection Network, MIN)를 기반으로 하는 병렬 컴퓨터 환경에서 효과적으로 운용할 수 있는 병렬 Optimal Best-First search Branch-and-Bound 알고리즘(pobs)을 제안하고, 성능을 분석하였다. 제안된 알고리즘은 먼저 해를 얻고자 하는 문제를 임의의 G개 부 문제로 분할하고 소수 프로세서로 구성된 프로세서 그룹들에 할당하여 각각의 지역 해를 산출하도록 하였다. 따라서 N개의 프로세서를 갖는 시스템은 G개 프로세서 그룹으로 구분되고 각 프로세서 그룹은 P(=N/G)개 프로세서를 보유하게 된다. 각 프로세서 그룹은 할당된 부 문제의 지역 해를 얻는 과정에 병렬 sub-Global Best-First B&B 알고리즘을 수행한다. 프로세서 그룹들이 산출한 지역 해들 가운데 최선의 값을 갖는 지역 해가 문제의 전역 해로 결정되는데, 이를 위하여 각 프로세서 그룹의 대표 프로세서는 할당된 부 문제의 지역 해를 다른 그룹들에게 전파하도록 하였다. 지역 해 전파는 프로세서 그룹들의 지역 해 비교를 통한 전역해 선정 기능과 함께 프로세서 그룹간 작업 불균형 문제를 상당 부분 해소하는 효과를 제공한다. 알고리즘 설계에 이어 성능 평가를 위한 분석 모형을 제시하였다. 제안한 모형은 B&B 알고리즘 수행에 따른 연산 소요시간과 통신 소요시간을 분리하여 처리함으로 병렬 처리 환경에서 보다 실질적인 알고리즘 성능 평가가 가능하게 함과 동시에, 다양한 컴퓨터 연결 구조에서의 알고리즘 성능 예측을 용이하게 하였다. B&B 알고리즘의 확률 특성을 토대로 작성된 성능 분석 연구의 실효성 검토를 위하여 MIN 기반 시스템을 대상으로 병행된 시뮬레이션 결과는 상호 미세한 오차 범위 내에서 일치하는 결과를 보여 제시한 성능 분석 기법의 타당성을 입증하였다. 또한, 본 논문에서 제안한 병렬 알고리즘을 MIN 기반 시스템에 적용하여 기존 알고리즘의 성능과 비교 평가 결과 제안한 pobs가 문제 해결 과정에서 전개되는 부 문제 수를 줄이고 프로세서간의 효율적인 작업 분배 효과를 제공하는 한편 프로세서간의 주된 통신 활동 범위를 국부적으로 제한하여 성능면에서 우수함을 입증하였다.

  • PDF

0/1 제약조건을 갖는 부정확한 태스크들의 총오류를 최소화시키기 위한 개선된 온라인 알고리즘 (An Improved Online Algorithm to Minimize Total Error of the Imprecise Tasks with 0/1 Constraint)

  • 송기현
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권10호
    • /
    • pp.493-501
    • /
    • 2007
  • 부정확한 실시간시스템은 시간적으로 긴급한 태스크들을 융통성있게 스케줄링해줄 수 있다. 총 오류를 최소화시키면서 0/1제약조건과 시간적 제약조건들을 모두 만족시키는 대부분의 스케줄링문제들은 선택적 태스크들이 임의의 수행시간을 갖고 있을 때 NP-complete이다. Liu는 단일처리기상에서 0/1제약조건을 갖는 태스크들을 총 오류가 최소화되도록 스케줄링시킬 수 있는 합리적인 전략을 제시하였다. 또한, 송 등은 다중처리기상에서 0/1제약조건을 갖는 태스크들을 총 오류가 최소화되도록 스케줄링시킬 수 있는 합리적인 전략을 제시하였다. 그러나, 이러한 알고리즘들은 모두 오프라인 알고리즘들이다. 그런데, 온라인 스케줄링에 있어서, NORA알고리즘은 부정확한 온라인 태스크 시스템상에서 최소의 총 오류를 갖는 스케줄을 찾을 수 있다. 이러한 NORA알고리즘에 있어서, EDF전략이 선택적 스케줄링에 적용되었다. 한편, 0/1 제약조건을 갖는 태스크시스템에 있어서는, EDF스케줄링이 총 오류가 최소화된다는 측면에서 최적이 아닐수도 있다 더욱이, 선택적 태스크들이 그들의 실행요구시간의 오름차순으로 스케쥴될 때, EBF전략이 적용된 NORA알고리즘이 최소의 총오류를 산출할 수 없을지도 모른다. 그러므로, 본 논문에서는, 0/1제약조건을 갖는 부정확한 태스크 시스템의 총 오류를 최소화시키는 온라인 알고리즘이 제안되었다. 그리고나서, 제시된 알고리즘과 NORA 알고리즘 사이의 성능을 비교하기 위하여 여러 가지 실험들이 수행되었다. 두 알고리즘들 사이의 성능비교의 결과로서, 선택적 태스크들이 그들의 실행요구시간들의 임의의 순서대로 스케줄 될 때는 제안된 알고리즘이 NORA알고리즘과 비슷한 총 오류를 산출하지만 특별히 선택적 태스크들이 그들의 실행요구시간들의 오름차순으로 스케줄 될 때는 제안된 알고리즘이 NORA알고리즘보다 더 적은 총 오류를 산출할 수 있음이 밝혀졌다. 프라이버시 문제를 해결하도록 방안을 제시한다. 구간 보안 역시 완전한 솔루션을 제시하고 있지는 않다. 본 논문에서는 이러한 취약성을 고찰하고 그에 따른 대응방안을 제시하였다.긴 경우가 1예 있었으며, 수술 후 30일내 사망한 예가 1예였고 다른 1예는 전이성 암으로 사망하였다. 걸론: 근치적 방법으로 치료가 힘든 경우의 만성 농흉 환자들에게 있어 개방식 배농술과 근육이식술, 근육피판을 이용한 최종적인 개방창 폐쇄술까지의 단계적인 접근 방법이 안전하고 효과적인 대안이 될 수 있을 것으로 생각한다.만으로 야뇨횟수에 호전을 보이는 초기반응군 경우 2개월째 투약반응이 유의하게 좋았다. 이로써 야뇨증의 치료초기 행동요법에 대한 반응정도는 치료효과를 예측하는 지표로서 활용될 수 있다고 판단된다.지침을 제공할 수 있다. 소아의 첫 요로감염시 초음파나 $^{99m}Tc$-DMSA 신장 스캔상에서 양성소견이 있을 경우 배뇨성 방광 요도 조영술 검사를 시행하는 것이 좋으며, 초음파와 $^{99m}Tc$-DMSA 신장 스캔상에서 양성소견이 없을 경우라도 CRP 또는 백혈구 등의 임상자료들을 평가하여 배뇨성 방광 요도 조영술 검사를 시행유무를 결정하는 것이 잔존하는 방광요관역류를 찾는데 도움이 될 것으로 생각된다.O$로 고칼슘뇨군에서 더 농축된 소변을 보았다(P=0.003). 결론 :고칼슘뇨군의 소변화학검사의 가장 특징적인 소견은 요소 배설과 사구체여과율의 증가로서 이는 고칼슘뇨군이 비고칼슘뇨군에 비하여 고단백식이를 하고 있을 가능성을 시사한다. 나트륨과 칼슘은 사구체 여과가 증가함에 따라 원위세뇨관 및 집합관에 도달하는 양도 증가하고 그 곳에서 나트륨의 재흡수 기전이 매우 정교하게 이루어지는데 비하여 칼슘의 그 것은 그렇지 못하여 고칼슘뇨증을 일으켰을 가능성이 있다. 향후 고칼슘뇨 환아를 진료함에 있어서 단백질 섭취 등식이