• 제목/요약/키워드: 병렬 구현

검색결과 1,474건 처리시간 0.025초

Java를 이용한 병렬 프로그래밍 환경 (A Java Parallel Programming Environment)

  • 황석찬;최재영;김명호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권1호
    • /
    • pp.24-32
    • /
    • 1999
  • 네트워크 컴퓨터를 이용하여 병렬 프로그래밍 환경을 개발하려는 많은 연구가 진행되었다. 그러나 기존의 연구들에서는 응용 프로그램들이 호환되지 않고 이기종 컴퓨터사이에서 시스템이 이식되지 않는등 여러 가지 문제가 지적되고 있다. 이러한 이식성과 호환성의 문제를 해결하기 위하여 JPVM과 같은 연구도 진행되었디만, JPVM 은 병렬 환경을 위한 충분한 기능과, 견고한 메시지 통신, 편리한 사용자 인터페이스 등이 제대로 지원되고 있지 않다. 본 논문에서는 기존의 문제들을 해결하고 사용자에게 더욱 편리한 병렬 프로그래밍 환경을 제공하기 위한 JPE를 소개한다. JPE는 자바를 이용하여 호환성과 이식성의문제를 해결하였으며, 견고한 메시지 통신, 웹 기반의 그래픽 콘솔을 제공하여 인터넷상에서도 더욱 쉽게 사용할수 있도록 구현하였다.

메모리 중심 컴퓨터 구조에서 MPI 병렬 프로그램의 효율적인 수행 (Efficient Executions of MPI Parallel Programs in Memory-Centric Computer Architecture)

  • 이제만;이승철;신동하
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.257-258
    • /
    • 2019
  • 본 논문에서는 "프로세서 중심 컴퓨터 구조"에서 개발된 MPI 병렬 프로그램을 수정하지 않고 "메모리 중심 컴퓨터 구조"에서 더 효율적으로 수행시키는 기술을 제안한다. 본 연구에서 제안하는 기술은 메모리 중심 컴퓨터 구조가 가지는 "빠른 대용량 공유 메모리" 특징을 이용하여 MPI 표준 라이브러리가 수행하는 네트워크 통신을 통한 느린 데이터 전달을 공유 메모리를 통한 빠른 데이터 전달로 대체하여 효율성을 얻는다. 본 연구에서 제안한 기술은 도커 가상화 기술을 사용한 분산 시스템 환경에서 MC-MPI-LIB 라이브러리 및 MC-MPI-SIM 시뮬레이터로 구현되었으며 다수의 MPI 병렬 프로그램으로 시험 수행하여 효율성이 있음을 보였다.

  • PDF

동기화 오버헤드를 고려한 AES-CCM의 병렬 처리 (Considering Barrier Overhead in Parallelizing AES-CCM)

  • 정용화;김상춘
    • 정보보호학회논문지
    • /
    • 제21권3호
    • /
    • pp.3-9
    • /
    • 2011
  • 본 논문에서는 현재 IEEE 802.11i에서 암호화/메시지 인증 표준으로 제안되고 있는 AES-CCM의 효율적인 병렬처리 방법을 제안한다. 특히, 데이터 종속성이 존재하는 메시지 인증 계산을 병렬처리 하기 위해서는 프로세서간 동기화가 필요한데, 멀티코어 프로세서에서는 동기화 구현을 어떻게 하였는지에 따라 매우 다양한 동기화 성능을 제공하고 있다. 본 논문에서는 AES-CCM의 계산 특성과 멀티코어 프로세서의 동기화 성능을 고려하여 전체 수행시간이 최소화될 수 있는 병렬 처리 방법을 비교 분석한다.

논리 프로그램의 병렬도 개선을 위한 플랫 인덱싱 기법 (Flat Indexing: A Compilation Technique to Enhance the Parallelism of Logic Programs)

  • 김희철;이용두
    • 한국정보처리학회논문지
    • /
    • 제5권7호
    • /
    • pp.1908-1922
    • /
    • 1998
  • 본 논문은 논리언어 프로그램의 효율적인 클로즈(Clause) 인덱싱을 위한 컴파일 기법에 대한 체계적인 접근방법을 제시한다. 본 접근방법의 핵심으로서 노드당 평균 병렬도와 클로즈 수행시도(clause trial) 횟수를 정확하게 나타낼 수 있는 기법으로서 인덱싱트리(Indexign Tree)를 제안한다. 인덱싱트리는 인덱싱 수행 시에 인덱싱을 위한 지시어(Instruction)의 수행 결과로 프로그램으 컨트롤이 실패처리코드로 이동하는 경우도 정량적으로 나타내 준다. 인덱싱트리를 사용하여 논리 프로그램을 위한 대표적인 가상머신인 WAM(Warren Abstract Machine)을 분석한 결과, WAM에서 사용하는 인덱싱 기법이 논리 프로그램의 병렬 처리에 있어 탐색트리의 병렬도를 감소시키며, 또한 스케쥴링의 효율성을 저하시키는 결점을 내포하고 있음을 발견할 수 있었다. 이러한 결점을 해결하기 위하여 본 논문은 플랫 인덱싱이라는 새로운 인덱싱 기법을 제안하고 이것을 실제 논리언어 컴파일러에 구현하여 측정한 향상 및 분석 결과를 보여준다.

  • PDF

데이터베이스 백업 성능 향상을 위한 병렬 인덱스 스캔 기법 (Improving Performance of Database Backup via Parallel Index Scan)

  • 이민욱;한재현;손용석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.54-56
    • /
    • 2021
  • 데이터베이스 백업은 데이터베이스 데이터를 보존 및 복구하기 위해 사용되는 필수 기법이다. 이를 위해 데이터베이스 관리 시스템(Database Management System)에서는 백업 기능을 수행하는 응용을 제공한다. 하지만 이러한 백업 응용은 기존 HDD 의 특성을 고려하여 설계 및 구현되어있기 때문에 최근 주로 사용되고 있는 저장장치인 SSD 에서는 SSD 의 성능을 최대한 이끌어내지 못하고 있다. 예를 들어, 기존 백업 응용에서는 단일 스레드가 백업을 위한 데이터를 순차적으로 접근하고 풀 스캔 방식으로 백업을 수행한다. 따라서 본 연구에서는 SSD 의 병렬적 특성을 활용하여 백업 응용의 성능을 극대화시키는 것을 목표로 한다. 이를 위해 본 논문은 병렬 인덱스 스캔 기법을 제시한다. 제안한 기법은 기존 백업 기법과 달리 멀티 스레드를 활용하여 인덱스 스캔을 수행하고 병렬적으로 데이터에 접근하여 백업을 수행한다. 해당 기법은 기존 기법에 비해 최대 2.5 배 성능을 향상시켰다.

비 압축 블록으로 구성된 제어 헤더 삽입을 통한 압축 해제 호환성 있는 병렬 처리 Deflate 알고리즘 제안 (Proposal for Decoding-Compatible Parallel Deflate Algorithm by Inserting Control Header Composed of Non-Compressed Blocks)

  • 김정훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권5호
    • /
    • pp.207-216
    • /
    • 2023
  • 본 연구에서는 압축 해제 호환성을 갖춘 병렬 처리 Deflate 압축 알고리즘을 구현하기 위하여 병렬 압축 및 압축 해제에 필수적인 정보를 복수의 비 압축 블록(Non-Compression Block)내의 버려지는 영역(Disposed Bit Area)에 저장하는 방식으로 구성한 컨트롤 헤더를 삽입하는 새로운 방식을 제안하였다. 이를 통해 기존 압축 해제 프로그램과 완벽한 호환성을 유지하면서도 병렬 압축 및 병렬 압축 해제가 가능하도록 하였다. 또한 순차 처리방식 대비 압축 시간을 최대 71.2% 절감하였고 병렬 압축해제 시간을 65.7%까지 절감하였다. 특히 Deflate 알고리즘의 구조적 제약으로 인해 병렬 압축 해제는 불가능하다고 알려져 있으나, 제안하는 방식을 탑재한 디코더로 알고리즘 수준에서 고속의 병렬 압축 해제가 가능하고, 호환성을 유지하여 동일한 압축 데이터를 기존의 압축 해제 프로그램으로도 정상적 압축 해제가 가능함을 확인하였다.

멀티코어 시스템을 위한 멀티스레드 H.264/AVC 병렬 디코더 (Multi-Threaded Parallel H.264/AVC Decoder for Multi-Core Systems)

  • 김원진;조걸;정기석
    • 대한전자공학회논문지SD
    • /
    • 제47권11호
    • /
    • pp.43-53
    • /
    • 2010
  • 고해상도의 동영상 서비스가 보편화 되면서 동영상을 빠르게 처리를 위한 연구가 활발히 이루어지고 있다. 멀티코어 프로세서의 사용이 증가하고 멀티코어 시스템에서 H.264/AVC 디코더를 구현하기 위하여 다양한 병렬화 방법이 제안되고 있다. 하지만 H.264/AVC 디코더를 병렬화 하는 경우, 각 스레드에서 처리하는 데이터의 처리 시간 차이로 인하여 지속적으로 스레드의 동기를 확인해야 하는데, 이는 병렬화를 통한 디코더의 성능 향상의 걸림돌이 된다. 이러한 병렬화 과정에서 발생하는 문제점을 해결하기 위해 우리가 제안하는 Multi -Threaded Parallelization(MTP) 방법은 프레임을 매크로 블록 묶음으로 나누어 병렬화 한다. 그리고 병렬화 과정에서 스레드를 처리하는 방법을 개선하고, 메모리를 재사용함으로써 디코더의 성능을 향상 시켰다. 본 논문에서는 FFmpeg H.264/AVC 디코더를 인텔 쿼드 코어 기반의 멀티코어 시스템에서 멀티 스레드로 구현하여 실험이 진행되었다. 그 결과, MTP 방법을 적용하여 병렬화 방법 적용하지 않은 H.264/AVC 디코더와 비교하여 최대 53%의 성능향상을 보였으며, 2Dwave 병렬화 방법의 메모리 사용량에 비해 HD 영상에서 65%, FHD 영상에서 81%의 메모리 사용량을 줄 일 수 있었다.

2차원 토러스 기반 다중 디스크 데이터 배치 병렬 유전자 알고리즘 (A 2-Dimension Torus-based Genetic Algorithm for Multi-disk Data Allocation)

  • 안대영;이상화;송해상
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.9-22
    • /
    • 2004
  • 본 논문에서는 NP-Complete 부류에 속하는 다중 디스크 데이터 배치 문제를 해결하기 위한 병렬 유전자 알고리즘을 제안한다. 이 문제는 디스크 입출력 처리의 병렬성이 극대화되도록 Binary Cartesian Product File의 데이터 블록들을 디스크어레이에 배치하는 방식을 찾는 것이다. 이 문제를 해결하기 위하여 제안되었던 DAGA 방식은 순차 유전자 알고리즘(Genetic Algorithm)으로서, 이전에 제안되었던 다른 방식에 비해 디스크 수에 대한 제약을 없애면서도 우수한 결과를 제공함을 보여 주었으나 시뮬레이션 시간이 너무 커서 큰 용량의 데이터 구성에 대한 시뮬레이션을 어렵게 하는 문제점이 있었다. 본 논문에서는 DAGA의 시뮬레이션 시간 단축을 위한 방식으로서, 2차원 토러스(2-Dimension Torus) 기반 병렬 유전자 알고리즘(ParaDAGA)을 제안한다. ParaDAGA는 분산 객체 모형을 기반으로 설계되었으며, 단일 프로세서 시스템에서 구현된 병렬처리 컴퓨터 시뮬레이터에서 수행되도록 구현하였다. 시뮬레이션 연구를 통하여, ParaDAGA의 시뮬레이션 변수 값이 결과에 주는 영향을 분석하였고, ParaDAGA 방식이 DAGA 방식에 비해 우수한 결과를 제공할 수 있는지를 실험하였다. 실험 결과는 ParaDAGA 방식이 순차 알고리즘인 DAGA보다 알고리즘 수행 시간 뿐 아니라, 찾아낸 결과도 우수함을 보여준다.

프로세서 farm 모델을 이용한 광추적 알고리듬 (A Ray-Tracing Algorithm Based On Processor Farm Model)

  • 이효종
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제2권1호
    • /
    • pp.24-30
    • /
    • 1996
  • 광추적표현(ray tracing rendering) 기법은 컴퓨터를 이용하여 현실감 있는 영상을 얻기 위한 음영처리 방법의 하나로 오랜 컴퓨터 처리시간을 필요로 한다. 병렬처리 기법을 적용함으로서 컴퓨터 처리시간을 효과적으로 줄일 수 있어, 본 논문에서는 광추적 기법을 위한 병렬 알고리듬을 구현하고 트랜스퓨터시스템 상에서 실험하였다. 또한 알고리듬의 확장성과 부하균형을 위하여 프로세서 farm 모델을 응용하였다. 전체의 영상을 균일한 크기로 분할하고 각각의 프로세서 farm에 분배하는 방식을 사용하였기 때문에 제안된 알고리듬에서는 병렬시스템의 확장성과 부하의 균형문제를 자연스럽게 해결하였다. 구현된 병렬 알고리듬은 가변의 일꾼을 가지는 트랜스퓨터에서 실행하였으며 효율은 9개의 프로세서를 사용하였을 때 65% 이상으로 나타났다. 가장 우수한 성능을 가지는 경우는 작업의 분할 크기가 256~1024개의 화소를 가질 때인 것으로 측정되었다. 이와 같은 높은 효율과 우수한 확장성 이외에도 트랜스퓨터시스템이 지니고 있는 가격 대 성능비의 우수성으로 인하여, 트랜스퓨터는 확장성 있는 병렬시스템으로 적합한 것을 알 수 있다.

  • PDF

순차 Shear-Warp 알고리즘을 이용한 병렬볼륨렌더링의 구현 (Implementation of Parallel Volume Rendering Using the Sequential Shear-Warp Algorithm)

  • 김응곤
    • 한국정보처리학회논문지
    • /
    • 제5권6호
    • /
    • pp.1620-1632
    • /
    • 1998
  • 본 논문에서는 볼륨렌더링을 위한 빠른 병렬 알고리즘을 제안하고, 이를 4,096개의 프로세서를 가진 MasPar MP-2범용병렬 컴퓨터에서 C 언어와 MPL(MasPar Programming Language)언어를 이용하여 구현하였다. 본 알고리즘은 현재 가장 빠른 순차 볼륨 렌더링 알고리즘으로 알려진 Lacroute의 Shear-Warp 알고리즘을 병렬화한 것이다. 본 병렬 알고리즘은 밀림변환 공간 분할 기법과 이전의 렌더링 단계에서 얻은 부하정보를 이용하여 다음 렌더링시 부하를 균형화하는 부하균형화 기법을 이용함으로써 통신 오버헤드를 줄이며, 연속길이부호화 기법에 의한 볼륨 데이터 구조를 이용함으로써 처리할 복셀의 수를 크게 줄인다. MasPar MP-23에서 $128\times128\times128$복셀로 구성된 인체 두뇌 볼륨 데이터세트에 대하여 실험한 결과 초당 3~4프레임의 속도로 렌더링하였으며 본 알고리즘의 확장성에 의하여 16,384개의 프로세서를 가진 MasPar MP-2 시스템에서는 초당 12~16프레임의 렌더링이 가능할 것으로 기대된다. 또한 더 큰 볼륨에 대해서도 최근의 SIMD 또는 MIMD 머신상에서는 초당 30~60프레임의 렌더링이 가능할 것으로 기대된다.

  • PDF