• 제목/요약/키워드: parallel processing

검색결과 2,101건 처리시간 0.03초

다중 DSP 프로세서 기반의 병렬 수중정합장처리 알고리즘 설계 (Design of Parallel Algorithms for Conventional Matched-Field Processing over Array of DSP Processors)

  • 김건욱
    • 대한전자공학회논문지SP
    • /
    • 제44권4호통권316호
    • /
    • pp.101-108
    • /
    • 2007
  • 고성능 네트워크와 분산처리구조가 병렬처리와 함께 결합되면, 전체적인 디지털 신호처리 시스템의 계산능력, 신뢰도, 다양성을 향상시킨다. 본 논문에서는, 발전된 형태의 수중레이더 (sonar) 알고리즘인 수중정합장처리 (Matched-Field Processing MFP)를 위한 병렬처리 알고리즘을 디자인하고 다중 DSP 프로세서 기반의 병렬처리 시스템 상에서 성능분석과 함께 최적의 병렬처리 솔루션을 제안한다. 각각의 병렬 알고리즘은 특정한 도메인에서 주어진 계산량을 분산시키며 이를 통한 속도향상을 추구한다. 필요한 연산량과 형태에 따라서 병렬 알고리즘은 각기 다른 성능향상을 보여준다. 또한, 알고리즘의 계산량 분산방식 프로세서간의 통신방식, 알고리즘의 복잡도, 프로세서의 속도, 목적하는 시스템의 구성에 따라서 다양한 성능지표를 보여준다. 제안하는 주파수와 출력값 기반의 병렬 알고리즘은 상당한 계산량을 요구하는 수중정합처리 알고리즘을 적절히 다중 프로세서에 균형 있게 분산시켜 프로세서의 개수와 비례하는 성능향상을 보여주고 있다.

Performance Study of Satellite Image Processing on Graphics Processors Unit Using CUDA

  • Jeong, In-Kyu;Hong, Min-Gee;Hahn, Kwang-Soo;Choi, Joonsoo;Kim, Choen
    • 대한원격탐사학회지
    • /
    • 제28권6호
    • /
    • pp.683-691
    • /
    • 2012
  • High resolution satellite images are now widely used for a variety of mapping applications including photogrammetry, GIS data acquisition and visualization. As the spectral and spatial data size of satellite images increases, a greater processing power is needed to process the images. The solution of these problems is parallel systems. Parallel processing techniques have been developed for improving the performance of image processing along with the development of the computational power. However, conventional CPU-based parallel computing is often not good enough for the demand for computational speed to process the images. The GPU is a good candidate to achieve this goal. Recently GPUs are used in the field of highly complex processing including many loop operations such as mathematical transforms, ray tracing. In this study we proposed a technique for parallel processing of high resolution satellite images using GPU. We implemented a spectral radiometric processing algorithm on Landsat-7 ETM+ imagery using CUDA, a parallel computing architecture developed by NVIDIA for GPU. Also performance of the algorithm on GPU and CPU is compared.

RISC 병렬 처리를 위한 기억공간의 효율적인 활용 알고리즘 (An efficient Storage Reclamation Algorithm for RISC Parallel Processing)

  • 이철원;임인칠
    • 전자공학회논문지B
    • /
    • 제28B권9호
    • /
    • pp.703-711
    • /
    • 1991
  • In this paper, an efficient storage reclamation algorithm for RISC parallel processing in the object orented programming environments is presented. The memory management for the dynamic memory allocation and the frequent memory access in object oriented programming is the main factor that decreases RISC parallel processing performance. The proposed algorithm can be efficiently allocated the memory space of RISCy computer which is required the frequent memory access, so it can be increased RISC parallel processing performance. The proposed algorithm is verified the efficiency by implementing C language on SUN SPARC(4.3 BSD UNIX).

  • PDF

개선된 CENTRIST 알고리즘을 적용한 병렬처리 기반 보행자 인식 구현 (Implementation of Parallel Processing Based Pedestrian Detection Using a Modified CENTRIST Algorithm)

  • 정준모
    • 전기전자학회논문지
    • /
    • 제18권3호
    • /
    • pp.398-402
    • /
    • 2014
  • 본 논문은 ROI-CENTRIST 기반 보행자 인식 알고리즘의 병렬처리 방식을 제안한다. 기존의 보행자 인식 방식만을 이용하여 임베디드 환경에서 보행자 인식을 실시간으로 처리하기에는 어려움이 존재한다. 이러한 문제는 기존의 알고리즘에 ROI를 적용한 방식을 병렬로 처리함으로써 해결할 수 있다. 본 논문에서 제안하는 ROI-CENTRIST 기반 보행자 인식의 병렬처리 방식은 기존의 CENTRIST 기반 보행자 인식 방식보다 약 10% 향상된 5.2 fps의 성능을 보인다.

Average 출력회로를 이용한 아날로그 병렬처리 기반 비터비 디코더 (Analog Parallel Processing-based Viterbi Decoder using Average circuit)

  • 김현정;김인철;김형석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년 학술대회 논문집 정보 및 제어부문
    • /
    • pp.375-377
    • /
    • 2006
  • A Analog parallel processing-based Viterbi decoder which decodes PRML signal of DVD has been designed by CMOS circuit. The analog processing-based Viterbi decoder implements are functions of the conventional digital Viterbi decoder utilizing the analog parallel processing circuit technology. The Analog parallel processing-based Viterbi decoding technology is applied for the PR(1,2,2,1) signal decoding of DVD. The benefits are low power consumption and less silicon consumption. In this paper, the comparison of the Analog parallel processing-based Viterbi Decoder which has a function of the error correction between Max operation and Average operation is discussed.

  • PDF

시각매체를 위한 병렬처리 시스템 (A Parallel Processing System for Visual Media Applications)

  • 이형;박종원
    • 한국통신학회논문지
    • /
    • 제27권1A호
    • /
    • pp.80-88
    • /
    • 2002
  • 영상과 그래픽 및 비디오와 같은 시각 매체들을 실시간으로 처리하기 위한 구현 기술과 그에 따른 확정성 측면에서 많은 연구들이 진행되고 있는데, 이러한 연구들은 영상처리 전용 프로세서 구현부터 다양한 매체들을 함께 처리할 수 있는 프로세서 구현을 포함하는 범주까지 진행되고 있다. 또한, 다양한 병렬처리 기법들이 실시간 처리를 위한 프로세서의 구현에 적용되고 있다. 본 논문은 이러한 시각매체들을 실시간으로 처리하기 위하여 메모리 시스템과 다수개의 처리기로 구성된 pipelined SIMD 구조를 갖는 병렬처리시스템을 제안한다. 메모리시스템은 m개의 메모리 모듈과 메모리 제어기로 구성되어 있는 다중접근 기억장치로써, m개의 메모리 모듈에서 병렬로 n(=p${\times}$q)개의 데이터에 접근하기 위한 다양한 형태, 즉, 행(1${\times}$pq)과 열(pq${\times}$1) 및 블록 (p${\times}$q) 접근을 제공한다. 제안한 병렬처리시스템에 얼굴인식과 퐁 음영 및 동영상에서의 자동영상분할을 적용하여 시스템 성능을 분석하였다.

Novel Parallel Approach for SIFT Algorithm Implementation

  • Le, Tran Su;Lee, Jong-Soo
    • Journal of information and communication convergence engineering
    • /
    • 제11권4호
    • /
    • pp.298-306
    • /
    • 2013
  • The scale invariant feature transform (SIFT) is an effective algorithm used in object recognition, panorama stitching, and image matching. However, due to its complexity, real-time processing is difficult to achieve with current software approaches. The increasing availability of parallel computers makes parallelizing these tasks an attractive approach. This paper proposes a novel parallel approach for SIFT algorithm implementation using a block filtering technique in a Gaussian convolution process on the SIMD Pixel Processor. This implementation fully exposes the available parallelism of the SIFT algorithm process and exploits the processing and input/output capabilities of the processor, which results in a system that can perform real-time image and video compression. We apply this implementation to images and measure the effectiveness of such an approach. Experimental simulation results indicate that the proposed method is capable of real-time applications, and the result of our parallel approach is outstanding in terms of the processing performance.

고속 병렬처리 기법을 활용한 주파수 도약 신호 분석 (Frequency Hopping Signal Analysis Using High-Speed Parallel Processing)

  • 이광용;윤현철;이현휘
    • 한국전자파학회논문지
    • /
    • 제25권2호
    • /
    • pp.251-254
    • /
    • 2014
  • 본 논문에서는 주파수 도약 신호를 고속 병렬처리 구조로 설계하여 추출하는 기법에 대해 연구하였다. 주파수 도약 시스템은 반송파 주파수를 무작위한 것으로 보이는 패턴으로 변형시키기 때문에 고정 신호와는 달리 신호를 탐지하기 어렵고, 분석에 많은 시간이 소요되는 특성을 가진다. 이를 해결하기 위해 주파수 도약 신호를 분석하는 방법을 고속병렬처리 기법을 적용하여 설계하였다. 병렬처리를 위해 GPU를 사용하는 CUDA를 사용하였고, 단일처리 사용 결과와의 성능 평가 결과를 비교하였다. 그 결과, 단일처리 대비 연산 수행 속도 면에서 약 8.53배 성능이 향상됨을 확인하였다.

Estimation of Hydrodynamic Derivatives by Parallel Processing of Second Order Filter

  • Lee, Kurn-Chul;Kim, Jin-Ki;Rhee, Key-Pyo
    • Journal of Hydrospace Technology
    • /
    • 제1권1호
    • /
    • pp.66-74
    • /
    • 1995
  • Unknown parameters can be determined by system identification techniques. Extended Kalman filter method was introduced as a real time estimator of hydrodynamic derivatives but it has the problem named the coefficient drift. In this study, 2nd order filter estimates hydrodynamic derivatives in Abkowitz model In order to reduce the coefficient drift, parallel processing is used. The measured state and ship trajectory are compared with the estimated values. Parallel processing of 2nd order filter gives very similar results to parallel processing of extended Kalman filter. Parallel processing cannot not remove the coefficient drift perfectly, but it reduces the estimation error.

  • PDF

상용 응용을 위한 병렬처리 구조 설계 (Design of the new parallel processing architecture for commercial applications)

  • 한우종;윤석한;임기욱
    • 전자공학회논문지B
    • /
    • 제33B권5호
    • /
    • pp.41-51
    • /
    • 1996
  • In this paper, anew parallel processing system based on a cluster architecture which provides scalability of a parallel processing system while maintains shared memory multiprocessor characteristics is proposed. In recent days low cost, high performnce microprocessors have led to construction of large scale parallel processing systems. Such parallel processing systems provides large scalability but are mainly used for scientific applications which have large data parallelism. A shared memory multiprocessor system like TICOM is currently used as aserver for the commercial application, however, the shared memory multiprocessor system is known to have very limited scalability. The proposed architecture can support scalability and performance of the parallel processing system while it provides adaptability for the commerical application, hence it can overcome the limitation of the shared memory multiprocessor. The architecture and characteristics of the proposed system shall be described. A proprietary hierarchical crsossbar network is designed for this system, of which the protocol, routing and switching technique and the signal transfer technique are optimized for the proposed architecture. The design trade-offs for the network are described in this paper and with simulation usihng the SES/workbench, it is explored that the network fits to the proposed architecture.

  • PDF