• 제목/요약/키워드: Parallel Processing method

검색결과 732건 처리시간 0.024초

자료 병렬 언어 프로그램의 병렬 구조 변환을 위한 최적화기 설계 (A Design of An Optimizer For Conversion of Parallel Constructs of Data Parallel Language Programs)

  • 구미순;박명순
    • 한국정보처리학회논문지
    • /
    • 제6권3호
    • /
    • pp.792-803
    • /
    • 1999
  • Most data parallel language compilers are source-to-source translators. Most Compilers of HPF which is recognized as a standard data parallel language convert a parallel program in PHF in a Fortran 77 program inserted message passing primitives. By the way, they currently generate significant amount of ineffective codes in the course of the conversion. Especially, FORALL construct is converted into several DO loops, so loop overhead of these codes is very increased. In this paper, we define and use relation distance vector to keep necessary informations. Then we evaluate and analyze execution time for the codes converted by our method and by PARADIGM method for various array sizes.

  • PDF

IoT/에지 컴퓨팅에서 저전력 메모리 아키텍처의 개선 연구 (A Study on Improvement of Low-power Memory Architecture in IoT/edge Computing)

  • 조두산
    • 한국산업융합학회 논문집
    • /
    • 제24권1호
    • /
    • pp.69-77
    • /
    • 2021
  • The widely used low-cost design methodology for IoT devices is very popular. In such a networked device, memory is composed of flash memory, SRAM, DRAM, etc., and because it processes a large amount of data, memory design is an important factor for system performance. Therefore, each device selects optimized design factors such as function, performance and cost according to market demand. The design of a memory architecture available for low-cost IoT devices is very limited with the configuration of SRAM, flash memory, and DRAM. In order to process as much data as possible in the same space, an architecture that supports parallel processing units is usually provided. Such parallel architecture is a design method that provides high performance at low cost. However, it needs precise software techniques for instruction and data mapping on the parallel architecture. This paper proposes an instruction/data mapping method to support optimized parallel processing performance. The proposed method optimizes system performance by actively using hardware and software parallelism.

향상된 영상 골격화를 위한 효과적인 병렬 처리 방법 (The Effective Parallel Processing Method for an Enhanced Digital Image of Skeleton Line)

  • 신충호;오무송
    • 한국멀티미디어학회논문지
    • /
    • 제7권4호
    • /
    • pp.459-466
    • /
    • 2004
  • 골격선 추출에 대한 향상된 디지털 이미지를 획득하기 위해서 효과적인 골격화 방법을 제안한다. 제안한 방법은 임계값을 이용한 이진화를 거친 후에 본 방법을 적용하여 영상 골격화 효율을 높이고자 한다. 기존의 골격화 방법은 Rutovits, Stefabelli 그리고 그 외에 5가지 방법을 사용하였다. 기존의 방법은 많은 부분에서 팽창과 잡음가지들이 생성되어 골격화를 이루는데 어려운 점이 많았다. 그러나 제안된 방법은 수정된 병렬처리 단계를 통해서 먼저 문제점들을 제거하였고, 첨가하여 제안된 8가지 제거 조건들에 일치하면 중앙 화소를 제거하여 골격화 품질을 향상시켰다.

  • PDF

샷 경계 탐지 알고리즘의 병렬 설계와 구현 (Parallel Design and Implementation of Shot Boundary Detection Algorithm)

  • 이준구;김승현;유병문;황두성
    • 전자공학회논문지
    • /
    • 제51권2호
    • /
    • pp.76-84
    • /
    • 2014
  • 최근 고화질 영상의 증가와 더불어 대용량 영상 데이터의 처리는 높은 연산이 요구되어 병렬 처리 설계가 선택되고 있다. 영상 처리에서 나타나는 많은 단순 연산이 병렬처리 가능한 경우, CPU 기반 병렬처리보다는 GPU 기반 병렬처리를 적용하는 것이 계산문제의 시간과 공간 계산 복잡도를 줄일 수 있다. 본 논문은 영상에서 샷 경계 탐지 알고리즘의 병렬 설계와 구현을 연구하였다. 제안하는 샷 경계 탐지 알고리즘은 프레임 간 지역 화소 밝기 비교와 전역 히스토그램 정보를 이용하는데, 이들 데이터의 계산은 대량의 데이터에 대한 높은 병렬성을 갖는다. 이들 연산의 병렬처리를 최대화하기 위해 화소 밝기와 히스토그램의 계산을 NVIDIA GPU에서 병렬 설계 하였다. GPU 기반 샷 탐지 방법은 국가기록원에서 선택된 10개의 비디오 데이터에 대한 성능 테스트를 수행하였다. 테스트에서 GPU 기반 알고리즘의 탐지율은 CPU 기반 알고리즘과 유사하였으나 약 10배의 연산 속도가 개선되었다.

Lagrangean 근사과정의 병렬계산 (On Parallel Implementation of Lagrangean Approximation Procedure)

  • 이호창
    • 한국경영과학회지
    • /
    • 제18권3호
    • /
    • pp.13-34
    • /
    • 1993
  • By operating on many part of a software system concurrently, the parallel processing computers may provide several orders of magnitude more computing power than traditional serial computers. If the Lagrangean approximation procedure is applied to a large scale manufacturing problem which is decomposable into many subproblems, the procedure is a perfect candidate for parallel processing. By distributing Lagrangean subproblems for given multiplier to multiple processors, concurrently running processors and modifying Lagrangean multipliers at the end of each iteration of a subgradient method,a parallel processing of a Lagrangean approximation procedure may provide a significant speedup. This purpose of this research is to investigate the potential of the parallelized Lagrangean approximation procedure (PLAP) for certain combinational optimization problems in manufacturing systems. The framework of a Plap is proposed for some combinatorial manufacturing problems which are decomposable into well-structured subproblems. The synchronous PLAP for the multistage dynamic lot-sizing problem is implemented on a parallel computer Alliant FX/4 and its computational experience is reported as a promising application of vector-concurrent computing.

  • PDF

Distributed Collision-Resolvable Medium Access Control for Wireless LANs with Interference Cancellation Support

  • Shen, Hu;Lv, Shaohe;Wang, Xiaodong;Zhou, Xingming
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권8호
    • /
    • pp.2691-2707
    • /
    • 2014
  • Medium access control is critical in wireless networks for efficient spectrum utilization. In this paper, we introduce a novel collision resolution method based on the technique of known interference cancellation, and propose a new MAC protocol named as CR-MAC, in which AP tries to decode all the collided data packets by combining partial retransmissions and known interference cancellation. As the collided transmissions are fully utilized, less retransmission is required, especially in a crowded network. The NS-2simulation and MATLAB numerical results show that, under various network settings, CR-MAC performs much better than the IEEE 802.11 DCF in terms of the aggregation throughput and the expected packet delay.

병렬 처리를 이용한 3차원 데토네이션 파 구조 해석 (STUDY OF THREE-DIMENSIONAL DETONATION WAVE STRUCTURES USING PARALLEL PROCESSING)

  • 조덕래;최정열
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2005년도 추계 학술대회논문집
    • /
    • pp.151-155
    • /
    • 2005
  • Three-dimensional structures of unsteady detonation wave propagating through a square-shaped tube is studied using computational method and parallel processing. Inviscid fluid dynamics equations coupled with variable-${\gamma}$ formulation and simplified one-step Arrhenius chemical reaction model were analysed by a MUSCL-type TVD scheme and four stage Runge-Kutta time integration. Results in three dimension show the two unsteady detonation wave propagating mode, the Rectangular and diagonal mode of detonation wave instabilities. Two different modes of instability showed the same cell length but different cell width and the geometric similarities in smoked-foil record.

  • PDF

병렬 처리를 이용한 3차원 테토네이션 파 수치해석 (NUMERICAL STUDY OF THREE-DIMENSIONAL DETONATION WAVES USING PARALLEL PROCESSING)

  • 조덕래;최정열
    • 한국연소학회:학술대회논문집
    • /
    • 한국연소학회 2005년도 제31회 KOSCO SYMPOSIUM 논문집
    • /
    • pp.15-19
    • /
    • 2005
  • Three-dimensional structures of unsteady detonation wave propagating through a square-shaped tube is studied using computational method and parallel processing. Inviscid fluid dynamics equations coupled with variable-${\gamma}$ formulation and simplified one-step Arrhenius chemical reaction model were analysed by a MUSCL-type TVD scheme and four stage Runge-Kutta time integration. Results in three dimension show the two unsteady detonation wave propagating mode, the Rectangular and diagonal mode of detonation wave instabilities. Two different modes of instability showed the same cell length but different cell width and the geometric similarities in smoked-foil record.

  • PDF

비대칭 멀티코어 시스템 상의 HEVC 병렬 디코딩 최적화를 위한 타일 분할 기법 (Tile Partitioning-based HEVC Parallel Decoding Optimization for Asymmetric Multicore Processor)

  • 류영일;노현준;류은석
    • 정보과학회 논문지
    • /
    • 제43권9호
    • /
    • pp.1060-1065
    • /
    • 2016
  • 최근 비디오 시스템은 초고해상도 영상의 사용으로 병렬처리의 필요성이 대두되고 있고, 시스템은 ARM big.LITTLE 같은 비대칭 처리능력을 지닌 컴퓨팅 시스템이 도입되고 있다. 따라서, 이 같은 비대칭 컴퓨팅 환경에 최적화된 초고해상도 UHD 비디오 병렬처리 기법이 필요한 시점이다. 본 논문은 인코딩/디코딩 시에 비대칭 컴퓨팅 환경에 최적화 된 HEVC 타일(Tile) 분할 기법을 제안한다. 제안하는 방식은 (1) 비대칭 CPU 코어들의 처리능력과 (2) 비디오 크기별 연산 복잡도 분석 모델을 분석하여, (3) 각 코어에 최적화된 크기의 타일을 할당함으로써, 처리속도가 빠른 CPU 코어와 느린 코어의 인코딩/디코딩 시간차를 최소화한다. 이를 ARM기반의 비대칭 멀티코어 플랫폼에서 4K UHD 표준 영상을 대상으로 실험하였을 때, 평균 약 20%의 디코딩 시간 개선이 발생함을 확인하였다.

비디오 감시 시스템을 위한 멀티코어 프로세서 기반의 병렬 SVM (Multicore Processor based Parallel SVM for Video Surveillance System)

  • 김희곤;이성주;정용화;박대희;이한성
    • 정보보호학회논문지
    • /
    • 제21권6호
    • /
    • pp.161-169
    • /
    • 2011
  • 최근 지능형 비디오 감시 시스템은 영상 분석 및 인식기술 등의 보다 진화된 기술 개발을 요구하고 있다. 특히, 비디오 영상에서 객체를 식별하기 위하여 Support Vector Machine(SVM)과 같은 기계학습 알고리즘이 이용된다. 그러나 SVM은 대용량의 데이터를 학습시키기 위하여 많은 계산량이 필요하기 때문에 수행시간을 효율적으로 감소시키기 위하여 병렬처리 기법을 적용할 필요가 있다. 본 논문에서는, 최근 사용이 증가하고 있는 멀티코어 프로세서를 활용한 SVM 학습의 병렬처리 방법을 제안한다. 4-코어 프로세서를 이용한 실험 결과, 제안 방법은 SVM 학습의 순차처리 방법과 비교하여 2.5배 정도 수행시간이 감소됨을 확인하였다.