• 제목/요약/키워드: block processing

검색결과 1,476건 처리시간 0.027초

Block Cyclic Reduction 기법에 의한 대형 Sparse Matrix 선형 2계편미분방정식의 효율적인 병렬 해 알고리즘 (An efficient parallel solution algorithm on the linear second-order partial differential equations with large sparse matrix being based on the block cyclic reduction technique)

  • 이병홍;김정선
    • 한국통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.553-564
    • /
    • 1990
  • 선계2계 편미분 방정식의 일반식에 대한 계수 메트릭스를 (n-1)x(n-1) submatrices로 나누어서 block tridiagonal system으로 변환한 후 cyclic odd-even reduction 기법을 응용하여 large-grain data granularity로서 미지벡타를 구하는 block cyclic reduction 알고리즘을 작성했다. 그런데 이 block cyclic reduction 기법은 매 연산의 단계마다 병렬성이 변하여 병렬처리형 컴퓨터에는 적합하지 못하므로 이 기법을 변형해서 병렬성이 일정하며 실행시간이 보다 단축되는 block cyclic reduction 기법을 제안하고 이 기법에 의한 선형2계 편미분 방정식의 일반식의 解를 구하는 알고리즘을 작성하여 기존의 기법과 비교 고찰했다.

  • PDF

모노스태틱 지형 영상 레이더의 블록 처리 기법 연구 (A Study on Block Processing Approach for Mono-Static Terrain Imaging Radar)

  • 하종수;조병래;이정수;박규철;선선구;강태하
    • 한국전자파학회논문지
    • /
    • 제24권5호
    • /
    • pp.549-557
    • /
    • 2013
  • 본 논문에서는 전방 표적을 탐지하기 위한 모노스태틱 지형 영상 레이더의 블록 처리 기법을 설명한다. 모노스태틱 지형 영상 레이더는 초광대역 레이더이고 dechirp-on-receive 처리를 수행하기 때문에 합성개구면 레이더의 다양한 기존의 영상화 기법을 적용하기는 어렵다. 본 논문에서는 적용 가능한 영상화 기법으로서 각 블록별로 거리 및 방위각 압축을 수행하는 블록 처리 기법을 제안한다. 제안하는 기법의 도출 과정을 제시하고, 시뮬레이션과 시험 결과를 분석함으로써 제안하는 기법의 성능과 타당성을 검증한다.

블록 정합 움직임추정 알고리즘의 고속처리를 위한 시스토릭 어레이의 설계 (Design of Systolic Array for High Speed Processing of Block Matching Motion Estimation Algorithm)

  • 추봉조;김혁진;이수진
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권2호
    • /
    • pp.119-124
    • /
    • 1998
  • 블록정합 움직임추정 알고리즘은 매우 많은 양의 계산 능력을 요구하고 현재 많은고속 알고리즘이 제안되었다. 기존의 움직임 추정에 대한 블록정합 알고리즘은 탐색 블록 데이터의 비 지역화로 인한 VLSI 규모가 커지는 문제와 입력데이터를 매번 입력해야 하는재 사용문제에 대한 단점을 가지고 있었다. 본 논문은 입출력 핀 수의 증가를 최대한 억제하면서 입력데이터의 재사용을 통한 VLSI 규모를 최소화 할 수 있는 고속 시스토릭 어레이를 설계하였다. 제안된 시스토릭 어레이는 탐색 블럭의 입력데이터를 반복적으로 재 사용하여 메모리 접근시간을 최소화시키고 알고리즘의 병렬성을 증가시켜 전체 처리요소의 연결이 시간적 공간적으로 지역화 되어 문제크기의 증가에 대한 시간적인 영향을 받지 않는 문제 독립적인 형태가 된다. 설계된 시스토릭 어레이는 이동벡터의 계산 복잡도가 O(N6)에서 O(N3)로 크게 향상되었으며 입촐력 핀의 수는O(N)을 가진다.

  • PDF

LDBAS: Location-aware Data Block Allocation Strategy for HDFS-based Applications in the Cloud

  • Xu, Hua;Liu, Weiqing;Shu, Guansheng;Li, Jing
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권1호
    • /
    • pp.204-226
    • /
    • 2018
  • Big data processing applications have been migrated into cloud gradually, due to the advantages of cloud computing. Hadoop Distributed File System (HDFS) is one of the fundamental support systems for big data processing on MapReduce-like frameworks, such as Hadoop and Spark. Since HDFS is not aware of the co-location of virtual machines in the cloud, the default scheme of block allocation in HDFS does not fit well in the cloud environments behaving in two aspects: data reliability loss and performance degradation. In this paper, we present a novel location-aware data block allocation strategy (LDBAS). LDBAS jointly optimizes data reliability and performance for upper-layer applications by allocating data blocks according to the locations and different processing capacities of virtual nodes in the cloud. We apply LDBAS to two stages of data allocation of HDFS in the cloud (the initial data allocation and data recovery), and design the corresponding algorithms. Finally, we implement LDBAS into an actual Hadoop cluster and evaluate the performance with the benchmark suite BigDataBench. The experimental results show that LDBAS can guarantee the designed data reliability while reducing the job execution time of the I/O-intensive applications in Hadoop by 8.9% on average and up to 11.2% compared with the original Hadoop in the cloud.

A Systolic Array for High-Speed Computing of Full Search Block Matching Algorithm

  • Jung, Soon-Ho;Woo, Chong-Ho
    • 한국멀티미디어학회논문지
    • /
    • 제14권10호
    • /
    • pp.1275-1286
    • /
    • 2011
  • This paper proposes a high speed systolic array architecture for full search block matching algorithm (FBMA). The pixels of the search area for a reference block are input only one time to find the matched candidate block and reused to compute the sum of absolute difference (SAD) for the adjacent candidate blocks. Each row of designed 2-dimensional systolic array compares the reference block with the adjacent blocks of the same row in search area. The lower rows of the designed array get the pixels from the upper row and compute the SAD with reusing the overlapped pixels of the candidate blocks within same column of the search area. This designed array has no data broadcasting and global paths. The comparison with existing architectures shows that this array is superior in terms of throughput through it requires a little more hardware.

Nanostructuring of Semi-conducting Block Copolymers: Optimized Synthesis and Processing for Efficient Optoelectronic Devices

  • Hadziioannou, Georges
    • 한국고분자학회:학술대회논문집
    • /
    • 한국고분자학회 2006년도 IUPAC International Symposium on Advanced Polymers for Emerging Technologies
    • /
    • pp.74-75
    • /
    • 2006
  • In organic opto-electronic applications, such as light emitting diodes (LEDs) and photovoltaic devices (PVDs), the morphology of the active layer is of crucial importance. To control the morphology of the active layer the self-assembling properties of block copolymers was used. Several rod-coil semiconducting diblock copolymers consisting of a conjugated block and a second coil block functionalized with electron transporting and/or accepting materials (such as $C_{60}$) were synthesized. The conjugated block acting as light absorbing, electron donating and hole transporting material. The donor/acceptor photovoltaic devices performance with active layer the above mentioned semiconducting block copolymers will be presented.

  • PDF

블록체인을 이용한 부동산종합공부시스템 참조모델 (A Reference Model for Korea Real Estate Administration Intelligence System Using Block Chain)

  • 선종철;김진욱
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제7권11호
    • /
    • pp.281-288
    • /
    • 2018
  • 동일한 데이터를 여러 곳에 보관하는 분산원장을 특징으로 갖는 블록체인은 보안성과 안정성을 비롯한 여러 가지 기술적 특징을 가지며, 이로 인해 블록체인의 활용처에 관한 연구가 다양하게 이루어지고 있다. 본 논문에서는 공적장부의 하나인 부동산종합공부시스템에 블록체인을 적용하기 위해 고려할 사항들을 도출하고, 이를 바탕으로 블록체인 시스템 구성 방안과 합의 알고리즘을 포함하는 블록체인 참조 모델을 제시한다.

Efficient Parallel Block-layered Nonbinary Quasi-cyclic Low-density Parity-check Decoding on a GPU

  • Thi, Huyen Pham;Lee, Hanho
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제6권3호
    • /
    • pp.210-219
    • /
    • 2017
  • This paper proposes a modified min-max algorithm (MMMA) for nonbinary quasi-cyclic low-density parity-check (NB-QC-LDPC) codes and an efficient parallel block-layered decoder architecture corresponding to the algorithm on a graphics processing unit (GPU) platform. The algorithm removes multiplications over the Galois field (GF) in the merger step to reduce decoding latency without any performance loss. The decoding implementation on a GPU for NB-QC-LDPC codes achieves improvements in both flexibility and scalability. To perform the decoding on the GPU, data and memory structures suitable for parallel computing are designed. The implementation results for NB-QC-LDPC codes over GF(32) and GF(64) demonstrate that the parallel block-layered decoding on a GPU accelerates the decoding process to provide a faster decoding runtime, and obtains a higher coding gain under a low $10^{-10}$ bit error rate and low $10^{-7}$ frame error rate, compared to existing methods.

2-프레임 PTV 시스템의 개발 및 채널유동에의 응용 (Development of 2-frame PTV system and its application to a channel flow)

  • 백승조;이상준
    • 대한기계학회논문집B
    • /
    • 제22권6호
    • /
    • pp.874-887
    • /
    • 1998
  • A 2-frame PTV (particle tracking velocimetry) system using the concept of match probability between two consequent image frames has been developed to obtain instantaneous velocity fields. The overall 2-frame PTV system including image pre-processing, tracking algorithm and post-processing routine was implemented to apply to real flows. The developed 2-frame PTV system has several advantages such as high recovery ratio of velocity vectors, low error ratio and small computational time compared with the conventional 4-frame PTV and the FFT-based cross-correlation PIV technique. The 2-frame PTV system was applied to a turbulent channel flow over a rectangular block to check its reliability and usefulness. Total 96 sequential image frames have been captured and processed to get both mean and fluctuating velocity vector fields over the recirculating region. The mean velocity and turbulent intensity profiles were well agreed with hte LDV measurements in the separated region behind the block. Time-averaged reattachment length is about 6.3 times of the block height.

다중쓰레드 프로그래밍을 위한 분산공유메모리 관리 기법 (Distributed Shared Memory Scheme for Multi-thread programming)

  • 서대화
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.791-802
    • /
    • 1996
  • 본 논문에서는 대규모 다중처리기 시스템에서 다중쓰레드를 지원하는 기법에 관하여 다룬다. 분산공유메로리에서의 주소번역표 관리, 블록 일관성 유지 방법, 그리고 블록 대치 정책에 대하여 쓰레드 프로그래밍 환경에 적합한 새로운 기법을 제안한다. 이 기법은 분산공유메모리에서 일반적으로 발생하는 문제점들인 거짓 공유, 불필요한 중복, 블록 바운싱, 그리고 주소 엘리어싱 등을 효율적으로 해결한다. 그리고 응용프 로그램의 투명성을 제공하고, 시스템의 확장과 구현 용이하도록 해주며, 다중쓰레드 환경을 사용자에서 제공한다.

  • PDF