• 제목/요약/키워드: Fast Reduction

검색결과 903건 처리시간 0.03초

3-way Toom-Cook 곱셈 알고리듬과 고속 축약 알고리듬을 이용한 256-비트 모듈러 곱셈기 설계 (A Design of 256-bit Modular Multiplier using 3-way Toom-Cook Multiplication Algorithm and Fast Reduction Algorithm)

  • 양현준;신경욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.223-225
    • /
    • 2021
  • 모듈러 곱셈은 ECC의 점 스칼라 곱셈을 위한 핵심 연산이며, ECC 프로세서의 성능에 영향을 미치는 가장 중요한 요소이다. 본 논문에서는 3-way Toom-Cook 곱셈 알고리듬과 수정된 고속 축약 알고리듬을 적용한 256-비트 모듈러 곱셈기 설계에 대해 기술한다. 90-비트 곱셈기 1개와 264-비트 가산기 3개가 사용되었으며, 하드웨어 크기와 소요 클록 사이클 수 사이의 최적화를 이루었다. Zynq UltraScale+ MPSoC 디바이스에 구현하여 모듈러 곱셈기를 검증하였으며, 모듈러 곱셈 연산에 15 클록 사이클이 소요된다.

  • PDF

Mobile IPv6에서 Fast Handoff기법을 이용한 AAA 인증 성능 향상 방안 (A Method of Performance Improvement for AAA Authentication using Fast Handoff Scheme in Mobile IPv6)

  • 김창남;문영성;허의남
    • 한국정보과학회논문지:정보통신
    • /
    • 제31권6호
    • /
    • pp.566-572
    • /
    • 2004
  • 본 논문에서는 이동노드의 글로벌 이동성을 제공하기 위한 방법으로 AAA(Authentication, Authorization and Account) 서비스 기반의 보안 인증 모델을 정의하고 AAA 인증 절차에서 발생하는 서비스 지연 시간을 최소화하기 위해 Mobile IP 작업 그룹에서 정의하고 있는 Fast Handoff를 적용하였다. 즉, 이동노드의 로밍이 발생하는 경우 Fast Handoff 절차가 진행되면서 동시에 AAA 인증 절차를 수 행함으로써 이동노드 인증 시간을 줄이고 신속한 로밍 및 서비스 제공이 가능하도록 하였다. IPsec (Internet Protocol Security), RR(Return Routability), AAA를 기반으로 한 기존의 방식들은 이동노드의 Layer2 Handoff가 성공적으로 처리된 후에 발생하는 인증 절차를 정의하고 있는데 이 절차가 수행되는 동안은 이동 노드의 서비스가 지연되므로 실시간, 고품질의 서비스를 만족하기 위해서는 이를 줄일 수 있는 방안이 연구되어야 한다. 본 논문에서 제안한 방법은 이러한 목적을 만족하기 위한 것으로써 제안된 방식을 사용했을 때 Layer2 Handoff 전에 이동 노드가 FBACK(Fast Binding Acknowledge) 메시지를 받은 경우 최대 55%, 받지 못한 경우 최대 17%의 성능 향상을 보인다.

실시간 시스템에서의 플래시 메모리 저장 장치를 위한 적응적 가비지 컬렉션 정책 (A Adaptive Garbage Collection Policy for Flash-Memory Storage System in Embedded Systems)

  • 박송화;이정훈;이원오;김희언
    • 대한임베디드공학회논문지
    • /
    • 제12권3호
    • /
    • pp.121-130
    • /
    • 2017
  • NAND flash memory has advantages of non-volatility, little power consumption and fast access time. However, it suffers from inability that does not provide to update-in-place and the erase cycle is limited. Moreover, the unit of read/write operation is a page and the unit of erase operation is a block. Therefore, erase operation is slower than other operations. The AGC, the proposed garbage collection policy focuses on not only garbage collection time reduction for real-time guarantee but also wear-leveling for a flash memory lifetime. In order to achieve above goals, we define three garbage collection operating modes: Fast Mode, Smart Mode, and Wear-leveling Mode. The proposed policy decides the garbage collection mode depending on system CPU usage rate. Fast Mode selects the dirtiest block as victim block to minimize the erase operation time. However, Smart Mode selects the victim block by reflecting the invalid page number and block erase count to minimizing the erase operation time and deviation of block erase count. Wear-leveling Mode operates similar to Smart Mode and it makes groups and relocates the pages which has the similar update time. We implemented the proposed policy and measured the performance compare with the existing policies. Simulation results show that the proposed policy performs better than Cost-benefit policy with the 55% reduction in the operation time. Also, it performs better than Greedy policy with the 87% reduction in the deviation of erase count. Most of all, the proposed policy works adaptively according to the CPU usage rate, and guarantees the real-time performance of the system.

A REVIEW ON REDUCTION IN FINITE ELEMENT ANALYSIS

  • Kim, Ki-Ook;Park, Young-Jae
    • Journal of Theoretical and Applied Mechanics
    • /
    • 제3권1호
    • /
    • pp.1-15
    • /
    • 2002
  • Reduction methods for large structural systems have been reviewed. Mai emphasis is put on the dynamic reduction. Recently, the computing resources and technologies have been expanded so fast that the huge matrices Invoked In the analysis of structural system can be processed without serious difficulties. For most users, however, the computer facilities are limited and the system reductions in some forms are required. The reduction procedure in static problems is simple and straightforward. The major task is the book-keeping in computations. In dynamic problems and structural optimization. however. the problem is much more complicated. The problem is, in general, nonlinear and hence the exact solution is not available. Therefore, approximate solutions are sought in an iterative manner. A proper convergence criterion needs to be employed in order to get an accurate solution efficiently. Several research works have been reported fer the structural optimization combined with system reductions.

  • PDF

OFDM 신호의 PAPR 감소를 위한 SLM-PRSC 결합 기법 (An SLM-PRSC Hybrid Scheme for PAPR Reduction of OFDM Signals)

  • 양석철;한승우;신요안
    • 한국통신학회논문지
    • /
    • 제32권6C호
    • /
    • pp.565-571
    • /
    • 2007
  • 본 논문에서는 OFDM (Orthogonal Frequency Division Multiplexing) 신호의 PAPR (Peak-to-Average Power Ratio) 감소를 위한 기존 SLM (SeLective Mapping) 방식의 성능을 개선하는 효과적인 SLM-PRSC 결합 기법을 제안한다. 제안 기법에서는 지정된 PRSC (PAPR Reduction Sub-Carrier) 위치를 제외한 주파수 영역 OFDM 심벌에 대해 SLM을 수행한 후, 그 결과들을 시간 영역 PRSC 시퀀스들과 결합하여 가장 낮은 PAPR을 갖는 SLM-PRSC 결합 시퀀스를 최종 OFDM 심벌로 결정하게 된다. 특히 매 OFDM 심벌마다 미리 준비된 동일한 시간 영역 PRSC 시퀀스를 이용하게 되어 IFFT (Inverse Fast Fourier Transform) 연산 횟수의 증가를 방지할 수 있을 뿐만 아니라, 선택된 주파수 영역 PRSC 심벌은 SLM용 오버헤드로 사용 가능하다. 모의실험 결과, 제안된 SLM-PRSC 결합 기법은 기존의 SLM 방식과 비교하여 과도한 IFFT 연산 횟수의 증가와 별도의 오버헤드가 요구되지 않음에도 불구하고 PAPR 감소 성능을 크게 향상 시킬 수 있음을 확인하였다.

Proxy Mobile IPv6 네트워크에서 Fast Handover 기법 설계 (Design of Fast Handover Mechanism in Proxy Mobile IPv6 Networks)

  • 박병주;한연희;김봉기
    • 한국정보과학회논문지:정보통신
    • /
    • 제35권4호
    • /
    • pp.301-310
    • /
    • 2008
  • 기존의 MIPv6는 오랜 시간동안의 핸드오버로 인하여 많은 패킷 손실 및 오랜 세션 단절을 야기시킨다. 이러한 문제점들을 향상시키기 위하여 Fast handover for Mobile IPv6(FMIPv6) 프로토콜이 개발되었지만 여전히 터널링에 기반한 라우팅 방법은 패킷 순서 어긋남 문제로 인하여 성능이 하락하는 문제를 야기한다. 최근 모바일 단말에서의 이동성 관리 부하를 줄여주기 위하여, 네트워크 이동성 기반인 Proxy Mobile IPv6(PMIPv6)가 제안되었다. PMIPv6는 모바일 단말에서 수행하던 이동성 관리를 네트워크 에이전트에서 해줌으로서 단말의 부하를 줄이고 이동성 관리 지연 시간을 줄일 수 있다. 본 논문에서는 PMIPv6에서 안정되고 향상된 최적화 라우팅 기술이 접목된 빠른 핸드오버 방법인 Fast Proxy Mobile IPv6(EF-PMIPv6) 제안한다. 제안한 EF-PMIPv6는 고속의 IAPP 기술 및 ND 기법을 이용하여 기존의 MIPv6와 PMIPv6 기법에 비하여 고속의 핸드오버를 지원해 줄 수 있다. 또한 수식분석을 통하여 제안한 방법의 향상된 점을 보여준다. 분석에 있어서는 다양한 파라미터들을 이용하여 제안한 방법과 기존의 방법들에 있어서 핸드오버 지연시간을 비교하였다.

Fast CU Encoding Schemes Based on Merge Mode and Motion Estimation for HEVC Inter Prediction

  • Wu, Jinfu;Guo, Baolong;Hou, Jie;Yan, Yunyi;Jiang, Jie
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권3호
    • /
    • pp.1195-1211
    • /
    • 2016
  • The emerging video coding standard High Efficiency Video Coding (HEVC) has shown almost 40% bit-rate reduction over the state-of-the-art Advanced Video Coding (AVC) standard but at about 40% computational complexity overhead. The main reason for HEVC computational complexity is the inter prediction that accounts for 60%-70% of the whole encoding time. In this paper, we propose several fast coding unit (CU) encoding schemes based on the Merge mode and motion estimation information to reduce the computational complexity caused by the HEVC inter prediction. Firstly, an early Merge mode decision method based on motion estimation (EMD) is proposed for each CU size. Then, a Merge mode based early termination method (MET) is developed to determine the CU size at an early stage. To provide a better balance between computational complexity and coding efficiency, several fast CU encoding schemes are surveyed according to the rate-distortion-complexity characteristics of EMD and MET methods as a function of CU sizes. These fast CU encoding schemes can be seamlessly incorporated in the existing control structures of the HEVC encoder without limiting its potential parallelization and hardware acceleration. Experimental results demonstrate that the proposed schemes achieve 19%-46% computational complexity reduction over the HEVC test model reference software, HM 16.4, at a cost of 0.2%-2.4% bit-rate increases under the random access coding configuration. The respective values under the low-delay B coding configuration are 17%-43% and 0.1%-1.2%.

웨이브렛 기반 블록화 현상 제거에 대한 고속 알고리듬 및 적응 역치화 기법 (A Fast Algorithm with Adaptive Thresholding for Wavelet Transform Based Blocking Artifact Reduction)

  • 장익훈;김남철
    • 방송공학회논문지
    • /
    • 제2권1호
    • /
    • pp.45-55
    • /
    • 1997
  • 본 논문에서는 웨이브렛 기반 블록화 현상 제거에 대한 고속 알고리듬과 적응 역치화 기법을 제안하였다. 제안된 고속 알고리듬에서는 웨이브렛 변환 영역의 첫번째 스케일과 2번째 스케일에서의 처리와 동일한 효과를 갖는 모든 처리를 공간 영역에서 수행한다. 제안된 적응 역치화 기법은 블록 경계 영역을 분류할 때 사용하는 역치를 공간 영역에서 구할 수 있는 블록 경계와 블록 중앙의 웨이브렛 변환 신호의 통계적 특성을 이용하여 처리하고자 하는 영상에 적응적으로 선택할 수 있도록 하였다. 실험 결과, 제안된 고속 알고리듬은 웨이브렛 변환에 의한 방법에 비하여 약 10배의 속도 개선이 있고, 적응 역치화에 의한 후처리는 어떤 영상의 높은 압축률에서 가장 좋은 성능을 가지는 고정된 역치에 의한 후처리에 비하여 낮은 압축률에서도 PSNR 성능과 주관적 화질이 개선됨을 알 수 있었다.

  • PDF

270 MHz Full HD H.264/AVC High Profile Encoder with Shared Multibank Memory-Based Fast Motion Estimation

  • Lee, Suk-Ho;Park, Seong-Mo;Park, Jong-Won
    • ETRI Journal
    • /
    • 제31권6호
    • /
    • pp.784-794
    • /
    • 2009
  • We present a full HD (1080p) H.264/AVC High Profile hardware encoder based on fast motion estimation (ME). Most processing cycles are occupied with ME and use external memory access to fetch samples, which degrades the performance of the encoder. A novel approach to fast ME which uses shared multibank memory can solve these problems. The proposed pixel subsampling ME algorithm is suitable for fast motion vector searches for high-quality resolution images. The proposed algorithm achieves an 87.5% reduction of computational complexity compared with the full search algorithm in the JM reference software, while sustaining the video quality without any conspicuous PSNR loss. The usage amount of shared multibank memory between the coarse ME and fine ME blocks is 93.6%, which saves external memory access cycles and speeds up ME. It is feasible to perform the algorithm at a 270 MHz clock speed for 30 frame/s real-time full HD encoding. Its total gate count is 872k, and internal SRAM size is 41.8 kB.

OFDM-CDMA 시스템에서 부분병렬환을 이용한 PAPR 감쇄기법 (Peak-to-Average Power Ratio Reduction by Partial Parallel Transform in an OFDM-CDMA System)

  • 주양익
    • 한국통신학회논문지
    • /
    • 제25권10A호
    • /
    • pp.1548-1553
    • /
    • 2000
  • In this paper, an effective peak power reduction scheme for a downlink OFDM-CDMA system is proposed. Using the partial parallel transform(PPT) structure, peak-to-average power ratio(PAPR) can be reduced. The patterns of inputs of Inverse Fast Fourier Transform(IFFT) are more randomized in this structure by allotting the subcarriers to each users. At the cost of complexity we can obtain reduced PAPR and multiple access interference(MA) Computer simulations are carried out from the viewpoint of PAPR and demonstrated the improved PAPR performance.

  • PDF