• 제목/요약/키워드: Optimized implementation

검색결과 509건 처리시간 0.026초

라운드 키 선행 로드를 통한 CHAM-64/128 카운터 모드 고속 구현 (High-Speed Implementation to CHAM-64/128 Counter Mode with Round Key Pre-Load Technique)

  • 권혁동;장경배;박재훈;서화정
    • 정보보호학회논문지
    • /
    • 제30권6호
    • /
    • pp.1217-1223
    • /
    • 2020
  • CHAM은 저사양 프로세서를 지원하기 위한 경량 블록암호로, 한국의 국가보안기술연구소에서 개발되었다. 블록암호의 원활한 동작을 위해서는 블록암호 운용 모드를 적용하는데 그 중에서 카운터 모드는 낮은 구현 난이도와 병렬 연산 지원으로 뛰어난 효율을 자랑한다. 본 논문에서는 블록암호 CHAM의 카운터 운영 모드를 최적 구현한 결과물을 제시한다. 제안기법은 사전 연산을 통해 일부 라운드를 생략하는 것으로 기존 CHAM보다 빠른 연산 속도를 가진다. 또한, 라운드 함수 진입 전 라운드 키의 일부를 레지스터에 선행 로드하는 것으로 라운드 함수마다 라운드 키를 로드하는 시간을 160cycles만큼 감소시켰다. 제안하는 기법은 기존 기법에 비해 고정키 시나리오 상에서 6.8%, 가변키 시나리오 상에서 4.5%의 성능 향상이 있었다.

T-table을 사용한 경량 블록 암호 PIPO의 최적화 구현 (Optimized Implementation of Lightweight Block Cipher PIPO Using T-Table)

  • 최민식;김선엽;김인성;신한범;김성겸;홍석희
    • 정보보호학회논문지
    • /
    • 제33권3호
    • /
    • pp.391-399
    • /
    • 2023
  • 본 논문에서는 경량 블록 암호인 PIPO-64/128, 256에 대해 T-table을 사용한 구현을 최초로 제시한다. 제안 방법은 최초 16개의 T-table을 요구하지만, 필요한 두 종류의 T-table이 순환 구조임을 보이고 T-table 개수를 줄여 구현하는 변형 방법을 추가로 제시한다. 제안 방법들의 T-table 수(코드 크기)-속도간 상충관계 분석을 위해 각각 변형 구현물을 Intel Core i7-9700K 프로세서 환경에서 평가한다. 평가를 통해 획득한 속도 최적화 구현은 TLU(Table-Look-Up) 레퍼런스 구현에 비해 PIPO-64/128, 256에서 각각 11.33, 9.31배, 비트 슬라이스(Bit Slice) 레퍼런스 구현에 비해 각각 3.31, 2.76배 향상된 속도를 갖는다.

Energy Efficient and Low-Cost Server Architecture for Hadoop Storage Appliance

  • Choi, Do Young;Oh, Jung Hwan;Kim, Ji Kwang;Lee, Seung Eun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권12호
    • /
    • pp.4648-4663
    • /
    • 2020
  • This paper proposes the Lempel-Ziv 4(LZ4) compression accelerator optimized for scale-out servers in data centers. In order to reduce CPU loads caused by compression, we propose an accelerator solution and implement the accelerator on an Field Programmable Gate Array(FPGA) as heterogeneous computing. The LZ4 compression hardware accelerator is a fully pipelined architecture and applies 16 dictionaries to enhance the parallelism for high throughput compressor. Our hardware accelerator is based on the 20-stage pipeline and dictionary architecture, highly customized to LZ4 compression algorithm and parallel hardware implementation. Proposing dictionary architecture allows achieving high throughput by comparing input sequences in multiple dictionaries simultaneously compared to a single dictionary. The experimental results provide the high throughput with intensively optimized in the FPGA. Additionally, we compare our implementation to CPU implementation results of LZ4 to provide insights on FPGA-based data centers. The proposed accelerator achieves the compression throughput of 639MB/s with fine parallelism to be deployed into scale-out servers. This approach enables the low power Intel Atom processor to realize the Hadoop storage along with the compression accelerator.

상용 FPGA 클러스터 시스템 기반의 최적화된 DES 코어 설계 (Optimized DES Core Implementation for Commercial FPGA Cluster System)

  • 정은구;박일환
    • 정보보호학회논문지
    • /
    • 제21권2호
    • /
    • pp.131-138
    • /
    • 2011
  • 기존의 FPGA기반 DES 전수조사 시스템은 비용대비 높은 성능을 가지고 있으나, 단일 FPGA에서 DES 알고리즘의 최적화 설계에 대한 연구는 미흡하다. 본 논문에서는 77개 Xilinx Virtex5-LX50 FPGA로 구성된 상용 FPGA 클러스터 시스템의 단일 FPGA에 최적화된 하드웨어 DES를 제안한다. 이를 위해서 DES 코어의 파이프라인 수, DES 코어 수, DES 코어의 동작 주파수 등에 따른 설계 공간 탐색을 수행하여 단일 FPGA에 333MHz로 동작하는 16개의 DES 코어를 집적했다. 또한, 각 FPGA에 공급되는 전력의 제한으로 인한 성능 하락을 줄이기 위해서 저전력 설계를 적용하여 333MHz로 동작하는 8개의 DES 코어를 집적했다. 제안된 DES을 상용 시스템에 적용할 경우, 각각 최대 2.03일과 4.06일 안에 DES 키를 찾을 수 있을 것으로 판단된다.

ARM/NEON 프로세서를 활용한 NIST PQC SABER에서 Toom-Cook 알고리즘 최적화 구현 연구 (Optimization Study of Toom-Cook Algorithm in NIST PQC SABER Utilizing ARM/NEON Processor)

  • 송진교;김영범;서석충
    • 정보보호학회논문지
    • /
    • 제31권3호
    • /
    • pp.463-471
    • /
    • 2021
  • NIST(National Institute of Standards and Technology)에서는 2016년부터 양자컴퓨팅 환경을 대비하여 양자내성암호 표준화 사업을 진행하고 있다. 현재 3라운드가 진행 중이며, 대부분 후보자(5/7)는 격자기반 암호이다. 격자기반 암호는 효율적인 연산 처리와 적절한 키 길이를 제공하여 다른 기반의 양자내성 암호보다 리소스가 제한적인 임베디드 환경에서도 적용이 가능하다는 평가를 받고 있다. 그중 SABER KEM은 효율적인 모듈러스와 연산 부하가 큰 다항식 곱셈을 처리하기 위해 Toom-Cook 알고리즘을 제공한다. 본 논문에서는 ARMv8-A 환경에서 ARM/NEON을 활용하여 SABER의 Toom-Cook 알고리즘에서 평가와 보간 과정에 대한 최적화 구현 방법을 소개한다. 평가과정에서는 ARM/NEON의 효율적인 인터리빙 방법을 제안하며, 보간 과정에 서는 다양한 임베디드 환경에서 적용 가능한 최적화된 구현 방법론을 소개한다. 결과적으로 제안하는 구현은 이전 레퍼런스 구현보다 평가과정에서는 약 3.5배 보간과정에서는 약 5배 빠른 성능을 달성하였다.

최적 레이턴시 기반 공정 큐잉 알고리즘의 구현 복잡도 개선 (Improving the Implementation Complexity of the Latency-Optimized Fair Queuing Algorithm)

  • 김태준;서봉수
    • 한국통신학회논문지
    • /
    • 제37권6B호
    • /
    • pp.405-413
    • /
    • 2012
  • 서비스 품질을 보장하기 위해 널리 사용되는 WFQ(Weighted Fair Queuing)는 엄격한 지연한계를 요구하는 저속 트래픽 흐름의 경우 자원 이용도가 아주 나빠지는 구조적인 한계를 갖고 있다. 이러한 WFQ의 문제점은 최적화 되지 않은 트래픽 흐름의 레이턴시에 기인하는 것으로 밝혀졌고, 최적 레이턴시를 실현하여 자원 이용도를 높일 수 있는 LOFQ(Latency-Optimized Fair Queuing) 가 도입되었다. 그러나 LOFQ는 새로운 흐름을 수락할 때마다 모든 흐름에 대해 최적의 레이턴시를 재 설정해야 하므로 흐름 수락시 O($N^2$)의 복잡도를 가져 구현에 어려움이 있다. 본 논문은 이러한 복잡도를 O(1) 수준으로 낮추는 방식을 제안한다. 제안된 방식은 가해진 트래픽 부하의 서비스 품질의 통계적인 특성을 이용하여 최적 레이턴시 지수 함수를 구한 후 이 함수를 이용하여 도착 흐름의 최적 레이턴시 지수를 간단하게 구하는 것이다.

$H_\infty$ 최적제어기의 이산화 구현 (Digital Implementation of $H_\infty$ Optimal Controller)

  • 김광우;오도창;박홍배
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1993년도 한국자동제어학술회의논문집(국내학술편); Seoul National University, Seoul; 20-22 Oct. 1993
    • /
    • pp.471-476
    • /
    • 1993
  • In this paper we proposed the digital implementation of an $H^{\infty}$-optimal controller using lifting technique and $H^{\infty}$-control theory. The discrete controller is obtained through iterative adjustment of sampling time and weighting function, which can ber performed by computing the L$_{2}$-induced input to output norm of the sampled-data system with bandlimited exogenous input. The resulting sampled-data bandlimited exogenous input. The resulting sampled-data system is stable and the performance including inter-sampling behaviour of the hybrid system can be also optimized.d.

  • PDF

Design and Implementation of AI Recommendation Platform for Commercial Services

  • Jong-Eon Lee
    • International journal of advanced smart convergence
    • /
    • 제12권4호
    • /
    • pp.202-207
    • /
    • 2023
  • In this paper, we discuss the design and implementation of a recommendation platform actually built in the field. We survey deep learning-based recommendation models that are effective in reflecting individual user characteristics. The recently proposed RNN-based sequential recommendation models reflect individual user characteristics well. The recommendation platform we proposed has an architecture that can collect, store, and process big data from a company's commercial services. Our recommendation platform provides service providers with intuitive tools to evaluate and apply timely optimized recommendation models. In the model evaluation we performed, RNN-based sequential recommendation models showed high scores.

지도 오픈 API를 활용한 사용자 경험 기반 최적화 이동 경로 탐색 기법의 설계와 구현 (Design and Implementation of Optimized Route Search Technique based on User Experience Using Open APIs)

  • 사공운
    • 한국멀티미디어학회논문지
    • /
    • 제18권5호
    • /
    • pp.682-690
    • /
    • 2015
  • Among location-based systems, a route search service is very highly utilized as a representative technique, but it provides relatively low accuracy when we find a route path on foot in our real environment. In this paper, we design and implement an optimized route search technique based on user experience utilizing open APIs as location-based services. Finally, we develop an Android-based application to provide this feature. In our experiment, we found that our technique enhanced performance by about 14-36% compared to previous solutions, such as route path searches using map APIs. In addition, the performance of our technique can be further enhanced, as the number of users who find such optimized route path is increasing.

자료 및 제어 흐름 정보의 최적화 표현에 관한 연구 (A Study on the Optimized Representation for Data and Control Flow Information)

  • 정성옥;고광만;이성주
    • 한국정보통신학회논문지
    • /
    • 제4권3호
    • /
    • pp.681-687
    • /
    • 2000
  • 최적화란 비효율적인 코드를 구분해 내서 실행 속도 및 기억 공간의 효율성을 높여 주는 방법으로 컴파일러의 각 단계에서 수행된다. Augustus K. Uh떼 의해 제안된 Ideograph는 입력 프로그램에 대한 제어 의존성과 자료 의존성에 관한 정보를 동시에 표현할 수 있어 코드 최적화 단계에서 효과적으로 이용될 수 있으며 프로그램에 존재하는 병렬성을 표현하는데 효과적이다. 구문 트리는 원시 프로그램 정보를 효율적으로 표현할 수 있는 중간 표현으로서 컴파일러 구천에 널리 사용되고 있다. 본 논문에서는 원시 프로그램의 중간 표현인 구문 트리를 입력으로 받아 최적화 정보를 추출한 후 제어 흐름 및 자료 흐름 분석 정보를 추출하여 제어 의존성과 자료 의존성을 Ideouaph에 동시에 표현한다.

  • PDF