• 제목/요약/키워드: block processing

검색결과 1,476건 처리시간 0.026초

Twofish 암호알고리즘의 처리속도 향상을 위한 MDS 성능개선에 관한 연구 (A Study on the MDS performance improvement for Twofish cryptographic algorithm speed-up)

  • 이선근;김환용
    • 대한전자공학회논문지SD
    • /
    • 제42권10호
    • /
    • pp.35-38
    • /
    • 2005
  • 본 논문은 Rijndael 암호알고리즘에 비하여 알고리즘 자체가 간결하며 구현의 용이성이 좋지만 처리속도가 느린 단점을 가진 Twofish 암호알고리즘의 속도를 향상시키기 위하여 MDS 블록을 새롭게 설계하였다. 설계된 MDS 블록은 Twofish 암호 시스템의 critical path를 점유하게 되는 블록으로서 처리과정중의 병목현상으로 인한 속도저하의 문제점이 존재하였다. 이러한 MDS 블록에서 연산자로 사용되는 곱셈연산을 LUT 연산과 modulo-2 연산을 사용하여 MDS 자체에 대한 속도저하 및 병목현상을 제거하였다. 이러한 결과로 새롭게 설계된 MDS 블록을 포함하는 Twofish 암호시스템은 기존 Twofish 암호시스템에 비하여 $10\%$정도 처리속도의 향상을 가져옴을 확인하였다.

멀티미디어 응용을 위한 얼굴 인식시스템 (Face Recognition System for Multimedia Application)

  • 박상규;성현경;한영환
    • 전기전자학회논문지
    • /
    • 제6권2호
    • /
    • pp.152-160
    • /
    • 2002
  • 본 논문에서는 멀티미디어 환경을 위한 얼굴 인식 시스템을 구현하였다. 본 얼굴 인식 시스템에서는 얼굴 영역을 선정하고 출력하는 처리시간의 단축과 인식률 향상을 위한 설계에 중점을 두었다. 전형적인 RGB 색상체계를 변형 없이 사용함으로써 색상체계 변환에 필요한 시간을 감소시켰으며, 얼굴 특성을 이용한 알고리즘과 신경망 기법을 활용하여 인식률을 향상시켰다. 본 시스템은 입력된 영상을 모자이크화 시킨 후 모자이크 블록의 색상 분석을 통하여 얼굴 색상 후보 블록을 선정하고, 얼굴이 가지는 특성을 활용하여 잘못 검색된 얼굴 색상 후보 블록을 제거한다 잘못 검색된 얼굴 색상 후보 블록이 제거된 모자이크 블록 영역에서 신경망의 입력으로 사용될 4가지 특성 값을 산출하여 오류 역전파 학습과정을 거친 신경망에서 처리한 후 그 출력 값을 가지고 얼굴 영역의 진위 여부를 판단하게 된다. 본 논문에서 구현된 시스템은 복수의 인원이 포함된 10장의 입력영상을 사용하여 실험한 결과 0.1초미만의 처리시간 내에 90%의 얼굴 인식률을 보여주었다. 이 결과는 멀티미디어 동영상의 응용을 위한 얼굴인식 시스템으로 충분히 이용될 수 있을 것이다.

  • PDF

64-비트 프로세서에서 AES 고속 구현 (High Speed AES Implementation on 64 bits Processors)

  • 정창호;박일환
    • 정보보호학회논문지
    • /
    • 제18권6A호
    • /
    • pp.51-61
    • /
    • 2008
  • 본 논문은 최근 많이 사용되는 64-비트 프로세서인 Intel Core2 프로세서와 AMD Athlon64 프로세서에서 AES 알고리즘을 고속 구현하는 기법을 제시한다. 먼저 EM64T 아키텍처의 Core2 프로세서는 메모리 접근 명령어 처리 효율이 연산 명령어 처리 효율보다 떨어진다. 때문에 메모리 접근 명령어의 비율이 높게 구성된 기존 AES 구현기법은 메모리 병목현상이 발생된다. 이에 메모리 접근 명령어 비율을 낮춘 부분 라운드키 기법을 제시한다. ECB 모드로 구현한 결과 Core2Duo 3.0 Ghz 프로세서에서 185 cycles/block, 2.0 Gbps의 성능을 보여주었다. 이 결과는 가장 빠르다고 알려진 bernstein 코드보다 35 cycles/block 빠르다. 한편 AMD64 아키텍처의 Athlon64 프로세서에서는 명령어 디코딩 과정에서 발생하는 병목현상을 제거하므로써 속도를 향상시켰다. 그 결과 Athlon64 프로세서에서 170 cycles/block의 성능을 나타났다. 이는 가장 빠르다고 알려진 Matsui의 비공개 코드와 성능이 동일하다.

SimTBS: GPGPU 스레드블록 스케줄링 시뮬레이터 (SimTBS: Simulator For GPGPU Thread Block Scheduling)

  • 조경운;반효경
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권4호
    • /
    • pp.87-92
    • /
    • 2020
  • GPGPU(General-Purpose GPU)는 수만 단위의 스레드들을 병렬적으로 수행하여 성능을 최대화시킬 수 있지만, 실질적으로는 스레드들을 그룹화하여 스레드블록(Thread Block) 단위로 작업을 정의하고 GPGPU 하드웨어 자원의 할당 단위로 활용한다. 이러한 역할을 담당하는 스레드블록 스케줄러는 GPGPU내에 하드웨어적으로 구현되어 있으며, 스레드블록들을 하드웨어 자원들에게 라운드로빈 방식으로 할당한다. 그런데, 라운드로빈 정책은 단순 순차 할당 방식으로서 GPGPU 하드웨어 자원의 활용도에 최적화되어 있지 않다. 본 논문에서는 다양한 스레드블록 스케줄링 방식의 성능을 정량적으로 분석할 수 있는 스레드블록 스케줄러 모델을 제안하고, 구현된 시뮬레이터의 성능 결과를 통해 기존 GPGPU의 스레드블록 스케줄링 방식이 작업 부하가 높은 경우에는 적합하지 않음을 보이고자 한다.

AR/VR 마이크로 디스플레이 환경을 고려한 JPEG-LS 플랫폼 개발 (A Development of JPEG-LS Platform for Mirco Display Environment in AR/VR Device.)

  • 박현문;장영종;김병수;황태호
    • 한국전자통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.417-424
    • /
    • 2019
  • AR/VR 디바이스에서 무손실 이미지 압축을 위한 JPEG-LS(: LosSless) 코덱에서 SBT 기반 프레임 압축기술로 메모리와 지연을 줄이는 설계를 제안하였다. 제안된 JPEG 무손실 코덱은 주로 콘텍스트 모형화 및 업데이트, 픽셀과 오류 예측 그리고 메모리 블록으로 구성된다. 모든 블록은 실시간 영상처리를 위해 파이프라인 구조를 가지며, LOCO-I 압축 알고리즘에 SBT 코딩기반의 개선된 2차원 접근방식을 사용한다. 제시한 STB-FLC기법을 통해 Block-RAM 사이즈를 기존 유사연구보다 1/3로 줄이고 예측(prediction) 블록의 병렬 설계는 처리속도에 향상을 가져올 수 있었다.

완전탐색 블럭정합 알고리즘의 고속 처리를 위한 VLSI 어레이 프로세서의 구조 (A VLSI Array Processor Architecture for High-Speed Processing of Full Search Block Matching Algorithm)

  • 이수진;우종호
    • 한국통신학회논문지
    • /
    • 제27권4A호
    • /
    • pp.364-370
    • /
    • 2002
  • 본 논문에서는 완전탐색 블럭정합 알고리즘의 고속처리를 위한 VLSI 어레이 프로세서의 구조를 제안한다. 완전 탐색 블록정합 알고리즘으로부터 인덱스 공간을 확장한 단일할당코드를 변환 후, 이것으로부터 데이터의존그래프를 구하고, 최적의 방향으로 투영시켜 신호흐름그래프를 얻는다. 신호흐름그래프에 시간 및 공간적인 지역성을 추가하여 이차원 VLSI 어레이를 구하였다. 탐색영역의 후보블럭이 행과 열로 중첩되므로, 중복되는 데이터를 재사용해서 데이터 임력횟수를 줄이고 처리 속도를 향상시켰다. 블럭의 크기가 N이고 최대탐색거리가 p인 경우, 제안한 VLSI 어레이의 처리요소는 ($N_2$+1)$\times$(2p+1)개이고, 입력포트는 (N+2p)개이다. 첫 번째 기준블럭에 대한 이동벡터를 구하는 시간은 ($N_2$+2(p+1)N+6p)이고, 매 (3N+4p-1) 단위시간마다 다음 기준 블럭에 대한 이동벡터가 구해진다.

PS-Block 구조를 사용한 PS-Block Timing Model의 설계 및 구현 (Design and Implementation of PS-Block Timing Model Using PS-Block Structue)

  • 김윤관;신원;장천현;김태완
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.399-404
    • /
    • 2006
  • 실시간 시스템은 소형 임베디드 시스템부터 대형 분산 시스템까지 다양한 시스템에서 사용되고 있다. 이러한 실시간 시스템은 시간적 정확성을 갖기 때문에 프로그램을 개발할 때 시간적 특성을 지키기 위한 노력이 필요하다. 실시간 시스템에 대한 연구 결과로서 제안된 TMO 모델은 실시간 개념에 따른 다양한 시간 처리 기능을 지원하고, 개발자가 정의한 응답시간을 보장한다. 따라서 개발자는 응답시간을 정의하고, 그 정확성을 확인하기 위한 기준점이 필요하다. 이를 위해 TMO 정적 분석 도구의 기반 구조로서 개선된 PS-Block을 설계하였다. 기존의 PS-Block은 블록을 중복 생성하는 구성 정책으로 부하가 생기는 문제점이 발생한다. 이에 본 논문에서는 블록의 중복으로 인한 부하문제를 개선하고, 탐색을 위한 베이스 클래스를 정의하여 PS-Block Timing Model을 구현하였다. 개선된 PS-Block 구조를 사용한 PS-Block Timing Model은 프로그램을 PS-Block 구성 정책에 따라 실행시간을 분석할 수 있는 기반을 제공하고 시간 정보 결정의 기준을 제공한다. 이를 통해 실시간 메소드의 적시성을 쉽게 확인하여 신뢰성을 향상시키고, 개발 기간을 단축할 수 있다.

Fast Binary Block Inverse Jacket Transform

  • Lee Moon-Ho;Zhang Xiao-Dong;Pokhrel Subash Shree;Choe Chang-Hui;Hwang Gi-Yean
    • Journal of electromagnetic engineering and science
    • /
    • 제6권4호
    • /
    • pp.244-252
    • /
    • 2006
  • A block Jacket transform and. its block inverse Jacket transformn have recently been reported in the paper 'Fast block inverse Jacket transform'. But the multiplication of the block Jacket transform and the corresponding block inverse Jacket transform is not equal to the identity transform, which does not conform to the mathematical rule. In this paper, new binary block Jacket transforms and the corresponding binary block inverse Jacket transforms of orders $N=2^k,\;3^k\;and\;5^k$ for integer values k are proposed and the mathematical proofs are also presented. With the aid of the Kronecker product of the lower order Jacket matrix and the identity matrix, the fast algorithms for realizing these transforms are obtained. Due to the simple inverse, fast algorithm and prime based $P^k$ order of proposed binary block inverse Jacket transform, it can be applied in communications such as space time block code design, signal processing, LDPC coding and information theory. Application of circular permutation matrix(CPM) binary low density quasi block Jacket matrix is also introduced in this paper which is useful in coding theory.

유효계수 트리의 절대치를 이용한 웨이브릿 변화 영역에서의 프랙탈 영상 압축 (Fractal Image Coding in Wavelet Transform Domain Using Absolute Values of Significant Coefficient Trees)

  • 배성호;김현순
    • 한국정보처리학회논문지
    • /
    • 제5권4호
    • /
    • pp.1048-1056
    • /
    • 1998
  • 본 논문에서는 낮은 비트율에서 PSNR을 향상시키고 부호화 과정에서의 계산의 복잡성을 감소시키기 위한 이산 웨이브릿 변혼 영역에서의 프랙탈 영상 압축 방법을 제안한다. 제안한 방법에서는 이산 웨이브릿 변환 계수에 절대치를 취한 다음 유효계수의 위치와 부호를 나타내는 유효계수 트리를 구성한다. 제안한 방법은 치역 블록의 유효계수에 대해서만 축소된 정의역 블록의 계수와 정합함으로써 PSNR을 향상시키고 정의역 블록의 집합에서 치역 블록으로의 정합에 필요한 계산의 복잡성을 감소시킨다. 또한 본 논문에서는 치역 블록과 정합되는 축소된 정의역 블록의 수를 최소화하는 분류 방법을 제안한다. 제안한 방법은 치역 블록과 축소된 정의역 블록의 비교 회수를 현저하게 감소시킨다.

  • PDF

선체의 태양복사 열변형 해석을 위한 전처리시스템 (A System for Thermal Distortion Analysis of Hull Structures by Solar Radiation)

  • 하윤석;이동훈
    • 대한조선학회논문집
    • /
    • 제53권4호
    • /
    • pp.275-281
    • /
    • 2016
  • One of the most important things for quality to meet ship-production schedule is an accuracy control. A ship is assembled by welding through whole production process, so it is important that loss by correction will not happen as much as possible by using some engineering skills like reverse design, reverse setting and margin for thermal shrinkage. These efforts are a quite effective in fabrication stages, but not in erection stages. If a ship block which consists of common steel is exposed to directional solar radiation, its dimensional accuracy will change high as time by its thermal expansion coefficient. Therefore, the measuring work would be often done at dawn or evening even with having a very accurate device. In this study, an FE analysis method is developed to solve this problem. It can change measured data affected by solar thermal distortion to ones not, even though ship-block is measured at an arbitrary time. It will use the time when measuring, the direction of block and the weather record by satellites. It is confirmed by a comparison between measured data of a ship-block and the result by suggested analysis method. Furthermore, a pre-processing system is also developed for fast application of the suggested analysis method.