• 제목/요약/키워드: 연산지연

검색결과 451건 처리시간 0.032초

GPUDirect RDMA 기반의 고성능 암호 분석 시스템 설계 및 구현 (Design and Implementation of High-Performance Cryptanalysis System Based on GPUDirect RDMA)

  • 이석민;신영주
    • 정보보호학회논문지
    • /
    • 제32권6호
    • /
    • pp.1127-1137
    • /
    • 2022
  • GPU의 병렬 연산을 활용한 암호 분석 및 해독 기술은 암호 분석 시스템의 연산 시간을 단축하는 방향으로 연구되었다. 해당 연구들은 하나의 GPU에서 암호 분석 연산의 속도를 향상시키기 위해 코드를 최적화하거나 또는 단순히 GPU의 수를 늘려 병렬 연산을 강화하는 것에 집중되어 있다. 하지만 다량의 GPU를 데이터 전송에 대한 최적화 없이 사용하는 것은 하나의 GPU를 사용하는 것보다 더 긴 데이터 전송 지연 문제를 발생시키고, 암호 분석 시스템의 전체적인 연산 시간 증가를 야기한다. 이에, 본 논문은 딥러닝 또는 HPC 연구 분야의 GPU Clustering 환경에서 고성능 데이터 처리를 위해 활용되는 GPUDirect RDMA 및 관련 제반 기술들을 조사 및 분석한다. 그리고 해당 기술들을 활용한 고성능 암호 분석 시스템 설계 방법들을 제안한다. 더 나아가, 해당 설계를 기반으로 Password Cracking, GPU Reduction을 활용한 암호 분석 시스템 구현 방법에 대해 제시한다. 최종적으로, GPUDirect RDMA 기술 적용으로 구현된 암호 분석 시스템에 대해서 암호 분석 작업 성능 향상의 실증을 통해 제안한 시스템에 대한 기대효과를 제시한다.

LUR-tree에서 이동체의 지연 다량 삽입 기법 (Lazy Bulk Insertion Method of Moving objects on LUR-tree)

  • 김정현;장용일;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.70-72
    • /
    • 2005
  • 지금까지의 이동체 인덱스에 대한 연구는 주로 인덱스 구성 후에 발생하는 질의 처리 효율성에 두고 있다. 다수의 이동체 인덱스에서 이동체 데이터의 갱신 연산에 의한 인덱스 재구성에 대한 디스크 접근 오버헤드를 고려하지 않았다. 이동체 데이터 처리를 위한 대표적 인덱스 구조인 R-tree는 이동체에 대한 갱신 연산 비용이 많이 든다. 이런 R-tree의 단점을 보완하기 위해 이동체가 가지는 MBR값이 동적으로 변화하는 환경에 맞추어 R트리의 갱신 비용을 절감하여 처리하는 LUR-tree가 제안되었다. 본 논문에서는 마른 데이터 생성 속도에 적합하도록 디스크 접근 오버헤드를 고려해서 LUR-tree를 관리할 수 있는 현재 인덱스에 대한 다량 삽입 기법을 제안한다. 이 기법에서는 다차원 인덱스 구조에서의 다량 삽입 기법을 위한 간단한 버퍼링 기법을 사용한다. LUR-tree의 단말 노드 정보를 관리하는 보조 인덱스를 추가하여 갱신 연산에 따른 노드의 분할과 합병을 예측한다. 예측된 결과를 바탕으로 노드의 변화를 최소화하는 방향으로 데이터의 갱신 순서를 정하여 데이터 갱신에 따른 노드의 분할과 합병을 최소화한다. 실험을 통해 제안한 기법을 이용한 다량 삽입이 기존의 다량 삽입 기법들과 비교해 인덱스의 갱신 비용을 감소시키는 것을 알 수 있다.

  • PDF

PR-Tree: 메인 메모리에서 선반입을 적용한 확장된 R-tree 색인 기법 (PR-Tree: An Extended R-Tree Indexing Method using Prefetching in Main Memory)

  • 강홍구;김동오;홍동숙;한기준
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2003년도 추계학술대회
    • /
    • pp.123-128
    • /
    • 2003
  • 최근 프로세서와 메인 메모리간의 속도 차이가 커지면서 캐시 실패가 메인 메모리에서 동작하는 R-Tree의 성능 저하에 미치는 영향이 커짐에 따라 캐시 실패를 줄여 캐시 성능을 개선하려는 연구가 많이 진행되고 있다. 일반적인 캐시 성능 개선 방법은 엔트리 정보를 줄설 노드에 더 않은 엔트리를 저장함으로써 펜-아웃(fanout)을 증가시키고 캐시 실패를 최소화한다. 그러나 이러한 방법은 엔트리 정보를 줄이는 추가 연산으로 인해 갱신 성능이 떨어지고, 노드간 이동시 발생하는 캐시 실패는 여전히 해결하지 못하고 있다. 본 논문은 이를 해결하기 위해 선반입(prefetching)을 적용한 확장된 R-Tree인 PR-tree(Prefetching R-Tree)를 제안하고 평가하였다 PR-Tree는 펜-아웃을 증가시키고 트리의 높이를 낮추기 위해 실제 캐시 라인의 정수 배인 노드를 생성하고, 선반입을 적용하여 노드 캐시로 인한 메모리 지연을 최소화하였다. 또한 접근할 노드를 선반입하여 노드간 이동시 발생하는 캐시 실패도 최소화하였다. PR-Tree는 실험에서 R-Tree보다 검색 연산에서 최대 38%의 성능 향상을 보였으며, 갱신 연산에서도 최대 30%의 성능 향상을 보였다.

  • PDF

NAF와 타입 II 최적정규기저를 이용한 $GF(2^n)$ 상의 효율적인 지수승 연산 (NAP and Optimal Normal Basis of Type II and Efficient Exponentiation in $GF(2^n)$)

  • 권순학;고병환;구남훈;김창훈
    • 한국통신학회논문지
    • /
    • 제34권1C호
    • /
    • pp.21-27
    • /
    • 2009
  • 지수의 signed digit representation을 사용하여 타입 II 최적정규기저에 의해 결정되는 $GF(2^n)$상의 효율적인 지수승 알고리즘을 제안한다. 제안하는 signed digit representation은 $GF(2^n)$에서 non-adjacent form(NAF)를 사용한다. 일반적으로 signed digit representation은 정규기저가 주어진 경우 사용하기 어렵다. 이는 정규 원소의 역원연산이 상당한 지연시간을 갖기 때문이다. 반면에 signed digit representation은 다항식 기저를 이용한 체에 쉽게 적용가능하다. 하지만 본 논문의 결과는 타입 II 최적정규기저(optimal normal basis, ONB), 라는 특별한 정규 기저가 지수의 signed digit representation을 이용한 효율적인 지수승 연산에 이용될 수 있음을 보인다.

수정된 AUMDF 알고리듬을 이용한 음향 반향 제거 (An Acoustic Echo Cancelling using Modified AUMDF Algorithm)

  • 채상훈;천영호;백홍기
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.537-540
    • /
    • 2000
  • 일반적으로 음향 반향 제거에서 반향의 임펄스 응답이 큰 경우 주파수 영역의 알고리듬은 시간 영역 알고리듬에 비해 긴 임펄스 응답에 따른 많은 계산량과 입력신호의 통계적 특성에 의한 영향을 줄일 수 있다. 그러나 주파수 영역 알고리듬에서는 시간 영역의 신호를 주파수 영역으로 변환시킬 때 필터 차수의 2배의 FFT 연산이 필요하게 되어, 긴 차수로 인한 실행 시간 지연이 발생하고 많은 메모리가 필요하다. 이러한 문제점을 감소시키고 수렴성능을 향상시키기 위한 MDF 알고리듬이 제안되었으나 계산량이 많은 단점이 있고, UMDF와 AUMDF 알고리듬은 계산량은 감소되나 수렴성능이 저하되는 문제점이 있다. 본 논문에서는 기존의 MDF 알고리듬과 거의 동일한 수렴성능을 유지하면서 연산량과 메모리를 줄일 수 있는 수정된 AUMDF 알고리듬을 제안하였으며, 모의 실험을 통해 결과를 확인하였다.

  • PDF

웨이브렛 패킷 필터 뱅크를 이용한 자동차 내부에서의 적응 능동 소음제어 (Adaptive Active Noise Control in a car Using Wavelet Packet Filler Bank)

  • 장재동;깅영중;임묘택
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 제37회 하계학술대회 논문집 D
    • /
    • pp.1753-1754
    • /
    • 2006
  • 이 논문에서는 밀폐된 공간 내에서 발생하는 소음을 줄이기 위해 일종의 능동 소음 제어 방법을 발표한다. 제안된 제어방법은 WPFB(Wavelet Packet Filter Bank)를 이용하여 기존의 FXLMS(Filtered-X Least Mean Square) 알고리즘의 단점인, 소음 제어시스템 내에서의 소음전달의 지연으로 인한 불안정성과, 소음의 급작스런 변화에 대한 응답능력부족을 해소하는 방법이다. 이 시스템의 주요 특성은 소음제어 시스템의 이차경로에 WPFB이 삽입되어 FXLMS 알고리즘에 비해 빠른 연산이 수행된다는 것이다. 다른 말로 하면, WPFB는 병렬연산을 수행한다. 그러면, 적응 알고리즘 내에 있는 필터의 웨이트들이 더 빨리 갱신될 것이다. 또한 WPFB는 뛰어난 분해능을 가지고 있어서 아주 미세한 소음까지도 처리해 낼 수가 있다. 이 제어기법의 효율성은 simulation을 통해 증명될 것이다.

  • PDF

디지털 문서의 메타데이타 관리를 위한 2 버전 래치 기법 (Two Version Latch Algorithm for the Metadata Management in Digital Documents)

  • 좌은희;박석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.30-32
    • /
    • 2000
  • 최근 메타데이타의 주요 논쟁점으로 메타데이타의 표준화 문제가 등장하고 있다. 새로운 표준화 방향으로 인한 메타데이타의 확장성은 기존 메타데이타 관리 기법의 변화를 요구하게 되었다. 즉, 사용자의 질의에 대한 신속한 정보 제공과 동적인 자료의 일관성 있는 저장과 유지방 안을 필요로 한다. 이에 본 논문에서는 디지털 라이브러리 환경에서 메타데이타 속성을 정의하고, 이러한 요구사항을 만족하는 병행수행 제어 기법인 2VL(Two Version using the Latch)을 제안한다. 2VL은 래치를 사용하여 2버전을 유지함으로써 판독과 기록 연산간의 충돌로 인한 지연을 최소화하며 판독 연산에 있어서의 빠른 응답시간과 높은 최근성 반영율을 보인다.

  • PDF

실시간 비디오 통신을 위한 양자화 계수 자동 조절 방법 (Automatic Control of Quantization Parameter for Real-time Video Communication)

  • 정병진;임창훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.217-219
    • /
    • 2011
  • 본 논문은 제한적인 대역폭을 가지는 무선 네트워크 환경에서 실시간 비디오 스트리밍 전송을 위한 양자화 계수 자동 조절 기법을 제안한다. 제안하는 방법은 실시간 비디오 통신을 위하여, 프레임 간 차이 연산을 이용하는 방법이다. 양자화 계수에 따라 화질이 변하는 특성에 기반 하여 프레임 간 차이 연산을 통해 데이터의 변화량을 예측하여 양자화 계수를 조절한다. 실험은 802.11n 무선 네트워크 환경에서 MFC 기반 비디오 영상 통신 모듈을 통해 양자화 계수 자동 조절 기법을 적용하였다. 양자화 계수를 실시간으로 조절하여 네트워크 전송 지연을 사전에 방지하고, 상대적으로 고정된 양자화 계수를 적용하는 비디오 통신 경우에 비하여 비디오 전송에 있어 더 원활한 통신을 가능하게 한다.

  • PDF

접근 빈도에 기반을 둔 SSD에서의 트리 인덱스 개선 (Improving tree index on SSD using access frequency)

  • 최원기;신민철;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.763-766
    • /
    • 2014
  • 플래시 메모리는 입출력 속도가 빠르고 에너지 효율성이 좋지만, out-place update만 가능하며 쓰기 연산을 위한 IO의 지연시간이 읽기 연산보다 현저히 길다는 단점을 가진다. 이를 보완하기 위해 고안된 FlashSSD(Solid State Drive)는 최근 하드 디스크를 대체하는 저장장치로 주목받고 있다. DBMS(Database Management System)의 성능 개선을 위하여 FlashSSD를 활용한 다양한 연구가 진행되었다. 그중 FD-tree를 사용한 인덱스는 좋은 갱신 성능을 보임과 동시에 검색 성능을 보인다. 하지만 FD-tree의 구성 요소 중 하나인 레벨이 하나의 자료구조로만 이루어져 있어 인덱스로서의 비효율성을 가지고 있기 때문에 이를 인덱스의 접근 빈도를 이용하여 개선하고 검색 성능을 높이고자 한다.

고속 RSA 모듈러 곱셈을 위한 시스톨릭 어레이의 설계 (Design of Systolic Array for Fast RSA Modular Multiplication)

  • 강민섭;남승용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.809-812
    • /
    • 2002
  • 본 논문은 RSA 암호시스템에서 고속 모듈러 곱셈을 위한 최적화된 시스톨릭 어레이의 설계를 제안한다. 제안된 방법에서는 미리 계산된 가산결과를 사용하여 개선된 몽고메리 모듈러 곱셈 알고리듬을 제안하고, 고속 모듈러 곱셈을 위한 새로운 구조의 시스톨릭 어레이를 설계한다. 미리 계산된 가산결과를 얻기 위해 CLA(Carry Look-ahead Adder)를 사용하였으며, 이 가산기는 덧셈연산에 있어서 캐리전달 지연이 제거되므로 연산 속도를 향상 시킬 수 있다. 제안된 시스톨릭 구조는VHDL(VHSlC Hardware Description Language)을 사용하여 동작적 수준을 기술하였고, Ultra 10 Workstation 상에서 $Synopsys^{TM}$ 툴을 사용하여 합성 및 시뮬레이션을 수행하였다. 또한, FPGA 구현을 위하여 Altera MaxplusII를 사용하여 타이밍 시뮬레이션을 수행하였고, 실험을 통하여 제안한 방법을 효율성을 확인하였다.

  • PDF