• 제목/요약/키워드: Parallel algorithm

검색결과 2,008건 처리시간 0.028초

타원곡선 암호시스템을 위한 GF(2$^{m}$ )상의 비트-시리얼 나눗셈기 설계 (Design of a Bit-Serial Divider in GF(2$^{m}$ ) for Elliptic Curve Cryptosystem)

  • 김창훈;홍춘표;김남식;권순학
    • 한국통신학회논문지
    • /
    • 제27권12C호
    • /
    • pp.1288-1298
    • /
    • 2002
  • 타원곡선 암호시스템을 GF(2$^{m}$ )상에서 고속으로 구현하기 위해서는 빠른 나눗셈기가 필요하다. 빠른 나눗셈 연산을 위해선 비트-패러럴 구조가 적합하나 타원곡선 암호시스템이 충분한 안전도를 가지기 위해서는 m의 크기가 최소한 163보다 커야 한다. 즉 비트-패러럴 구조는 0(m$^2$)의 면적 복잡도를 가지기 때문에 이러한 응용에는 적합하지 않다. 따라서, 본 논문에서는 CF(2$^{m}$ )상에서 표준기저 표기법을 사용하여 모듈러 나눗셈 A(x)/B(x) mod G(x)를 고속으로 수행하는 새로운 비트-시리얼 시스톨릭 나눗셈기를 제안한다. 효율적인 나눗셈기 구조를 얻기 위해, 새로운 바이너리 최대공약수(GCD) 알고리즘을 유도하고, 이로부터 자료의존 그래프를 얻은 후, 비트-시리얼 시스톨릭 나눗셈기를 설계한다. 본 논문에서 제안한 나눗셈기는 0(m)의 시간 및 면적 복잡도를 가지며, 연속된 입력 데이터에 대하여, 초기 5m-2 사이클의 지연 후, m 사이클 마다 나눗셈의 결과를 출력한다. 제안된 나눗셈기를 동일한 입출력 구조를 가지는 기존의 연구 결과들과 비교 분석한 결과 칩 면적 및 계산 지연시간 모두에 있어 상당한 개선을 보인다. 따라서 제안된 나눗셈기는 적은 하드웨어를 사용하면서 고속으로 나눗셈 연산을 수행할 수 있기 때문에 타원곡선 암호화시스템의 나눗셈 연산기로 매우 적합하다. 또한 제안한 구조는 기약 다항식(irreducible polynomial) 선택에 있어 어떤 제약도 두지 않고, 단 방향의 신호흐름을 가지면서, 매우 규칙적이기 때문에 필드 크기 m에 대해 높은 유연성 및 확장성을 제공한다.였다. an extraction system, a new optical nonlinear joint transform correlator(NJTC) is introduced to extract the hidden data from a stego image in real-time, in which optical correlation between the stego image and each of the stego keys is performed and from these correlation outputs the hidden data can be asily exacted in real-time. Especially, it is found that the SNRs of the correlation outputs in the proposed optical NJTC-based extraction system has been improved to 7㏈ on average by comparison with those of the conventional JTC system under the condition of having a nonlinear parameter less than k=0.4. This good experimental results might suggest a possibility of implementation of an opto-digital multiple information hiding and real-time extracting system. 촉각에 있는 지각신경세포가 뇌의 촉각엽으로 뻗어 들어가 위의 5가지 신경연접중 어느 형을 형성하는지를 관찰하기 위하여 좌측 촉각의

가변길이 고속 RSA 암호시스템의 설계 및 하드웨어 구현 (Design and Hardware Implementation of High-Speed Variable-Length RSA Cryptosystem)

  • 박진영;서영호;김동욱
    • 한국통신학회논문지
    • /
    • 제27권9C호
    • /
    • pp.861-870
    • /
    • 2002
  • 본 논문에서는 RSA 암호 알고리즘의 연산속도 문제에 초점을 맞추어 동작속도를 향상시키고 가변길이 암호화가 가능하도록 하는 새로운 구조의 1024-비트 RSA 암호시스템을 제안하고 이를 하드웨어로 구현하였다. 제안한 암호시스템은 크게 모듈러 지수승 연산 부분과 모듈러 곱셈 연산 부분으로 구성되었다. 모듈러 지수승 연산은 제곱 연산과 단순 곱셈 연산을 병렬적으로 처리할 수 있는 RL-이진 방법을 개선하여 적용하였다. 그리고 모듈러 곱셈 연산은 가변길이 연산과 부분 곱의 수를 감소하기 위해서 Montgomery 알고리즘에 4 단계 CSA 구조와 기수-4Booth 알고리즘을 적용하였다. 제안한 RSA 암호시스템은 하이닉스 0.35$\mu\textrm{m}$ Phantom Cell Library를 사용하여 하드웨어로 구현하였고 최대 1024-비트까지 가변길이 연산이 가능하였다. 또한 소프트웨어로 RSA 암호시스템을 구현하여 하드웨어 시스템의 검증에 사용하였다. 구현된 하드웨어 RSA 암호시스템은 약 190K의 게이트 수를 나타내었으며, 동작 클록 주기는 150MHz이었다. 모듈러스 수의 가변길이를 고려했을 때, 데이터 출력률은 기존 방법의 약 1.5배에 해당한다. 따라서 본 논문에서 제안한 가변길이 고속 RSA 암호시스템은 고속 처리를 요구하는 각종 정보보호 시스템에서의 사용 가능성을 보여주었다.

16개의 처리기를 가진 다중접근기억장치를 위한 영상처리 알고리즘의 구현에 대한 성능평가 (Performance Analysis of Implementation on Image Processing Algorithm for Multi-Access Memory System Including 16 Processing Elements)

  • 이유진;김재희;박종원
    • 전자공학회논문지CI
    • /
    • 제49권3호
    • /
    • pp.8-14
    • /
    • 2012
  • 최근 3D TV나 영화, 증강현실과 같은 대용량 고화질의 영상 응용분야가 확산됨에 따라 빠른속도로 영상을 처리하는 것이 요구되고 있다. 여러개의 프로세서로 구성되어 병렬처리 성능을 극대화 시킬 수 있는 SIMD구조의 컴퓨터는 다양하고 많은 양의 데이터들을 처리하는 것을 가속화한다. 다중접근기억장치인 MAMS는 여러개의 PE와 고성능 SIMD 구조에 최적화된 시스템으로 MAMS는 메모리 모듈을 $M{\times}N$의 2-D array 개념을 적용하여 X, Y 좌표 및 임의의 간격으로 pq개의 데이터 각각에 수평, 수직, 대각선, 역대각선, 블록의 다양한 방식으로 충돌없이 접근하며, 이 메모리모듈(MM)의 개수 m은 pq 개수보다 큰 소수이다. MAMS-PP4는 4개의 PE와 5개의 MM로 구성되어 기존에 구현된 바 있다. 이 논문에서는 MAMS-PP4의 확장으로 16개의 PE와 17개의 MM으로 구성된 MAMS-PP16에 대한 영상처리 알고리즘의 구현과 그에 따른 성능평가에 대해 소개한다. MAMS-PP16의 인스트럭션 포맷은 64비트로 확장되어 새로 설계 되었으며 특정 어플리케이션의 추가와 새로운 인스트럭션이 포함되어 있다. 본 논문에서는 구현된 알고리즘이 수행될 수 있도록 MAMS-PP16의 시뮬레이터를 개발하였다. 이 시뮬레이터를 통해 구현된 영상처리 알고리즘을 수행함으로서 MAMS-PP16의 성능이 향상되었음을 확인하였다. 영상처리 알고리즘 중 피라미드 기법을 적용하여 수행한 결과, 캐시를 사용하는 Serial processor에서는 랜덤한 응답인 반면, 캐시를 사용하지 않는 MAMS-PP16에서 일정한 응답을 확인하였다.

LASPI: 지원점 보간법을 이용한 H/W 구현에 용이한 스테레오 매칭 방법 (LASPI: Hardware friendly LArge-scale stereo matching using Support Point Interpolation)

  • 박상현;기미레 디팍;김정국;한영기
    • 정보과학회 논문지
    • /
    • 제44권9호
    • /
    • pp.932-945
    • /
    • 2017
  • 논문에서는 정류(Rectification), 디스패리티 추정(Disparity Estimation) 및 시각화를 포함한 스테레오 비전 프로세싱 시스템의 새로운 하드웨어 및 소프트웨어 아키텍처를 개발하였다. 개발된 지원점 보간법을 이용한 대형 스테레오 매칭 방법(LASPI)은 고화질 이미지의 지원점 밀도가 높은 영역에서의 디스패리티 매칭에 있어, ELAS 등 기존 스테레오 매칭 방법과 비교할 때, 디스패리티 맵에 대한 품질 수준을 유지하면서도 실시간 성능 지원 측면에서 우수하다. LASPI는 자율주행 자동차에 적용되는 장애물 인식 시스템, 거리 검출 시스템, 장애물 검출 시스템 등, 안전에 민감한 모듈 적용을 위해, 프레임 처리속도의 실시간성, 거리 값 분해 성능의 정확성, 낮은 리소스 사용 등, 요구조건을 충족하도록 설계 되었다. 개발된 LASPI 알고리즘은 H/W 병렬처리 구조와 4 단계 파이프라인으로 구성된 FPGA로 구현되었다. 148.5MHz 클럭의 Xilinx Virtex-7 FPGA 기반으로 구현된 시스템은 각종 실험을 통해, HD급 이미지 ($1280{\times}720$ 픽셀)에 대해 실차에 응용 가능한 디스패리티 맵을 산출하면서도 실시간 처리 요구 조건인 초당 30 프레임 처리가 가능함을 확인하였다.

R.C 박스거교의 체계신뢰성 해석 및 안전도 평가 (Assessment of System Reliability and Capacity-Rating of Concrete Box-Girder Highway Brdiges)

  • 조효남;신재철
    • 콘크리트학회지
    • /
    • 제7권3호
    • /
    • pp.187-198
    • /
    • 1995
  • 본 연구는 RC 박스거더교 상부구조의 체계신뢰성 해석과 체계신뢰성에 기초한 내하력 평가를 위하여 실용적이고 실제적인 신뢰성 모델 및 방법을 제안하였다. 시스템으로서 교량의 보유내하력을 정확히 예측한다는 것은, 특히 교량이 높은 여용성을 갖고 있고 열화손상이 심각한 경우에는 더욱 어려운 문제이다. 본 연구는 교량의 체계신뢰성에 상응하는 교량시스템강도로서 정의도리 수 잇는 등가의 시스템가동의 항으로 교량의 보유내하력을 평가하는 새로운 접근방법을 제안하였다. 즉, 이 방법은 체계신뢰성지수의 FOSM(Fdirst Order Second Moment)형태에서 유도된 등가시스템저항강도로서 보다 실제적이고 합리적인 극산시스템저항강도 평가방법이다. 본 연구에서 제안된 RC박스거더교를 위한 강도한계상태모형은 휨 및 전단강도에 기초하였다. 그리고 박스거더 상부구조의 체계신뢰성 문제는 주요 파괴 메카니즘이나 각거더의 한계파괴상태에 기초한 FMA(Failure Mode Approach) 로부터 획득한 직-병렬 혼합모델로서 정식화하였다. 제안된 모형의 신뢰성해석에는 AFOSM(Advanced First Order Second Moment) 과 IST(Importance Sampling Technique) 시뮬레이션 알고리즘을 사용하였다.

Voxel 머리팬텀 제작 및 붕소중성자포획요법 선량계산에의 응용 (Construction of voxel head phantom and application to BNCT dose calculation)

  • 이춘식;이춘익;이재기
    • Journal of Radiation Protection and Research
    • /
    • 제26권2호
    • /
    • pp.93-99
    • /
    • 2001
  • 해부학적으로 단순한 수학적인형팬텀의 한계를 극복하기 위한 voxel 머리팬텀을 제작하고 BNCT(Boron Neutron Capture Therapy) 시행 시 선량분포를 계산하였다. 일반목적 몬테칼로 코드인 MCNP4B의 반복구조 알고리즘을 이용하여 voxel 몬테칼로 계산체계를 수립하였고 두 가지 물질로 구성된 예시적 voxel 팬텀과 기하체조합팬텀의 계산값 비교를 통해 계산체계를 검증하였다. 미국 NLM(National Library of Medicine)에서 제공하는 VHP man 인체단층사진에 대한 분할 및 색인작업을 통해 voxel 머리팬텀을 제작하여 AP 및 PA 방향에서 입사하는 넓고 평행한 광자 및 중성자빔에 대한 선량값을 MIRD 팬텀의 계산값과 비교한 결과 중성자빔 AP 방향조사 시 MIRD 팬텀에서는 볼 수 없는 안구로 인한 중성자 감쇠현상을 확인할 수 있었다. 3차원 정밀계산이 필요한 BNCT 시술시 선량분포계산을 위해 뇌 중앙에 직경 5cm의 구형 뇌종양 체적을 정의하고 뇌와 종양의 붕소 함량을 조정하여 10keV 및 40keV 상부입사 중성자에 의한 장기별 흡수선량을 계산한 결과 종양에 $30{\mu}g/g$, 정상세포에 $3{\mu}g/g$의 붕소를 주입한 경우 붕소함량이 없을 때에 비해 2배 가량 큰 선량을 보였다. 본 연구를 통해 voxel몬테칼로기법을 이용한 선량평가체계를 수립하였고 정밀한 선량계산을 필요로 하는 치료방사선분야 선량계산에 실제 인체에 가까운 voxel팬텀의 응용가능성을 제시하였다.

  • PDF

나노 정밀도 스캐닝 용 공기베어링과 보이스 코일 모터의 초정밀 이중 스테이지 설계 및 제어 (Design and Control of Ultra-precision Dual Stage with Air bearings and Voice coil motor for nm scanning system)

  • 김기현;최영만;김정재;이문구;이석원;권대갑
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2005년도 춘계학술대회 논문집
    • /
    • pp.1883-1886
    • /
    • 2005
  • In this paper, a decoupled dual servo (DDS) stage for ultra-precision scanning system with large working range is introduced. In general, dual servo systems consist of a fine stage for short range and a coarse stage for long range. The proposed DDS also consists of a $XY\theta$ fine stage for handling and carrying workpieces and one axis coarse stage. Its coarse stage consists of air bearing guide system and a coreless linear motor with force ripple. The fine has four voice coil motors(VCM) as its actuator. According to a VCM's nature, there are no mechanical connections between coils and magnetic circuits. Moreover, VCM doesn't have force ripples due to imperfections of commutation components of linear motor systems - currents and flux densities. However, due to the VCM's mechanical constraints the working range of the fine is about $25mm^2$. To break that hurdle, the coarse stage with linear motors is used to move the fine about 500mm. Because of the above reasons, the proposed DDS can achieve higher precision scanning than other stages with only one servo. With MATLAB's Sequential Quadratic Programming (SQP), the VCMs are optimally designed for the highest force under conditions and constraints such as thermal dissipations due to its coil, its size, and so on. And for their movements without any frictions, guide systems of the DDS are composed of air bearings. To get precisely their positions, a linear scale with 5nm resolution are used for the coarse stage's motion and three plane mirror laser interferometers with 5nm for the fine's $XY\theta$ motions. With them, on scanning the two stages have same trajectories. The control algorithm is named Parallel method. The embodied ultra-precision scanning system has sub 100nm following error and in-positioning stability.

  • PDF

도로 주행환경 분석을 위한 빅데이터 플랫폼 구축 정보기술 인프라 개발 (Development of Information Technology Infrastructures through Construction of Big Data Platform for Road Driving Environment Analysis)

  • 정인택;정규수
    • 한국산학기술학회논문지
    • /
    • 제19권3호
    • /
    • pp.669-678
    • /
    • 2018
  • 본 연구는 차량센싱데이터, 공공데이터 등 다종의 빅데이터를 활용하여 주행환경 분석 플랫폼 구축을 위한 정보기술 인프라를 개발하였다. 정보기술 인프라는 H/W 기술과 S/W 기술로 구분할 수 있다. 먼저, H/W 기술은 빅데이터 분산 처리를 위한 병렬처리 구조의 소형 플랫폼 서버를 개발하였다. 해당 서버는 1대의 마스터 노드와 9대의 슬래이브 노드로 구성하였으며, H/W 결함에 따른 데이터 유실을 막기 위하여 클러스터 기반 H/W 구성으로 설계하였다. 다음으로 S/W 기술은 빅데이터 수집 및 저장, 가공 및 분석, 정보시각화를 위한 각각의 프로그램을 개발하였다. 수집 S/W의 경우, 실시간 데이터는 카프카와 플럼으로 비실시간 데이터는 스쿱을 이용하여 수집 인터페이스를 개발하였다. 저장 S/W는 데이터의 활용 용도에 따라 하둡 분산파일시스템과 카산드라 DB로 구분하여 저장하는 인터페이스를 개발하였다. 가공 S/W는 그리드 인덱스 기법을 적용하여 수집데이터의 공간 단위 매칭과 시간간격 보간 및 집계를 위한 프로그램을 개발하였다. 분석 S/W는 개발 알고리즘의 탐재 및 평가, 장래 주행환경 예측모형 개발을 위하여 제플린 노트북 기반의 분석 도구를 개발하였다. 마지막으로 정보시각화 S/W는 다양한 주행환경 정보제공 및 시각화를 위하여 지오서버 기반의 웹 GIS 엔진 프로그램을 개발하였다. 성능평가는 개발서버의 메모리 용량과 코어개수에 따른 연산 테스트를 수행하였으며, 타 기관의 클라우드 컴퓨팅과도 연산성능을 비교하였다. 그 결과, 개발 서버에 대한 최적의 익스큐터 개수, 메모리 용량과 코어 개수를 도출하였으며, 개발 서버는 타 시스템 보다 연산성능이 우수한 것으로 나타났다.

다중 GPU 기반의 고속 삼차원 역전사 기법 (Fast Multi-GPU based 3D Backprojection Method)

  • 이병훈;이호;계희원;신영길
    • 한국멀티미디어학회논문지
    • /
    • 제12권2호
    • /
    • pp.209-218
    • /
    • 2009
  • 삼차원 역전사(3D backprojection) 기법은 수백 장의 이차원 투영영상을 가지고 대상물의 공간적인 위치 파악이 가능한 단층 영상(tomography)을 생성하기 위해 사용되는 재구성 기법이다. 재구성 기법은 단층 영상을 구성하는 결과볼륨의 모든 화소로부터 각 화소 위치에 기여할 값을 이차원 투영영상에서 계산하여 얻어오기 때문에 결과볼륨이 커지거나 투영영상의 수가 증가하게 되면 전체 계산량은 상당히 증가하게 된다. 이러한 문제를 해결하기 위해 최근 범용 그래픽스 하드웨어(graphics processing unit: GPU) 기반의 고속 삼차원 재구성 기법이 연구되었으며 상당한 성능 향상을 가져왔다. 본 논문에서는 기존의 단일 GPU 기반의 삼차원 재구성 기법을 다중 GPU기반으로 확장할 때 입력되는 투영영상 크기와 결과볼륨의 크기에 따라서 효율적으로 동작될 수 있는 두 가지 병렬 처리 구현 기법에 대해 제시하고 비교 분석한다. 제안한 병렬 처리 구현 기법은 투영영상을 입력 데이터로 간주하여 각 GPU가 모든 투영영상에 대해서 출력 데이터인 결과볼륨을 분할하여 생성하는 결과볼륨 분할생성 기법과 각 GPU가 투영영상을 분산적재하여 할당받은 입력 데이터에 대한 결과볼륨을 출력한 후 각각의 출력 결과를 CPU에서 합하는 투영영상 분산적재 기법이다. 실험 결과, 결과볼륨의 크기가 GPU에 모두 할당할 수 있는 크기인 경우에는 결과볼륨 분할생성 기법이 더 좋은 성능을 보였고, 결과볼륨의 크기가 GPU 메모리보다 큰 경우에는 투영영상 분산적재 기법이 더 유리하였다.

  • PDF

새로운 비대칭 구조를 갖는 터보부호의 Flattening Effect의 성능향상에 관한 연구 (Performance Improvement of the battening Effect of the new Asymmetric Turbo Codes)

  • 정대호;정성태;김환용
    • 한국통신학회논문지
    • /
    • 제27권6A호
    • /
    • pp.533-539
    • /
    • 2002
  • 터보부호는 반복복호 수와 인터리버 크기가 증가할수록 AWGN 채널환경에서 BER 성능이 향상된다는 것은 잘 알려진 사실이다. 그러나 반복복호 수와 인터리버 크기가 증가하면 상대적으로 복호 과정에서 복호지연과 계산량이 증가하게 된다. 또한 임의의 SM에서는 더 이상 BER 성능의 향상이 없는 flattening effect 현상이 발생하기 때문에 오류정정 능력의 한계에 도달하는 큰 단점을 가진다. 따라서 본 논문에서는 터보부호의 flattening effect 현상을 개선시키기 위해서 두 구성부호기의 구속장 뿐만아니라 생성다항식 자체도 서로 다르게 구성한 새로운 비대칭 구조를 갖는 터보부호를 제안한다. 제안된 비대칭 터보부호는 각각의 구성부호기의 생성다항식을 원시다항식과 소수다항식을 혼합한 형태로 구성하였고 구속장도 서로 다르게 구성하여 다양한 구조와 다양한 유효자유거리(effective free distance)를 갖도록 구성하였다. 제안된 비대칭 터보부호는 부호율이 1/3일 때 log-MAP 복호방법을 이용하여 상대적으로 작은 프레임(128. 256)과 큰 프레임(512, 1024)으로 인터리버 크기를 조절하면서 그 성능을 분석하였다. 모의실험 결과, 기존의 터보부호에 비해서 $10^{-4}$의 BER 영역에서 작은 프레임의 경우에 1.7dB~2.5dB이상의 우수한 성능을 나타냈으며 큰 프레임의 경우에 2.0dB~2.5dB 이상의 우수한 성능을 나타냄을 확인할 수 있었고 flattening effect 현상의 개선효과가 있음을 확인할 수 있었다.