• 제목/요약/키워드: 가속화 알고리즘

검색결과 128건 처리시간 0.026초

모바일 GPU 기반의 고속 3차원 공간 정보 취득 기술

  • 정태현;박준형;박인규
    • 방송과미디어
    • /
    • 제26권4호
    • /
    • pp.48-60
    • /
    • 2021
  • 복잡한 알고리즘을 요구하는 3차원 공간 정보 취득 기술은 대부분 고성능의 하드웨어를 필요로 한다. 그러나 최근 스마트폰과 같은 모바일 플랫폼의 성능이 급격히 발전하면서 기존 알고리즘을 가속화해 온 디바이스로 이식하는 연구가 증가하고 있다. 이러한 추세에 따라 본 기고문은 플랫폼 제한 없는 GPU 병렬처리 프레임워크 OpenCL을 활용한 3차원 공간 정보 취득 기술의 가속화 방법을 소개하고자 한다. 본 고의 구성은 다음과 같다. 먼저 모바일 GPU 환경에서의 OpenCL 최적화 방법을 살펴본다. 이후 고전적인 기하학 기반의 스테레오 정합 알고리즘을 가속화한 방법을 소개한다. 마지막으로는 심층 신경망 네트워크와 가속화된 고전적 스테레오 알고리즘을 결합한 온 디바이스 친화적인 융합 알고리즘을 소개한다.

전달 루틴의 병렬화를 통한 SAT 알고리즘의 GPGPU 가속화 (GPGPU Acceleration of SAT Algorithm with Propagation Routine Parallelization)

  • 강형주
    • 한국정보통신학회논문지
    • /
    • 제20권10호
    • /
    • pp.1919-1926
    • /
    • 2016
  • 대량의 데이터를 병렬적으로 처리할 수 있는 General-Purpose Graphics Processing Unit(GPGPU)가 최근 많은 분야에서 적용되고 있으며, 이는 전자 설계 자동화 분야에서도 예외가 아니다. SAT 알고리즘은 다양한 전자 설계 자동화 문제에 적용되는 대표적인 알고리즘 중 하나이다. GPGPU를 이용해서 SAT 알고리즘을 가속화하기 위해 노력이 이루어져 왔으나, SAT 알고리즘 자체의 특성으로 인해 병렬화에 어려움이 있어왔다. 이 논문에서는 SAT 알고리즘의 내부 과정 중 비교적 병렬화가 용이한 전달 루틴을 병렬화함으로써 GPGPU 가속화를 적용하였다. 전달 루틴이 희소 행렬의 곱셈과 유사한 점에 착안하여 데이터 구조를 구성하고 이에 맞추어서 병렬적인 전달 루틴을 작성하였다. 병렬적으로 동작하는 쓰레드들 사이의 데이터 손실을 방지하기 위해 아토믹(atomic) 연산을 이용하였다. 벤치마크 SAT 문제들에 대해 기존의 GPGPU 기반 SAT solver에 비해 성능이 10배 이상 향상되었음을 확인하였다.

OpenCL을 이용한 지문개선 가속화 (Fingerprint enhancement acceleration using OpenCL)

  • 고성학;이철;박능수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.115-117
    • /
    • 2014
  • 최근 OpenCL, CUDA와 같은 이종 병렬 컴퓨팅 프레임워크가 등장함에 따라, 많은 연산량을 요구하는 알고리즘에 대한 이종 병렬 처리 연구가 늘고 있다. 본 논문에서는 연산량이 많은 지문개선(fingerprint enhancement) 알고리즘을 OpenCL을 이용해 병렬화하고 최적화하여 연산 시간을 단축하고자 한다. 이를 위하여 2차원 FFT 및 필터링 알고리즘을 병렬화하고, Loop Unrolling 및 메모리 접근 최적화 등의 기법을 적용하였다. 실험을 통하여 CPU의 순차적 처리기법과 비교하여 개선된 가속화 기법을 이용한 지문개선 알고리즘이 최대 25배의 성능이 향상하였음을 확인하였다.

근접 치료에서 역방향 치료 계획의 선량분포 계산 가속화 방법 (An Accelerated Approach to Dose Distribution Calculation in Inverse Treatment Planning for Brachytherapy)

  • 조병두
    • 한국방사선학회논문지
    • /
    • 제17권5호
    • /
    • pp.633-640
    • /
    • 2023
  • 최근 근접 치료에서 방사선 차폐막을 사용하여 선량 분포를 변조하여 선량을 전달하는 정적 및 동적 변조 근접 치료 방법이 개발됨에 따라 새로운 방향성 빔 세기 변조 근접 치료에 적합한 역방향 치료 계획 및 치료 계획 최적화 알고리즘에서 선량 계산에 필요한 파라미터 및 데이터의 양이 증가하고 있다. 세기 변조 근접 치료는 방사선의 정확한 선량 전달이 가능하지만, 파라미터와 데이터의 양이 증가하기 때문에 선량 계산에 필요한 경과 시간이 증가한다. 본 연구에서는 선량 계산 경과 시간의 증가를 줄이기 위해 그래픽 카드 기반의 CUDA 가속 선량 계산 알고리즘을 구축하였다. 계산 과정의 가속화 방법은 관심 체적의 시스템 행렬 계산 및 선량 계산의 병렬화를 이용하여 진행하였다. 개발된 알고리즘은 모두 인텔(3.7GHz, 6코어) CPU와 단일 NVIDIA GTX 1080ti 그래픽 카드가 장착된 동일한 컴퓨팅 환경에서 수행하였으며, 선량 계산 시간은 디스크에서 데이터를 불러오고 전처리를 위한 작업 등의 추가 적으로 필요한 시간은 제외하고 선량 계산 시간만 측정하여 평가하였다. 그 결과 가속화된 알고리즘은 CPU로만 계산할 때보다 선량 계산 시간이 약 30배 단축된 것으로 나타났다. 가속화된 선량 계산 알고리즘은 적응방사선치료와 같이 매일 변화되는 어플리케이터의 움직임을 고려하여 새로운 치료 계획을 수립해야 하는 경우나 동적 변조 근접 치료와 같이 선량 계산에 변화되는 파라미터를 고려해야 하는 경우 치료 계획 수립 속도를 높일 수 있을 것으로 판단된다.

가속화된 Lanczos 알고리즘을 이용한 구조물의 고유치 해법 (Eigensolution Method for Structures Using Accelerated Lanczos Algorithm)

  • Kim, Byoung-Wan;Oh, Ju-Won;Lee, In-Won
    • 한국지진공학회:학술대회논문집
    • /
    • 한국지진공학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.364-370
    • /
    • 2002
  • 본 논문에서는 양자물리학 분야에서 Lanczos 방법의 수렴을 가속화하기 위해 개발된 바 있는 행렬의 거듭제곱 기법을 동역학 분야의 Lanczos 순환식에 도입함으로써 구조물의 고유치 해석의 효율성을 향상시켰다 행렬의 거듭제곱 기법을 도입한 Lanczos 방법이 기존의 방법보다 수렴성이 더욱 우수하다. 수치예제를 통해 행렬의 거듭제곱 기법을 도입한 Lanczos 방법의 효율성을 검증하였으며 제안방법을 통한 고유치 해석에 있어서 가장 적합한 거듭제곱값을 제시하였다.

  • PDF

다수 혹은 긴 워드 연산을 위한 레지스터 파일 확장을 통한 대칭 및 비대칭 암호화 알고리즘의 가속화 (Accelerating Symmetric and Asymmetric Cryptographic Algorithms with Register File Extension for Multi-words or Long-word Operation)

  • 이상훈;최린
    • 전자공학회논문지CI
    • /
    • 제43권2호
    • /
    • pp.1-11
    • /
    • 2006
  • 본 연구에서는 대칭 및 비대칭 암호화 알고리즘을 가속화하기 위해, 다수 혹은 긴 워드 연산을 위한 레지스터 파일 확장 구조 (Register File Extension for Multi-words or Long-word Operation: RFEMLO)라는 새로운 레지스터 파일 구조를 제안한다. 암호화 알고리즘은 긴 워드 피연산자에 대한 명령어를 통하여 가속화 할 수 있다는 점에 착안하여, RFEMLO는 하나의 레지스터 명을 통해 여러 개의 레지스터에 접근할 수 있도록 하여 여러 연산자에 대해 동일한 연산을 수행할 수 있도록 하거나, 여러 개의 레지스터를 하나의 데이터로 사용할 수 있게 한다. RFEMLO는 긴 워드 피연산자에 대한 명령어 집합의 추가와 이를 지원하는 기능 유닛을 추가함으로서 범용 프로세서에 적용할 수 있다. 제안된 하드웨어 구조와 명령어 집합의 효율성을 평가하기 위해 Simplescalar/ARM 3.0을 사용하여 대칭 및 비대칭의 다양한 암호화 알고리즘에 적용하였다. 실험 결과, RFEMLO을 적용한 순차적 파이프라인을 가진 프로세서에서 대칭 암호화 알고리즘의 경우 $40%{\sim}160%$의 성능 향상을, 비대칭 암호화 알고리즘의 경우 $150%{\sim}230%$의 높은 성능향상을 얻을 수 있었다. RFEMLO의 적용을 통한 성능 항상은 이슈 폭의 증가를 이용한 슈퍼스칼라 구현에 따른 성능 향상과 비교할 때, 훨씬 적은 하드웨어 비용으로 효과적인 성능 향상을 얻을 수 있음을 확인하였으며 슈퍼스칼라 프로세서에 RFEMLO를 적용하는 경우에도 대칭 암호화 알고리즘에서는 최대 83.6%, 비대칭 암호화 알고리즘에서는 최대 138.6%의 추가적인 성능향상을 얻을 수 있었다.

GPU 를 통한 얼굴인식 가속화 (FAST FACE RECOGNITION ON GPUS)

  • 이청용;이영민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.10-12
    • /
    • 2012
  • 얼굴인식은 보안 등 다수의 응용분야에서 중요하게 이용되는데, 얼굴인식을 위한 학습은 많은 계산시간이 소요되기 때문에 신속한 학습이 필요한 경우 가속화가 필요하다. 한편, 그래픽스 프로세서 유닛(GPU)은 대용량 정보처리를 빠르게 수행할 수 있어 최근 폭넓은 분야에서 널리 이용되고 있다. 본 논문에서는 주성분 기반의 얼굴인식 알고리즘을 GPU 에서 병렬 수행하여 가속하는 기법을 제안하였다. 주성분 기반의 얼굴인식 각각의 과정들의 병렬성을 분석하여 가속화 이득을 최대하였고, C/OpenCV[2]로 구현된 순차적인 버전[3]과 비교했을 때, 전체 학습시스템에서 최대 약 40 배의 성능이득을 얻었다.

AES-NI를 이용한 VPN 암호화 가속화 (Accelerated VPN Encryption using AES-NI)

  • 정진표;황준호;한근희;김석우
    • 정보보호학회논문지
    • /
    • 제24권6호
    • /
    • pp.1065-1078
    • /
    • 2014
  • IPSec 기반의 VPN에서는 데이터의 암호화 안전성 및 성능을 고려하였을 때 대칭키 기반의 AES 알고리즘의 성능이 가장 우수하다고 할 수 있다. 하지만 IPSec 기반 VPN에서 AES 알고리즘을 사용할 때 VPN의 성능은Cavium Networks사의 OCTEON Card 시리즈 같은 고가의 하드웨어 암호화 가속화 카드를 사용해도 동일한 하드웨어를 사용하는 방화벽의 절반의 성능도 내지 못하는 것을 알 수 있다. 2008년 인텔에서는 인텔 CPU에서 AES 알고리즘의 성능을 향상시키기 위해 AES-NI 7개의 명령어 집합을 발표하였다. 본 논문에서는 인텔 CPU의 AES-NI 7개의 명령어 집합을 사용 할 경우 IPSec 기반 VPN에서 실제로 성능이 얼마나 향상되는 지 검증 한다.

전력기술.정보 - 스마트그리드의 기본 구성요소와 신재생에너지원의 연계운전 알고리즘 체계

  • 황우현
    • 전기기술인
    • /
    • 통권337호
    • /
    • pp.21-24
    • /
    • 2010
  • 경제발달로 산업화가 가속화 되면서 대규모 공업단지나 빌딩의 증가로 전력수요가 급격히 늘어남에 따라 더 많은 발전이 필요하게 되었다. 화력발전은 건설기간이 원자력이나 수력에 비해 짧고 운영이 용이한 반면 이산화탄소 배출이 훨씬 많아 지구온난화와 환경문제의 주요인으로 지적되고 있다. 또한 발전은 입지조건상 바닷가부근에서 생산하여 송전선로를 통해 공급하므로 송배전 전력손실이 높아진다. 따라서 화력발전의 비율을 줄이고 전력망의 손실을 감소시키기 위해서는 신재생에너지원과의 연계운전이 중요하다. 이렇게 다양한 전력공급원과 소비의 최적 운전을 위해서는 스마트 그리드의 구성과 운영 기술의 도입이 필요하다. 본 논문에서는 스마트그리드의 기본 구성요소와 신재생에너지원과의 연계운전에 필요한 알고리즘 체계를 제시하고자 한다.

  • PDF

최단경로 탐색을 위한 ACO 알고리즘의 비교 분석 (Analysis on ACO Algorithm for Searching Shortest Path)

  • 최경미;박영호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1354-1356
    • /
    • 2012
  • 최근 ITS(Intelligent Transportation Systems)의 개발과 함께 차량용 내비게이션의 사용이 급증하면서 경로탐색의 중요성이 더욱 가속화되고 있다. 현재 차량용 내비게이션은 멀티미디어 및 정보통신 기술의 결합과 함께 다양한 기능 및 정보를 사용자에게 제공하고 있으며 이러한 기능과 정보를 사용해서 목적지점까지의 최단경로를 탐색하는 것이 내비게이션 시스템의 핵심기능이다. 이러한 경로탐색 알고리즘은 교통시스템, 통신 네트워크, 운송 시스템은 물론 이동 로봇의 경로 설정 등 다양한 분야에 사용되고 있다. 개미 집단 최적화(Ant Colony Optimization, ACO) 알고리즘은 메타 휴리스틱 탐색 방법으로 그리디 탐색(Greedy Search)뿐만 아니라 긍정적 반응의 탐색을 사용한 모집단에 근거한 접근법으로 순환 판매원 문제(Traveling Salesman Problem, TSP)를 풀기 위해 처음으로 제안되었다. 본 논문에서는 개미 집단 최적화(ACO) 알고리즘이 기존의 경로 탐색 알고리즘으로 알려진 Dijkstra 보다 최단경로 탐색에 있어서 더 적합한 알고리즘이라는 것을 설명하고자 한다.