• 제목/요약/키워드: 가속화 알고리즘

검색결과 128건 처리시간 0.018초

HW/SW Co-design of a Visual Driver Drowsiness Detection System

  • Lai, Kok Choong;Wong, M.L. Dennis;Islam, Syed Zahidul
    • 중소기업융합학회논문지
    • /
    • 제3권1호
    • /
    • pp.31-41
    • /
    • 2013
  • 치명적인 사고를 막기 위해 드라이버 졸음 (DD)를 검출하는 다양한 최근 방법이 제안되고있다. 본 논문은 운전자의 눈에 폐쇄 속도를 모니터링 할 수 있는 기능을 AdaBoost 기반 물체 검출 알고리즘에 적용한 DD 탐지 시스템 구현에서 하드웨어/소프트웨어 공동 설계 방법을 제안한다. 소프트웨어 구성 요소는 DD 검출 알고리즘 중에서 필요한 기능성을 완전하게 달성하기 위해 전체적인 제어 및 논리 연산을 구현한다. 반면, 본 연구에서는 DD 검출 알고리즘의 중요한 기능은 처리를 가속화하기 위해 맞춤형 하드웨어 구성 요소를 통해 가속된다. 하드웨어/소프트웨어 아키텍처는 비디오 도터 보드와 알테라 DE2 보드에 구현되었습니다. 제안 된 구현의 성능을 평가하고 몇 가지 최근의 작품을 벤치마킹했다.

  • PDF

밉맵기반 레이 마칭과 디노이징을 이용한 간접조명 알고리즘 (Indirect Illumination Algorithm with Mipmap-based Ray Marching and Denoising)

  • 장파;오경수
    • 한국게임학회 논문지
    • /
    • 제20권3호
    • /
    • pp.75-84
    • /
    • 2020
  • 본 논문은 가시성 테스트를 고려한 실시간 원 바운스(One-bounce) 간접 조명 알고리즘을 소개한다. 먼저, 소수의 레이를 현재 픽셀의 반구 위로 방출시켜 씬 오브젝트들과의 첫 교차점을 계산한다. 만약 해당 교차점이 광원으로부터 직접적으로 조명을 받고 있다면, 해당 지점의 조명 컬러를 수집 한다. 그 다음, 간접 가시성을 얻기 위해 레이와 복셀의 교차점 테스트를 가속화하는 3D 밉맵 레이 마칭 알고리즘(MRM)을 사용한다. 이후 로컬 평균 교체(LMR) 방법을 이용한 에지 보존 필터링 기법을 반복하여 간접조명 이미지의 노이즈를 제거 한다. 본 연구의 방법은 고품질 전역 조명 이미지를 효율적으로 생성할 수 있다.

센서네트워크에 적용가능한 HIGHT 알고리즘의 최적화 구현 기법 (Optimized implementation of HIGHT algorithm for sensor network)

  • 서화정;김호원
    • 한국정보통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.1510-1516
    • /
    • 2011
  • 유비쿼터스 세상의 도래와 함께 언제 어디서나 네트워크 망에 접속하여 자신에게 필요한 서비스를 이용하는 것이 가능해 졌다. 이는 지역의 센싱 정보와 데이터를 제공하는 센서 네트워크의 발달로 인해 가속화되어 가고 있다. 현재 센서 네트워크는 환경 모니터링, 헬스케어 그리고 홈자동화와 같은 우리 삶의 편의에 큰 기여를 하고 있다. 하지만 기존의 네트워크와는 달리 한정적인 자원을 가진 센서를 통한 무선통신을 수행함으로써 공격자에게 쉽게 노출되는 단점을 가진다. 따라서 센서 네트워크 상에서의 안전한 보안통신을 위해 통신간에 유통되는 메시지는 대칭키로 암호화되어 전송된다. 지금까지 많은 대칭키 암호화알고리즘이 연구되어 왔으며 그 중에서도 HIGHT 알고리즘은 하드웨어와 소프트웨어 구현에서 기존의 AES보다 속도측면에서 효율적이다. 따라서 RFID 태그와 센서 노드 그리고 스마트 카드와 같은 자원 한정적인 장비에 적합하다. 본 논문에서는 초경량 대칭키 암호화 알고리즘인 HIGHT 알고리즘의 소프트웨어 최적화 구현 기법을 제시한다.

데몬 알고리즘을 이용한 호기-흡기 CT 영상 비강체 폐 정합 (Nonrigid Lung Registration between End-Exhale and End-Inhale CT Scans Using a Demon Algorithm)

  • 임예니;홍헬렌;신영길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권1호
    • /
    • pp.9-18
    • /
    • 2010
  • 본 논문에서는 호기와 흡기에 촬영된 흉부 CT 영상간 폐 영상정합을 위해 데몬 알고리즘을 이용한 비강체 정합 방법을 제안한다. 먼저 두 영상에 어파인 변환을 적용하여 폐를 전역적으로 정렬한 후, 데몬 알고리즘에 기반한 비강체 정합 방법을 적용하여 지역적으로 변형시킨다. 데몬 힘의 계산을 위해 기준영상의 기울기 정보 뿐 아니라 부유영상의 기울기 정보를 함께 사용하여 기준영상의 기울기가 약한 부분에서 빠른 수렴을 돕는다. 활성-셀 기반 데몬 알고리즘은 두 영상 간 정합도가 높은 셀에서의 불필요한 변위 계산을 방지함으로써 정합 과정을 가속화시키고 변형 접힘 현상의 확률을 줄여주는 역할을 한다. 제안방법의 성능을 평가하기 위해 기준 기울기 힘을 사용한 방법과 부유 기울기 힘을 함께 사용한 방법을 비교하고, 활성-셀을 사용한 방법과 사용하지 않은 방법을 비교하였다. 실험 결과는 제안 방법이 변형이 큰 폐를 정확하게 정합하며 수행시간을 감소시킴을 보여준다.

네트워크 보안을 위한 서픽스 트리 기반 고속 패턴 매칭 알고리즘 (High Performance Pattern Matching algorithm with Suffix Tree Structure for Network Security)

  • 오두환;노원우
    • 전자공학회논문지
    • /
    • 제51권6호
    • /
    • pp.110-116
    • /
    • 2014
  • 패턴 매칭 알고리즘은 컴퓨터 네트워크, 유비쿼터스 네트워크, 그리고 센서 네트워크 등을 위한 보안 프로그램에 주로 사용 된다. IT 기술의 발전과 함께 정보의 디지털화가 가속화되면서 네트워크를 통해 전달되는 데이터양이 급증하고 있다. 이에 따라 패턴 매칭 연산의 복잡도도 폭발적으로 증가하고 있다. 따라서 더 많은 패턴을 보다 빠르게 검색할 수 있는 고성능 알고리즘의 개발이 끊임없이 요구되고 있다. 본 논문은 서픽스 트리 기반 패턴 매칭 알고리즘을 새롭게 제안하여 대용량 패턴 매칭 연산의 성능을 높였다. 서픽스 트리는 사전에 정의된 복수 패턴들의 서픽스를 기반으로 생성된다. 이 트리에 쉬프트 노드 개념을 추가하여 기존 패턴 매칭 연산들 중 불필요한 연산의 수행 횟수를 줄였다. 결과적으로 제안하는 구조를 통해 기존 알고리즘 대비 24% 이상의 성능 향상을 이루었다.

병렬 알고리즘의 가속화를 위한 GP-GPU의 Thread할당 기법 (Thread Distribution Method of GP-GPU for Accelerating Parallel Algorithms)

  • 이관호;김치용
    • 전기전자학회논문지
    • /
    • 제21권1호
    • /
    • pp.92-95
    • /
    • 2017
  • 본 논문에서는 적은 면적의 GP-GPU에서 성능을 향상시키기 위한 방법을 제안한다. 본 논문에서는 superscalar와 같이 과도하게 스케줄링 복잡성을 증가시키지 않는 대신 단순한 코어의 수를 늘려 성능을 극대화 시키는 방법을 제안한다. GP-GPU를 구성하는 Stream Processor의 구조를 단순화한다. 또한, Warp Schedule에서 thread 할당을 어플리케이션에 적합한 방법을 개발하여 성능을 개선한다. 성능을 검증하는 방안으로 neural network의 한 분야인 딥러닝에 대한 스레드 할당방식을 제안한다. Neural Network 알고리즘의 경우 Intel CPU 대비 90%에서 ARM Cortex-A15 4 core 대비 98% 성능 향상을 확인할 수 있었다.

아리랑 영상의 효율적 정사보정처리 연구 (A Study on the Efficient Orthorectification of KOMPSAT Image)

  • 오관영;이광재;황정인;김윤수
    • 대한원격탐사학회지
    • /
    • 제37권6_3호
    • /
    • pp.2001-2010
    • /
    • 2021
  • 본 연구의 목적은 아리랑 영상의 정사영상처리를 보다 효율적으로 개선하기 위한 것이다. 국내외 지구 관측 위성의 개발이 가속화됨에 따라 획득되는 영상의 수와 양이 급증하고 있다. 이에 획득된 영상에 대한 정사영상처리를 보다 빠르고 효율적으로 개선하기 위한 다양한 연구들이 진행되고 있다. 본 연구에서는 GPU 등 하드웨어 컴퓨팅 능력 향상을 제외하고, 알고리즘 개선을 통한 처리 효율 강화에 집중하였다. 이를 위하여 LUT 기반 RFM 방법으로 알고리즘을 개선하였으며, offset 설정에 따라 달라지는 결과를 정확도 및 시간 효율의 측면에서 비교 및 분석하였다.

효율적인 Transformer 모델 경량화를 위한 구조화된 프루닝 (Structured Pruning for Efficient Transformer Model compression)

  • 류은지;이영주
    • 반도체공학회 논문지
    • /
    • 제1권1호
    • /
    • pp.23-30
    • /
    • 2023
  • 최근 거대 IT 기업들의 Generative AI 기술 개발로 Transformer 모델의 규모가 조 단위를 넘어가며 기하급수적으로 증가하고 있다. 이러한 AI 서비스를 지속적으로 가능케 하기 위해선 모델 경량화가 필수적이다. 본 논문에서는 하드웨어 친화적으로 구조화된(structured) 프루닝 패턴을 찾아 Transformer 모델의 경량화 방법을 제안한다. 이는 모델 알고리즘의 특성을 살려 압축을 진행하기 때문에 모델의 크기는 줄어들면서 성능은 최대한 유지할 수 있다. 실험에 따르면 GPT2 와 BERT 언어 모델을 프루닝할 때 제안하는 구조화된 프루닝 기법은 희소성이 높은 영역에서도 미세 조정된(fine-grained) 프루닝과 거의 흡사한 성능을 보여준다. 이 접근 방식은 미세 조정된 프루닝 대비 0.003%의 정확도 손실로 모델매개 변수를 80% 줄이고 구조화된 형태로 하드웨어 가속화를 진행할 수 있다.

Hop-depth 알고리즘을 이용한 무선 센서 네트워크상에서의 내부공격자 및 공모노드 검출 (Detecting Inner Attackers and Colluded nodes in Wireless Sensor Networks Using Hop-depth algorithm)

  • 이강현
    • 전자공학회논문지CI
    • /
    • 제44권1호
    • /
    • pp.113-121
    • /
    • 2007
  • 다수의 노드로 구성된 무선센서네트워크는 Ad-hoc 방식으로 노드간 통신이 이루어지며, 센싱데이터는 베이스노드로 취합되어진 후 Host PC에 의해 처리되어지게 된다. 하지만 Ad-hoc 방식의 네트워크는 잘못된 라우팅 정보를 전달하거나 데이터를 중간에 소실 및 변경시키는 싱크홀 공격에 대해 취약할 수밖에 없다. 이러한 싱크홀 공격은 네트워크의 오버헤드를 가중시키고 전체 네트워크의 배터리 소모를 가속화 시켜 전체 네트워크의 수명을 단축시키고 또한 다른 공격을 적용하기가 용이하므로 싱크홀 공격에 대한 대응방법은 신중하게 고려되어져야 한다. 본 논문은 이러한 싱크홀 공격이 일어났을 때 공격노드와 주변의 공모노드를 검출해 낼 수 있는 Hop-depth 알고리즘을 제안하였다. 제안된 알고리즘은 홉 깊이가 변경되는 공격의심 노드들을 검색한 후 주변의 공모노드의 경로 값을 재계산한 후 실제 공격이 이루어지는 노드를 검출해 낸다. 제안된 알고리즘의 성능평가는 NS2를 사용하여 이루어 졌으며 원 공격노드 검출성공률, 양성오류율 및 음성오류율, 에너지 소비효율 값을 비교분석하였다.

PSO의 다양한 영역 탐색과 지역적 미니멈 인식을 위한 전략 (The Strategies for Exploring Various Regions and Recognizing Local Minimum of Particle Swarm Optimization)

  • 이영아;김택헌;양성봉
    • 정보처리학회논문지B
    • /
    • 제16B권4호
    • /
    • pp.319-326
    • /
    • 2009
  • PSO(Particle Swarm Optimization)는 군집(swarm)을 구성하는 단순한 개체들인 입자(particle)들이 각자의 경험을 공유하여 문제의 해답을 찾는 최적화 알고리즘으로 다양한 분야에서 응용되고 있다. PSO에 대한 연구는 최적화를 위해 군집이 적합한 영역으로 빠르게 수렴하도록 하는 파라미터 값의 선정, 토폴로지, 입자의 이동에서 주로 이루어지고 있다. 표준 PSO 알고리즘은 입자 자신과 최고의 이웃이 제공하는 정보만을 이용해서 이동하므로 다양한 영역을 탐색하지 못하고 지역적 최적점에 조기 수렴하는 경향이 있다. 본 논문에서는 군집이 다양한 영역을 탐색하기 위해, 각 입자는 더 나은 경험을 가진 이웃입자들의 정보를 상대적인 중요도에 따라서 참조하여 이동하도록 하였다. 다양한 영역의 탐색은 표준 PSO 알고리즘보다 지역적 최적화의 확률을 줄이고 탐색 속도를 가속화하며 탐색의 성공률을 높일 수 있다. 또한 군집이 지역적 미니멈으로부터 벗어나기 위한 검사 전략을 제안하여 탐색의 성공률을 높였다. 제안한 PSO 알고리즘을 평가하기 위하여, 벤치마크 함수들에 적용한 결과 최적화의 진행 속도 개선과 탐색 성공률의 향상이 있었다.