• 제목/요약/키워드: Cuda

검색결과 295건 처리시간 0.032초

GPU 기반 고속 얼굴 영역 검출 구현 (Implementation of fast facial image detecting system based on GPU)

  • 이성연;박성모;김종남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.130-131
    • /
    • 2009
  • 얼굴 영역 검출은 얼굴 인식, 얼굴 복원 등 산업 및 학술 여러 분야에 걸쳐 사용되는 기술이다. 고속의 얼굴 영역 검출을 위하여 고성능 하드웨어를 사용하거나 고속 알고리즘을 사용하는데, 본 논문에서는 GPU 기반 프로그래밍 기법인 CUDA를 이용하여 고속 얼굴 영역 검출 시스템을 구현하였다. 기존의 얼굴 영역 검출 시스템은 처리 속도의 한계로 인해 고속의 검출이 어려웠을 뿐 아니라 고속으로 동작하도록 하려면 고가의 시스템 부품을 사용하여야 하므로 사용자에게 부담을 안겨주었다. 그러나 nVidia 등 그래픽 칩셋 제조업체들이 속속 내놓고 있는 GPGPU 기술을 이용하여 얼굴 영역 검출 시스템을 구현할 경우 보다 저렴한 가격에 보다 뛰어난 성능을 가질 수 있도록 할 수 있다. 따라서 본 논문에서는 이러한 범용 GPU 사용 기술 중 하나인 nVidia의 CUDA를 이용하여 얼굴 검출 시스템을 구현하였다. 실험 결과 GPU 기반 시스템은 CPU 기반 시스템보다 고속으로 검출이 가능함을 확인하였다. 제안하는 방법은 nVidia 그래픽 카드가 설치된 시스템에서 고속의 감시카메라 서버 등으로 적용이 가능하다.

인공지능(AI)를 활용한 보조보행기구 식별에 따른 자동문 속도 조절 설계에 대한 연구 (A Study on the Automatic Door Speed Control Design by the Identification of Auxiliary Pedestrian Using Artificial Intelligence (AI))

  • 김유민;최규민;신준표;성승민;이병권
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.237-239
    • /
    • 2021
  • 본 논문에서는 YOLO 시스템을 사용하여 보조 보행 기구를 인식 한 후 자동문 속도 조절에 대한 방법을 제안한다. Visual studio, OpenCV, CUDA를 활용하여 보조 보행 기구를 인식이 가능하게 신경망 훈련 및 학습 한 데이터를 기반으로 Raspberry Pi, 카메라 모듈을 활용하여 실시간 모니터링을 통해 보조 보행 기구를 인식하여 자동문의 속도를 조절을 구현했다. 이로써 거동이 불편한 장애인은 원활하게 건물 출입이 가능하다.

  • PDF

계층적 결합형 양방향 필터를 이용한 실시간 깊이 영상 보정 방법 (Real-time Depth Image Refinement using Hierarchical Joint Bilateral Filter)

  • 신동원;호요성
    • 방송공학회논문지
    • /
    • 제19권2호
    • /
    • pp.140-147
    • /
    • 2014
  • 본 논문에서는 결합형 양방향 필터를 이용하여 깊이 영상을 실시간으로 보정하는 방법을 제안한다. 제안한 방법은 Kinect 깊이 카메라로부터 얻은 깊이 영상의 화질을 실시간으로 향상시키기 위해 GPU 내의 상수 메모리와 2차원 영상 처리에 적합한 텍스쳐 메모리를 사용한다. 또한, 단일 화소에 대한 결합형 양방향 필터 연산을 각 GPU 쓰레드(thread)에 할당한 다음 병렬로 처리하여 계산량을 현저히 감소시킨다. 그리고 깊이 영상의 품질을 더욱 높이기 위해 CUDA를 이용해 구현한 결합형 양방향 필터를 계층형 구조로 반복적으로 수행하여 폐색 영역이 채워진 깊이 영상을 얻을 수 있다. 실험 결과를 통해, 제안한 실시간 깊이 영상 보정 방법이 깊이 영상의 주관적 화질을 향상시키고, 초당 55 화면의 속도로 동작하는 것을 확인했다.

환형문자열에 대한 대표문자열을 찾는 병렬 알고리즘 (Parallel Algorithms for Finding Consensus of Circular Strings)

  • 김동희;심정섭
    • 정보과학회 논문지
    • /
    • 제42권3호
    • /
    • pp.289-294
    • /
    • 2015
  • 대표문자열 문제는 k개의 문자열로 구성된 집합 S가 주어졌을 때 S를 대표하는 한 문자열인 대표문자열을 찾는 문제이다. 환형문자열은 일반적인 문자열과는 달리 문자열의 첫 글자와 마지막 글자가 연결되어 원 모양을 이루는 문자열이다. 본 논문에서는 먼저 k=3이고 길이 n인 환형문자열들로 구성된 S에 대해, 거리반경과 거리합을 동시에 고려한 대표문자열 문제를 O(n)개의 쓰레드를 사용하여 $O({\mid}{\Sigma}{\mid}nlogn)$ 시간에 병렬적으로 해결하는 알고리즘을 제시한다. 이때, ${\Sigma}$는 각 문자열을 구성하는 문자집합이다. 다음으로 k=4이고 길이 n인 환형문자열들로 구성된 S에 대해 거리합 기반 대표문자열 문제를 O(n)개의 쓰레드를 사용하여 $O({\mid}{\Sigma}{\mid}n^2logn)$ 시간에 병렬적으로 해결하는 알고리즘을 제시한다. 이후 두 문제에 대한 병렬 알고리즘들을 CUDA를 이용하여 구현하고 순차 알고리즘들과의 실행 속도를 비교한 결과를 제시한다.

CUDA를 활용한 스케일링 필터 및 트랜스코더의 성능향상 (Performance Enhancement of Scaling Filter and Transcoder using CUDA)

  • 한재근;고영섭;서성한;하순회
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권4호
    • /
    • pp.507-511
    • /
    • 2010
  • 본 논문은 GPGPU가속을 이용한 스케일링 필터(scaling filter) 및 트랜스코딩(Transcoding)의 성능 향상 방법을 제안한다. 트랜스코딩 기술은 다양한 요구조건을 지닌 멀티미디어 기기에 적합하게 동영상을 가공하는 기술로, 오늘날 여러 분야에서 활용되는 중요한 기술이다. 그러나 트랜스코딩에는 대량의 연산이 필요하기 때문에 기존 트랜스코더(Transcoder) 사용자들은 오랜 처리시간을 감내 해야만 했는데, 이는 CPU만을 이용한 트랜스코딩이 충분히 효율적이지 못하기 때문이다. 본 연구에서는 고성능의 연산이 가능한 GPGPU기술을 활용하여, 트랜스코더의 스케일링 필터를 GPU 상에서 높은 병렬성을 가지고 동작하도록 개선함으로써 트랜스코더의 전체적인 성능을 향상시켰다. 개선된 트랜스코더는 다양한 크기의 동영상과 여러 종류의 스케일링 필터 옵션들에 대해 잘 동작함이 검증되었으며, 기본 옵션에서 36%, 최대 101%의 성능향상을 보였다.

CUDA 기반 GPU에서 효율적인 Power Method의 구현 (Implementation of Efficient Power Method on CUDA GPU)

  • 김정환;김진수
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.9-16
    • /
    • 2011
  • GPU는 저렴한 비용으로 쉽게 대규모 데이터 병렬성을 활용할 수 있는 장점을 갖고 있어 많은 고성능 컴퓨팅 응용 분야에서 사용되고 있는 추세다. 행렬의 고유벡터를 구하는 power method는 웹 페이지의 중요도를 계산하는 PageRank 알고리즘 등 여러 응용 분야에서 활용되고 있는 방법으로써, 본 연구에서는 power method를 GPU에서 병렬화하여 구현하였으며, 성능을 최적화하기 위한 개선 방법을 제시하였다. Power method는 행렬과 벡터의 곱셈 연산이 반복적으로 수행되며 GPU에서 쉽게 병렬화가 가능하다. 그러나, 고유벡터의 수렴 여부 판단을 위한 연산 등의 작업과 다음 곱셈을 위한 벡터 크기의 조정 등의 작업이 부가적으로 필요하며, 이러한 작업은 GPU 내의 커널 코드를 여러 차례 호출하고 불필요한 데이터 이동을 유발하는 문제점이 있다. 본 연구에서는 커널 호출 회수를 줄이고 스레드 배치를 최적함과 동시에 수렴 여부 판단을 위한 연산을 최적함으로써 power method의 성능을 향상시켰다.

고속 병렬처리 기법을 활용한 실시간 광대역 소프트웨어 DDC (Realtime Wideband SW DDC Using High-Speed Parallel Processing)

  • 이현휘;이광용;윤상범;박영일;김선교
    • 한국전자파학회논문지
    • /
    • 제25권11호
    • /
    • pp.1135-1141
    • /
    • 2014
  • 넓은 동적 범위와 고속 샘플링률로 신호를 양자화하면서 실시간으로 광대역 DDC를 수행하는 일은 시간 소모가 크기때문에 주로 하드웨어인 FPGA나 ASIC에서 구현이 되어 왔다. 실시간 광대역 소프트웨어 DDC는 신호 환경이 바뀌어도 유연하게 대처할 수 있으며, 재사용이 가능하다. 또한, 하드웨어보다 가격이 저렴한 장점을 가지고 있다. 본 논문에서는 광대역 DDC를 소프트웨어 기반으로 고속의 병렬처리 구조로 설계하여, 실시간으로 저장 가능한 시스템 설계에 대해 연구하였다. 마지막으로 신호를 실시간으로 수신하기 위한 핑퐁버퍼링 기법과 고속신호처리를 위한 CUDA를 적용하여 신호처리 규격을 만족하는 광대역 DDC 설계 과정을 검증하였다.

영상 동영상에서의 효율적인 비사실적 렌더링 (Efficient Non-photorealistic Rendering Technique in Single Images and Video)

  • 손태일;박경주
    • 한국멀티미디어학회논문지
    • /
    • 제15권8호
    • /
    • pp.977-985
    • /
    • 2012
  • 본 연구에서는 단일영상과 동영상에서의 효율적인 비사실적 렌더링 기법을 제안한다. 단일영상의 경우에는 최근 단일영상 NPR 기법에서 많이 사용되는 플로우 기반 DoG 필터와 Bilateral 필터를 CUDA 환경에서 구현하여 실시간 처리가 가능하게 한다. 또한 동영상의 경우에는 기존의 NPR 동영상 방법인 매 프레임마다 단일영상 NPR 기법을 적용하여 생성하는 방법이 아닌 첫 프레임은 단일영상에 적용되는 NPR기법을 사용하여 스타일화 하고, 다음 프레임부터는 움직임 벡터를 기반으로 한 픽셀 맵핑을 사용하여 이전 프레임에서 움직임이 있는 픽셀의 밝기 값을 다음 프레임의 움직임 벡터 위치로 복사함으로써 불필요한 계산량을 줄이고, 프레임 간의 일관성 또한 유지시키는 방법을 제안한다. 본 연구에서는 실험을 통하여 그 성능을 증명하였다.

CUDA 기반 영상 분할을 사용한 비사실적 렌더링 (Non-Photorealistic Rendering Using CUDA-Based Image Segmentation)

  • 윤현철;박종승
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권11호
    • /
    • pp.529-536
    • /
    • 2015
  • 비사실적 렌더링(NPR; Non-Photorealistic Rendering)은 2차원 영상과 3차원 모델을 대상으로 하는 방법이 다르며 각각의 대상에 NPR을 적용하여 두 콘텐츠를 혼합하면 이질감이 나타나는 문제점이 있다. 본 논문에서는 3차원 객체와 영상에 있어서 각각의 대상에 카툰 및 스케치와 같은 비사실적 효과를 적용하여 조화롭게 혼합하는 기법을 제시한다. 제안 기법은 2차원 영상의 데이터를 분석하여 컬러 분포 특징을 얻고 이를 이용하여 실사 영상이나 3D 객체의 컬러 수를 줄인다. 단순화된 컬러맵과 윤곽선 에지 데이터로부터 비사실적 렌더링을 실시한다. 컬러맵 정보의 추출 및 적용 과정에서 자연스러운 장면 연출을 위해서 영상분할 과정이 필요하다. 그러나 영상분할 기법은 많은 연산을 필요로 한다. 특히 크기가 큰 입력에 대해서는 비사실적 렌더링에 많은 시간이 소요된다. 처리 시간이 많은 영상분할의 고속화를 위하여 GPU(Graphics Processing Unit)를 이용한 병렬 컴퓨팅을 할 수 있는 GPGPU(General-Purpose GPU)를 사용한다. GPGPU의 사용으로 알고리즘의 수행속도를 크게 개선하였다. 또한 영상분할 후 단순화된 컬러를 추출하여 일련의 컬러맵을 생성한 뒤 3D 객체에 NPR을 적용할 때 추출해낸 컬러맵을 적용하여 2차원 영상과 3차원 객채 간의 이질감을 줄이고 조화롭게 하였다.