• 제목/요약/키워드: Graphics Processing Unit(GPU)

검색결과 154건 처리시간 0.024초

Depth-hybrid speeded-up robust features (DH-SURF) for real-time RGB-D SLAM

  • Lee, Donghwa;Kim, Hyungjin;Jung, Sungwook;Myung, Hyun
    • Advances in robotics research
    • /
    • 제2권1호
    • /
    • pp.33-44
    • /
    • 2018
  • This paper presents a novel feature detection algorithm called depth-hybrid speeded-up robust features (DH-SURF) augmented by depth information in the speeded-up robust features (SURF) algorithm. In the keypoint detection part of classical SURF, the standard deviation of the Gaussian kernel is varied for its scale-invariance property, resulting in increased computational complexity. We propose a keypoint detection method with less variation of the standard deviation by using depth data from a red-green-blue depth (RGB-D) sensor. Our approach maintains a scale-invariance property while reducing computation time. An RGB-D simultaneous localization and mapping (SLAM) system uses a feature extraction method and depth data concurrently; thus, the system is well-suited for showing the performance of the DH-SURF method. DH-SURF was implemented on a central processing unit (CPU) and a graphics processing unit (GPU), respectively, and was validated through the real-time RGB-D SLAM.

절단면 재렌더링 기법을 이용한 GPU 기반 MIP 볼륨 렌더링 (GPU based Maximum Intensity Projection using Clipping Plane Re-rendering Method)

  • 홍인실;계희원;신영길
    • 한국멀티미디어학회논문지
    • /
    • 제10권3호
    • /
    • pp.316-324
    • /
    • 2007
  • 의료영상에서 사용하는 MIP 볼륨 렌더링은 CT나 MR 등의 볼륨데이터에서 시각 광선으로부터 높은 밝기 값을 추출하여 혈관과 뼈와 같은 환자의 조직을 보여주는 볼륨 렌더링 기법이다. 최근 GPU를 MIP 볼륨 렌더링에 사용하여 대용량 의료영상 데이터에 대해서도 속도가 빠른 렌더링이 가능하게 되었다. 볼륨데이터를 여러 각도에서 관찰하면, 일반적으로 시각과 동일한 방향의 텍스쳐 평면과 볼륨 경계평면이 비스듬하게 교차한다. 볼륨데이터의 외부에는 값이 존재하지 않으므로 경계부분에서 공간 주파수가 높게 나타난다. 기존의 MIP 렌더링은 샘플링 간격이 일정하기 때문에 경계부분에서 데이터의 손실이 생겨 알리아싱이 나타나는 문제가 있다. 화질을 개선하기 위해 샘플링 간격을 줄여 슬라이스수를 증가시킬 수 있으나, 이때는 렌더링 수행 시간이 길어지게 된다. 이 논문에서는 기존 렌더링 결과에 볼륨 경계 평면을 추가로 렌더링하는 방법을 제안한다. 이 방법은 주파수가 높은 경계 부분의 샘플링 간격을 줄여 화질을 향상시킨다. 한편 MIP는 샘플링 순서에 무관하므로 추가된 슬라이스는 기존 렌더링 영상을 손실시키지 않는다. 증가된 슬라이스는 경계부분인 여섯 평면에 불과하므로 렌더링 수행시간에는 거의 영향을 주지 않고 화질을 개선할 수 있다.

  • PDF

적응적 타일크기를 이용한 모자이크 (Mosaics using Adaptive Tile Size)

  • 한명훈;윤경현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (B)
    • /
    • pp.167-171
    • /
    • 2007
  • 본 논문에서는 타일의 크기를 적응적으로 결정하는 모자이크 방법을 제안한다. 우리는 이미지에서 에지(Edge)를 추출한 뒤, 결과 영상이 이 에지 정보를 보존하고, 각 타일들이 이 에지를 따르도록 한다. 에지 정보를 보존 하기 위하여 무게중심 보로노이 다이어그램(CVD: Centroidal Voronoi Diagram)을 계산할때 에지 회피기법을 적용하며, 에지를 따르는 타일을 생성하기 위하여 에지를 따르는 방향과 맨해튼 거리(manhattan distance)가 적용된 무게중심 보로노이 다이어그램을 사용한다. 이때, 우리는 그래픽 처리 장치(GPU: Graphics Processing Unit)를 이용하여 방향맵이나 보로노이 다이어그램을 더욱 빠르게 구할 수 있다. 우리는 타일의 크기를 각 보로노이 영역의 넓이에 비례하게 정함으로써, 기존의 모자이크 방법들이 해결하고자 했던 타일의 겹침 문제와 타일간의 빈 공간 문제를 개선하였다.

  • PDF

An Improved Hybrid Approach to Parallel Connected Component Labeling using CUDA

  • Soh, Young-Sung;Ashraf, Hadi;Kim, In-Taek
    • 융합신호처리학회논문지
    • /
    • 제16권1호
    • /
    • pp.1-8
    • /
    • 2015
  • In many image processing tasks, connected component labeling (CCL) is performed to extract regions of interest. CCL was usually done in a sequential fashion when image resolution was relatively low and there are small number of input channels. As image resolution gets higher up to HD or Full HD and as the number of input channels increases, sequential CCL is too time-consuming to be used in real time applications. To cope with this situation, parallel CCL framework was introduced where multiple cores are utilized simultaneously. Several parallel CCL methods have been proposed in the literature. Among them are NSZ label equivalence (NSZ-LE) method[1], modified 8 directional label selection (M8DLS) method[2], and HYBRID1 method[3]. Soh [3] showed that HYBRID1 outperforms NSZ-LE and M8DLS, and argued that HYBRID1 is by far the best. In this paper we propose an improved hybrid parallel CCL algorithm termed as HYBRID2 that hybridizes M8DLS with label backtracking (LB) and show that it runs around 20% faster than HYBRID1 for various kinds of images.

Plan Position Indicator Scope 주사방식의 Radar 영상신호를 LCD Display에 잔상영상으로 데이터 표출 구현에 관한 연구 (Study On The Signal Radar Plan Position Indicator Scope Of The Data Expressed Scanning System Implemented As An Sticking Image On LCD Display)

  • 신현종;유형근
    • 한국위성정보통신학회논문지
    • /
    • 제10권3호
    • /
    • pp.94-101
    • /
    • 2015
  • 디스플레이는 장치는 아날로그 또는 디지털 시스템에서 발생되는 문자, 도형, 영상, 패턴 형태의 정보를 인간의 육안으로 판별 가능하도록 전달함으로써 인간과 기계를 연결시켜주는 중요한 영상정보통신시스템 장치이다. 이러한 장치를 활용해 보여주는 기능이 중시되면서 정보를 정확하고 신속하게 표출하기 위한 핵심적인 기능과 역할이 절대적으로 필요하다. 아날로그 시대의 대명사였던 브라운관(CRT)에 PPI Scope 주사방식 시스템 신호를 CRT에 표시함으로써, CRT에 표시된 정보를 통해 기계적인 시스템에서 발생된 신호를 인간인 판독할 수 있도록 전달하는 중간 매개체 역할을 통해 정보를 분석하였다. 본 연구는 이와 같이 수신된 신호를 정보로 표출하는 레이더 디스플레이 장치에 관한 것으로, 디스플레이 장치의 수직 블랭킹 간격(Vertical blanking interval)과 버퍼스왑(Buffer swap)을 통한, 고정함수 그래픽 파이프라인 고속 대용량 처리형태의 알고리즘을 적용하였다. 발생될 수 있는 오차를 제거하기 위해 FPGA 및 내부 알고리즘, H/W로직을 동기화 처리로 표출정보 끊김 현상을 제거하고, 고속으로 영상정보가 표출될 수 있도록 구현함으로써, 별도의 고가 고성능 그래픽 연산장치 GPU 없이 구현된 FPGA 로직에 수행알고리즘을 적용하여 경제성은 물론 레이더 정보표출 신뢰성과 성능을 향상시켰다. 이를 통해 기존 아날로그 신호에 따라 동작하는 CRT 레이더 디스플레이를 구비한 레이더 시스템에서 디스플레이를 평면 디스플레이로 교체할 수 있도록 한 레이더 디스플레이 장치에 관한 연구이다.

특이치 분해를 위한 최적의 2차원 멀티코어 시스템 탐색 (Exploration of an Optimal Two-Dimensional Multi-Core System for Singular Value Decomposition)

  • 박용훈;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권9호
    • /
    • pp.21-31
    • /
    • 2014
  • 특이치 분해는 다양한 분야의 데이터 집단에서 고유한 특성을 찾는 특징 추출 분야에 많이 활용되고 있다. 하지만 특이치 분해의 복잡 행렬 연산은 많은 연산 시간을 요구한다. 본 논문에서는 특이치 분해의 대표적인 알고리즘인 one-sided block Jacobi를 고속 처리하기 위해 2차원 멀티코어 시스템을 이용하여 효율적으로 병렬 구현하고 성능을 향상시킨다. 또한, one-sided block Jacobi 알고리즘의 다양한 행렬 ($128{\times}128$, $64{\times}64$, $32{\times}32$, $16{\times}16$)을 서로 다른 2차원 PE 구조에 구현하고 성능 및 에너지를 분석함으로써 각 행렬에 대한 최적의 멀티코어 구조를 탐색한다. 더불어 동일한 행렬의 one-sided block Jacobi 알고리즘에 대해 선택된 멀티코어 구조와 상용 고성능 그래픽스 프로세싱 유닛 (GPU)과의 성능 비교를 통해 제안한 2차원 멀티코어 방법의 잠재 가능성을 확인한다.

Simple Spectral Calibration Method and Its Application Using an Index Array for Swept Source Optical Coherence Tomography

  • Jung, Un-Sang;Cho, Nam-Hyun;Kim, Su-Hwan;Jeong, Hyo-Sang;Kim, Jee-Hyun;Ahn, Yeh-Chan
    • Journal of the Optical Society of Korea
    • /
    • 제15권4호
    • /
    • pp.386-393
    • /
    • 2011
  • In this study, we report an effective k-domain linearization method with a pre-calibrated indexed look-up table. The method minimizes k-domain nonlinear characteristics of a swept source optical coherence tomography (SS-OCT) system by using two arrays, a sample position shift index and an intensity compensation array. Two arrays are generated from an interference pattern acquired by connecting a Fabry-Perot interferometer (FPI) and an optical spectrum analyzer (OSA) to the system. At real time imaging, the sample position is modified by location movement and intensity compensation with two arrays for linearity of wavenumber. As a result of evaluating point spread functions (PSFs), the signal to noise ratio (SNR) is increased by 9.7 dB. When applied to infrared (IR) sensing card imaging, the SNR is increased by 1.29 dB and the contrast noise ratio (CNR) value is increased by 1.44. The time required for the linearization and intensity compensation is 30 ms for a multi thread method using a central processing unit (CPU) compared to 0.8 ms for compute unified device architecture (CUDA) processing using a graphics processing unit (GPU). We verified that our linearization method is appropriate for applying real time imaging of SS-OCT.

병렬처리 그래픽 기술 기반의 Spectral Domain-Optical Coherence Tomography를 이용한 3차원 광 대역 망막 촬영 (High-Speed SD-OCT for Ultra Wide-field Human Retinal Three Dimensions Imaging using GPU)

  • 박기범;조남현;;김지현
    • 대한의용생체공학회:의공학회지
    • /
    • 제34권3호
    • /
    • pp.135-140
    • /
    • 2013
  • We have developed an ultra wide-field of view Optical Coherence Tomography(OCT) which has capability to 2D and 3D views of cross-sectional structure of in vivo human retina. Conventional OCT has a limitation in visualizing the entire retina due to a reduced field of view. We designed an optical setup to significantly improve the lateral scanning range to be more than 20 mm. The entire human retinal structure in 2D and 3D was reported in this paper with the developed OCT system. Also, we empirically searched an optimized image size for real time visualization by analyzing variation of the frame rate with different lateral scan points. The size was concluded to be $1024{\times}2000{\times}300$ pixels which took 9 seconds for visualization.

특허 데이터 및 재무 데이터를 활용한 글로벌 기업의 인공지능 하드웨어 연구개발 효율성 분석 (Analysis of Research and Development Efficiency of Artificial Intelligence Hardware of Global Companies using Patent Data and Financial data)

  • 박지민;이봉규
    • 한국멀티미디어학회논문지
    • /
    • 제23권2호
    • /
    • pp.317-327
    • /
    • 2020
  • R&D(Research and Development) efficiency analysis is a very important issue in academia and industry. Although many studies have been conducted to analyze R&D(Research and Development) efficiency since the past, studies that analyzed R&D(Research and Development) efficiency considering both patentability and patent quality efficiency according to the financial performance of a company do not seem to have been actively conducted. In this study, measuring the patent application and patent quality efficiency according to financial performance, patent quality efficiency according to patent application were applied to corporate groups related to artificial intelligence hardware technology defined as GPU(Graphics Processing Unit), FPGA(Field Programmable Gate Array), ASIC(Application Specific Integrated Circuit) and Neuromorphic. We analyze the efficiency empirically and use Data Envelopment Analysis as a measure of efficiency. This study examines which companies group has high R&D(Research and Development) efficiency about artificial intelligence hardware technology.

Deep Learning Model on Gravitational Waves of Merger and Ringdown in Coalescence of Binary Black Holes

  • Lee, Joongoo;Cho, Gihyuk;Kim, Kyungmin;Oh, Sang Hoon;Oh, John J.;Son, Edwin J.
    • 천문학회보
    • /
    • 제44권1호
    • /
    • pp.46.2-46.2
    • /
    • 2019
  • We propose a deep learning model that can generate a waveform of coalescing binary black holes in merging and ring-down phases in less than one second with a graphics processing unit (GPU) as an approximant of gravitational waveforms. Up to date, numerical relativity has been accepted as the most adequate tool for the accurate prediction of merger phase of waveform, but it is known that it typically requires huge amount of computational costs. We present our method can generate the waveform with ~98% matching to that of the status-of-the-art waveform approximant, effective-one-body model calibrated to numerical relativity simulation and the time for the generation of ~1500 waveforms takes O(1) seconds. The validity of our model is also tested through the recovery of signal-to-noise ratio and the recovery of waveform parameters by injecting the generated waveforms into a public open noise data produced by LIGO. Our model is readily extendable to incorporate additional physics such as higher harmonics modes of the ring-down phase and eccentric encounters, since it only requires sufficient number of training data from numerical relativity simulations.

  • PDF