• Title/Summary/Keyword: Speed calculation

검색결과 1,293건 처리시간 0.023초

Xilinx FPGA용 PCI express 구현 및 성능 분석 (Implementation and Performance Evaluation of PCI express on Xilinx FPGA)

  • 이진
    • 한국정보통신학회논문지
    • /
    • 제22권12호
    • /
    • pp.1667-1674
    • /
    • 2018
  • 하드웨어 가속기를 사용하여 다양한 실시간 계산을 하는 여러 공학/과학 분야에서 많은 경우에 FPGA와 호스트 컴퓨터를 PCI express(PCIe)로 연결하는 시스템 구성이 요구된다. 하지만, 초당 수 기가바이트의 데이터를 주고 받는 고속 인터페이스인 PCIe의 구현은 하드웨어 가속기 개발의 가장 큰 어려움 중에 하나이다. 상용 제품과 논문을 통해서 여러 PCIe IP 솔루션을 찾을 수 있지만, 고가의 비용을 지불해서 구매하거나, 별도의 시간과 노력을 투자해서 PCIe를 구현해야 한다. 따라서, Xilinx사의 FPGA를 기반의 하드웨어 가속기를 구현할 때는 Xilinx사에서 무료로 제공 하는 XDMA PCIe IP를 사용하는 것이 개발 기간 및 비용 단축을 위한 최선의 선택이 될 수 있다. 이러한 이유로 본 논문에서는 Xilinx사의 PCIe IP의 성능 평가를 위해 Zynq-7000 FPGA개발보드와 Windows 10 호스트 컴퓨터로 평가 시스템을 구성하고, PCIe IP의 구성 파라미터에 의한 전송 속도 성능 변화에 대해 평가 분석한다.

다중 GPU기반 홀로그램 생성을 위한 병렬처리 성능 최적화 기법 (An Optimization Method for Hologram Generation on Multiple GPU-based Parallel Processing)

  • 국중진
    • 스마트미디어저널
    • /
    • 제8권2호
    • /
    • pp.9-15
    • /
    • 2019
  • 홀로그램의 생성을 위한 연산은 포인트 클라우드의 규모에 따라 연산량이 기하급수적으로 증가하기 때문에 최근에는 다중의 GPU를 기반으로 CUDA 또는 OpenCL 라이브러리를 활용한 병렬처리가 이루어지고 있다. GPU기반의 병렬처리를 위한 CUDA 커널은 GPU의 코어 개수와 메모리 크기를 고려하여 쓰레드(thread), 블록(block), 그리드(grid)를 구성해야 하며, 다중 GPU 환경인 경우 GPU의 개수에 따른 그리드, 블록, 또는 쓰레드 단위의 분산처리가 필요하다. 본 논문에서는 CGH 생성에 대한 성능평가를 위해 포인트 클라우드의 포인트 개수를 10~1,000,000개 범위에서 점진적으로 증가시키면서 CPU, 단일 GPU, 다중 GPU 환경에서 연산 속도를 비교해 보았으며, 다중 GPU 환경에서 CGH(Computer Generated Hologram) 생성 연산을 가속화하기 위한 CUDA 기반의 병렬처리 과정에서 요구되는 메모리 구조 설계와 연산 방법을 제안한다.

심전도 신호의 커플링 이미지를 이용한 개인 인식 방법 (Personal Recognition Method using Coupling Image of ECG Signal)

  • 김진수;김성혁;반성범
    • 스마트미디어저널
    • /
    • 제8권3호
    • /
    • pp.62-69
    • /
    • 2019
  • 심전도 신호는 위조가 불가능하며 양쪽 손목에서 신호를 간편히 취득할 수 있는 장점이 있다. 본 논문에서는 심전도 신호의 방향 정보를 이용해 커플링 이미지를 생성하고, 이를 이용한 개인 인식 방법을 제안한다. 제안하는 커플링 이미지는 정방향 심전도 신호와 R-peak를 기준으로 회전된 역방향 심전도 신호를 이용해 생성하며, 생성한 커플링 이미지는 개인별로 고유한 패턴과 명암을 나타낸다. 또한 같은 주기의 심전도 신호 연산을 통해 R-peak 영역 데이터가 증가하여 개인 인식 성능 향상이 가능하다. 생성한 커플링 이미지는 제안한 합성곱 신경망을 이용해 패턴 및 명암에 대한 특징을 추출하며, 네트워크 속도 향상을 위해 다수의 풀링층을 사용해 데이터 크기를 축소한다. 실험은 47명의 공개된 심전도 데이터를 이용하며, 공개된 네트워크 중 top-5 성능이 상위권인 5개 네트워크와 제안한 네트워크를 이용해 비교 실험을 진행한다. 실험 결과 제안한 네트워크의 개인인식 성능이 99.28%로 가장 높게 나타남에 따라, 제안한 커플링 이미지를 이용한 개인 인식 방법이 유효함을 확인하였다.

가스터빈엔진을 모의하기 위한 시뮬레이션덕트 설계 연구 (Design Study of a Simulation Duct for Gas Turbine Engine Operations)

  • 임주현;김선제;김명호;김유일;김용련
    • 한국추진공학회지
    • /
    • 제23권1호
    • /
    • pp.124-131
    • /
    • 2019
  • 가스터빈엔진 고도시험설비 운용특성탐색 및 설비튜닝 연구와 유량/추력 측정방안 검증을 위한 엔진 시뮬레이션덕트 설계 연구를 수행하였다. 설비 운용특성 검증은 배압/추력 제어가 필요하므로 Spikecone type의 가변노즐을 적용하였으며, 유량검증용 ISO 쵸킹노즐의 추가장착이 가능토록 설계하였다. 시뮬레이션덕트 주유로 면적은 1D Sizing으로 결정하고, 노즐면적변화에 따른 시뮬레이션덕트 내부 유동특성은 1D/CFD 해석으로 조사하였으며, 해석결과로부터 설비운용특성 탐색 및 유량/추력 검증시험을 위한 공기공급부 시험조건을 도출하였다. Spike 노즐 구동부는 시험 전운용 구간에서 공력하중조건을 견디도록 모터, 리니어 볼스크류 등의 부품모델을 선정하였으며, 시험 시 10 mm/s의 이송속도가 가능하도록 설계하였다.

콩 분쇄기의 AISI 4140에서 200μm 미세 패턴 표면의 마찰 계수 및 마찰 계수 예측 모델 (Tribological Properties and Friction Coefficient Prediction Model of 200μm Surfaces Micro-Textured on AISI 4140 in Soybean Crusher)

  • 최원식;프라타마 판두 산디;수페노 데스티아니;변재영;이은숙;우지희;양지웅;키프 디마스 하리스 신;크리스타 마이난다 브리기타;오케추쿠 나에메카 니콜라스;이강삼
    • 한국산업융합학회 논문집
    • /
    • 제21권5호
    • /
    • pp.247-255
    • /
    • 2018
  • In this research, the effect of normal load, sliding velocity, and texture density on thefriction coefficient of surfaces micro-textured on AISI 4140 under paraffin oil lubrication were investigated. The predicted tribological behavior by numerical calculation can be serves as guidance for the designer during the machine development stage. Therefore, in this research friction coefficient prediction model based on response surface methodology (RSM), support vector machine (SVM), and artificial neural network (ANN) were developed. The experimental result shows that the variation of load, speed and texture density were influence the friction coefficient. The RSM, ANN and SVM model was successfully developed based on the experimental data. The ANN model can effectively predict the tribological characteristics of micro-textured AISI 4140 in paraffin oil lubrication condition compare to RSM and SVM.

2축 김발 위에 장착된 비축탐색기를 위한 시선각속도 계산 (Line-of-Sight Rate for Off-axis Seeker on a 2-axis Gimbal)

  • 김정훈;박국권;유창경
    • 한국항공우주학회지
    • /
    • 제47권3호
    • /
    • pp.187-194
    • /
    • 2019
  • 비축 적외선 탐색기는 공력 가열에 의한 열 차폐 효과를 완화시키기 위해 대공 고속 유도탄의 노즈콘 측면에 장착된다. 탐색기 출력은 표적을 지속적으로 추적하기 위한 유도탄의 롤 기동이 관여되었을 때 더 이상 시선각속도로 간주할 수 없다. 본 논문에서는 2축 김발 위에 장착된 비축탐색기를 위한 시선각속도 계산 방식을 제안한다. 첫째로, 실제 시선각속도 방정식은 해석적으로 도출되지만 조준각 오차 변화율을 측정할 수 없어 구현할 수 없다. 그에 따라 조준각 오차 변화율을 획득하기 위해 1차 지연 근사화를 제안한다. 제안한 시선각속도 계산 방식은 유도탄과 김발의 회전을 고려하여 커플링 효과를 보상할 수 있다. 제안한 방식의 성능을 비선형 6 자유도 시뮬레이션을 통해 검증하였다.

이형 부품 표면실장기에 대한 겐트리 경로 문제의 최적 알고리즘 (Optimization Algorithm of Gantry Route Problem for Odd-type Surface Mount Device)

  • 정재욱;태현철
    • 산업경영시스템학회지
    • /
    • 제43권4호
    • /
    • pp.67-75
    • /
    • 2020
  • This paper proposes a methodology for gantry route optimization in order to maximize the productivity of a odd-type surface mount device (SMD). A odd-type SMD is a machine that uses a gantry to mount electronic components on the placement point of a printed circuit board (PCB). The gantry needs a nozzle to move its electronic components. There is a suitability between the nozzle and the electronic component, and the mounting speed varies depending on the suitability. When it is difficult for the nozzle to adsorb electronic components, nozzle exchange is performed, and nozzle exchange takes a certain amount of time. The gantry route optimization problem is divided into the mounting order on PCB and the allocation of nozzles and electronic components to the gantry. Nozzle and electronic component allocation minimized the time incurred by nozzle exchange and nozzle-to-electronic component compatibility by using an mixed integer programming method. Sequence of mounting points on PCB minimizes travel time by using the branch-and-price method. Experimental data was made by randomly picking the location of the mounting point on a PCB of 800mm in width and 800mm in length. The number of mounting points is divided into 25, 50, 75, and 100, and experiments are conducted according to the number of types of electronic components, number of nozzle types, and suitability between nozzles and electronic components, respectively. Because the experimental data are random, the calculation time is not constant, but it is confirmed that the gantry route is found within a reasonable time.

오목 렌즈 함수를 이용한 초 고해상도 Computer generated hologram 생성 기법 (Extremely High-Definition Computer Generated Hologram Calculation Algorithm with Concave Lens Function)

  • 이창주;최우영;오관정;홍기훈;최기홍;전상훈;박중기;이승열
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.836-844
    • /
    • 2020
  • 아날로그 홀로그램과 동등 이상의 대면적과 넓은 시야각을 가진 Computer generated hologram(CGH)을 생성하기 위해서는 매우 많은 픽셀 수가 요구된다. 이로 인해 고해상도의 CGH를 생성하기 위해서는 높은 성능의 연산장치를 바탕으로도 오랜 연산 시간이 필요한 문제점이 존재한다. 이를 해결하기 위해 본 논문에서는 미리 계산된 저해상도 CGH를 배열한 후 평행이동된 오목 렌즈 함수를 곱해주는 것을 통하여 고해상도 CGH를 생성하는 기법을 제안한다. Point cloud 방식으로 기록된 0.1기가픽셀의 CGH를 계산하고, 여기에 제안된 기법을 도입하여 2.5기가픽셀의 CGH를 매우 빠른 속도로 생성할 수 있었으며, 이렇게 생성된 CGH를 실험을 통하여 기록한 이미지상이 정상적으로 복원되는 것을 확인하였다.

비디오 인코더를 통한 딥러닝 모델의 정수 가중치 압축 (Compression of DNN Integer Weight using Video Encoder)

  • 김승환;류은석
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.778-789
    • /
    • 2021
  • 최근 다양한 분야에서 뛰어난 성능을 나타내는 Convolutional Neural Network(CNN)모델을 모바일 기기에서 사용하기 위한 다양한 연구가 진행되고 있다. 기존의 CNN 모델은 모바일 장비에서 사용하기에는 가중치의 크기가 크고 연산복잡도가 높다는 문제점이 있다. 이를 해결하기 위해 가중치의 표현 비트를 낮추는 가중치 양자화를 포함한 여러 경량화 방법들이 등장하였다. 많은 방법들이 다양한 모델에서 적은 정확도 손실과 높은 압축률을 나타냈지만, 대부분의 압축 모델들은 정확도 손실을 복구하기 위한 재학습 과정을 포함시켰다. 재학습 과정은 압축된 모델의 정확도 손실을 최소화하지만 많은 시간과 데이터를 필요로 하는 작업이다. Weight Quantization이후 각 층의 가중치는 정수형 행렬로 나타나는데 이는 이미지의 형태와 유사하다. 본 논문에서는 Weight Quantization이후 각 층의 정수 가중치 행렬을 이미지의 형태로 비디오 코덱을 사용하여 압축하는 방법을 제안한다. 제안하는 방법의 성능을 검증하기 위해 ImageNet과 Places365 데이터 셋으로 학습된 VGG16, Resnet50, Resnet18모델에 실험을 진행하였다. 그 결과 다양한 모델에서 2%이하의 정확도 손실과 높은 압축 효율을 달성했다. 또한, 재학습 과정을 제외한 압축방법인 No Fine-tuning Pruning(NFP)와 ThiNet과의 성능비교 결과 2배 이상의 압축효율이 있음을 검증했다.

MobileNetV2 기반의 개선된 Lightweight 모델을 이용한 열화도로 영상에서의 블랙 아이스 인식 (A Black Ice Recognition in Infrared Road Images Using Improved Lightweight Model Based on MobileNetV2)

  • 이옥걸;강선경
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1835-1845
    • /
    • 2021
  • 본 논문에서는 블랙 아이스를 정확하게 인식하고 도로 노면 정보를 운전자에게 미리 알려줘서 속도를 제어하고 예방 조치를 취할 수 있도록 하기 위해 열화 도로 영상을 기반으로 블랙 아이스 검출하기 위해 lightweight 네트워크를 제안한다. 전이학습을 이용하여 블랙 아이스 인식 실험을 하였고, 블랙 아이스 인식의 정확도 향상을 위해 MobileNetV2 기반의 개선된 lightweight 네트워크를 개발하였다. 계산량을 줄이기 위해 Linear Bottleneck 및 Inverted Residuals를 활용하여 4개의 Bottleneck 그룹을 사용하고 모델의 인식률 향상을 위해 각 Bottleneck 그룹에 3×3 컨볼루션 레이어를 연결하여 지역적 특징 추출을 강화하고 특징 맵의 수를 늘렸다. 마지막으로 구축된 블랙 아이스 데이터 세트 대상으로 블랙 아이스 인식 실험을 진행하였으며, 제안된 모델은 블랙 아이스에 대해 99.07%의 정확한 인식률을 나타내었다.