• 제목/요약/키워드: Low-cost Hardware

검색결과 346건 처리시간 0.025초

실시간 얼굴 검출을 위한 Cascade CNN의 CPU-FPGA 구조 연구 (Cascade CNN with CPU-FPGA Architecture for Real-time Face Detection)

  • 남광민;정용진
    • 전기전자학회논문지
    • /
    • 제21권4호
    • /
    • pp.388-396
    • /
    • 2017
  • 얼굴 검출에는 다양한 포즈, 빛의 세기, 얼굴이 가려지는 현상 등의 많은 변수가 존재하므로, 높은 성능의 검출 시스템이 요구된다. 이에 영상 분류에 뛰어난 Convolutional Neural Network (CNN)이 적절하나, CNN의 많은 연산은 고성능 하드웨어 자원을 필요로한다. 그러나 얼굴 검출을 위한 소형, 모바일 시스템의 개발에는 저가의 저전력 환경이 필수적이고, 이를 위해 본 논문에서는 소형의 FPGA를 타겟으로, 얼굴 검출에 적절한 3-Stage Cascade CNN 구조를 기반으로하는 CPU-FPGA 통합 시스템을 설계 구현한다. 가속을 위해 알고리즘 단계에서 Adaptive Region of Interest (ROI)를 적용했으며, Adaptive ROI는 이전 프레임에 검출된 얼굴 영역 정보를 활용하여 CNN이 동작해야 할 횟수를 줄인다. CNN 연산 자체를 가속하기 위해서는 FPGA Accelerator를 이용한다. 가속기는 Bottleneck에 해당하는 Convolution 연산의 가속을 위해 FPGA 상에 다수의 FeatureMap을 한번에 읽어오고, Multiply-Accumulate (MAC) 연산을 병렬로 수행한다. 본 시스템은 Terasic사의 DE1-SoC 보드에서 ARM Cortex A-9와 Cyclone V FPGA를 이용하여 구현되었으며, HD ($1280{\times}720$)급 입력영상에 대해 30FPS로 실시간 동작하였다. CPU-FPGA 통합 시스템은 CPU만을 이용한 시스템 대비 8.5배의 전력 효율성을 보였다.

Voltage-Frequency-Island NoC를 위한 테이블 기반의 고장 감내 라우팅 기법 (Table-Based Fault Tolerant Routing Method for Voltage-Frequency-Island NoC)

  • 윤성재;이창림;김용석;한태희
    • 전자공학회논문지
    • /
    • 제53권8호
    • /
    • pp.66-75
    • /
    • 2016
  • 반도체 공정 초미세화에 따라 에이징 (aging)과 공정 변이 (process variation)로 인한 칩에서의 물리적인 결함은 더욱 증가하고 있으며, 특히 금속 배선 스케일링 제한과 온 칩 데이터 통신량 증가에 따라 다수의 프로세서 코어로 구성된 네트워크-온-칩(Network-on-Chip, NoC)에서의 결함 감내 기법 연구가 활발히 진행되고 있다. 그러나 NoC에서 저전력 설계 기법으로 널리 채용되고 있는 VFI (Voltage-Frequency-Island)를 적용한 경우에서의 신뢰성 측면에 대한 연구가 부족한 실정이다. 본 논문에서는 신뢰성과 에너지 소모를 고려하여 VFI NoC에서 링크 고장이 발생하는 경우에도 정상적으로 통신을 유지할 수 있는 테이블 기반 라우팅 기법을 제안한다. 에너지 소모와 성능을 고려한 최적 경로와 고장 감내를 위한 우회 경로를 제공하며, 이때 우회 경로의 경우 필요한 최소한의 노드에만 라우팅 테이블을 저장하여 구현 복잡도를 완화하였다. 모의실험 결과를 통해 제안하는 기법은 전체 링크의 1%에서 고장이 발생하는 경우에도 정상적으로 통신함을 보였다. 또한 실시간으로 우회 경로를 탐색하는 고장 감내 라우팅 기법인 $d^2$-LBDR에 비해 링크에 고장이 발생하는 경우 평균 15.9%의 에너지 소모가 감소함을 보였으며, 실행 시간 측면에서는 평균 0.8% 감소하는 것을 확인 할 수 있었다.

ATM ABR의 공평성들을 위한 새로운 스케쥴링 알고리즘 (New Scheduling Algorithm for Fairness Criteria of ATM ABR)

  • 정경택;박준성;박현;전병실
    • 대한전자공학회논문지TC
    • /
    • 제39권4호
    • /
    • pp.188-200
    • /
    • 2002
  • WRR 스케줄링 알고리즘은 계산의 단순성과 저 비용 구현의 장점을 가지고 있어서 고속 패킷 스위칭 네트워크에서 널리 쓰이고 있지만 버스티한 트래픽에 대해서는 입력 트래픽을 일정 비율로 스케쥴링하기 때문에 효율성이 낮다는 문제점이 있다. 또한, WRR 알고리즘은 ABR 서비스 클래스의 공정성 기준인 MCR plus equal share와 Maximum of MCR or Max-Min share 공평성을 만족시키지 못한다. 또한 Nabeshima et al의 기법은 여분 대역에 대한 weight 값을 보정하지 않고 RR 방식으로 각 VC에 할당을 해주기 때문에 네트워크의 변화에 신속하게 적응하지 못할 뿐 만 아니라 대역폭을 효율적으로 이용하지 못한다. 따라서 ABR 서비스를 위한 공평성 기준을 만족시키고 빠르게 적응할 수 있는 스케줄링 알고리즘이 필요하다. 본 논문에서는 ABR 서비스를 위한 6가지 공평성 기준들 중 MCR plus equal share와 Maximum of MCR or Max-Min share 두 기준을 만족시키는 스케줄링 알고리즘을 제안한다. 제안된 알고리즘이 공평성 기준을 만족시키고, 네트워크 자원을 각 ABR VC들에게 신속하고 공평하게 할당해 주는지를 컴퓨터 시뮬레이션을 통하여 WRR, Nabeshima et al 알고리즘들과 비교, 분석한다.

CMOS 이미지 센서의 영상 개선을 위한 실시간 전처리 프로세서의 설계 (Design of Real-Time PreProcessor for Image Enhancement of CMOS Image Sensor)

  • 정윤호;이준환;김재석;임원배;허봉수;강문기
    • 대한전자공학회논문지SD
    • /
    • 제38권8호
    • /
    • pp.62-71
    • /
    • 2001
  • 본 논문은 CMOS 이미지 센서에서 획득한 영상의 품질을 개선하기 위한 실시간 전처리 프로세서의 설계를 제시한다. CMOS 이미지 센서는 기존 IC와의 통합, 저전력소모, 저가격화등의 다양한 이점을 갖지만, 기존의 CCD 소자로부터 획득한 영상에 비해 열등한 품질의 영상을 제공하는 단점이 있다. CMOS 이미지 센서의 이러한 물리적 한계를 극복하기 위해 본 논문에서 제안하는 전처리 프로세서에는 색상 보간, 색상 보정, 감마 보정, 자동 노출 조정 등의 기본적인 전처리 알고리즘 외에 공간 가변적 대비 향상 알고리즘이 포함되었다. 여기에서 제안하는 전처리 프로세서는 이러한 알고리즘을 효율적으로 구현하기 위한 하드웨어 구조를 가지며, VHDL 언어를 이용하여 설계 및 검증되었다. 설계된 전처리 프로세서는 합성 결과 약 19K의 논리 게이트를 포함하였으며, 이는 저가격의 PC 카메라 구현에 적합하다. 제안된 전처리 프로세서의 실시간 동작 여부를 검증하기 위해 설계된 전처리 프로세서는 Altera사의 Flex EPF10KGC503-3 FPGA 칩으로 구현되었으며, 성공적으로 동작함을 확인하였다.

  • PDF

CHANGING THE ANIMAL WORLD WITH NIR : SMALL STEPS OR GIANT LEAPS\ulcorner

  • Flinn, Peter C.
    • 한국근적외분광분석학회:학술대회논문집
    • /
    • 한국근적외분광분석학회 2001년도 NIR-2001
    • /
    • pp.1062-1062
    • /
    • 2001
  • The concept of “precision agriculture” or “site-specific farming” is usually confined to the fields of soil science, crop science and agronomy. However, because plants grow in soil, animals eat plants, and humans eat animal products, it could be argued (perhaps with some poetic licence) that the fields of feed quality, animal nutrition and animal production should also be considered in this context. NIR spectroscopy has proved over the last 20 years that it can provide a firm foundation for quality measurement across all of these fields, and with the continuing developments in instrumentation, computer capacity and software, is now a major cog in the wheel of precision agriculture. There have been a few giant leaps and a lot of small steps in the impact of NIR on the animal world. These have not been confined to the amazing advances in hardware and software, although would not have occurred without them. Rapid testing of forages, grains and mixed feeds by NIR for nutritional value to livestock is now commonplace in commercial laboratories world-wide. This would never have been possible without the pioneering work done by the USDA NIR Forage Research Network in the 1980's, following the landmark paper of Norris et al. in 1976. The advent of calibration transfer between instruments, algorithms which utilize huge databases for calibration and prediction, and the ability to directly scan whole grains and fresh forages can also be considered as major steps, if not leaps. More adventurous NIR applications have emerged in animal nutrition, with emphasis on estimating the functional properties of feeds, such as in vivo digestibility, voluntary intake, protein degradability and in vitro assays to simulate starch digestion. The potential to monitor the diets of grazing animals by using faecal NIR spectra is also now being realized. NIR measurements on animal carcasses and even live animals have also been attempted, with varying degrees of success, The use of discriminant analysis in these fields is proving a useful tool. The latest giant leap is likely to be the advent of relatively low-cost, portable and ultra-fast diode array NIR instruments, which can be used “on-site” and also be fitted to forage or grain harvesters. The fodder and livestock industries are no longer satisfied with what we once thought was revolutionary: a 2-3 day laboratory turnaround for fred quality testing. This means that the instrument needs to be taken to the samples rather than vice versa. Considerable research is underway in this area, but the challenge of calibration transfer and maintenance of instrument networks of this type remains. The animal world is currently facing its biggest challenges ever; animal welfare, alleged effects of animal products on human health, environmental and economic issues are difficult enough, but the current calamities of BSE and foot and mouth disease are “the last straw” NIR will not of course solve all these problems, but is already proving useful in some of these areas and will continue to do so.

  • PDF

교육용 레이다 시스템의 제작 및 실험 (Construction and Experiment of an Educational Radar System)

  • 지영훈;이훈열
    • 대한원격탐사학회지
    • /
    • 제30권2호
    • /
    • pp.293-302
    • /
    • 2014
  • 원격탐사에서 주로 사용되는 레이다 시스템에는 인공위성, 항공기 및 지상용 SAR 시스템을 비롯하여 산란계와 도플러 레이다 등이 있다. 이러한 시스템들은 고가의 장비들로 구성되며, 운용하는 데에 매우 전문적인 기술을 필요로 한다. 일반적인 대학이나 연구소에서는 장비의 구성과 운용에 대한 경험을 얻기 힘들기 때문에 레이다 및 SAR를 이용한 새로운 적용 분야를 이해하고 개척해 나아가는데 필수적인 하드웨어적 원리를 배우고 실습하기에 어려운 실정이다. 이를 극복하기 위하여 이 논문에서는 미국 MIT에서 제공하는 Cantenna 시스템의 설계도를 기반으로 한 레이다 시스템을 저가로 제작하고 실험한 내용을 소개한다. 제작된 레이다는 총 세 가지의 방식으로 운영되었는데, 첫째, 도플러 레이다를 이용하여 이동하는 차량의 속도를 측정하였고 둘째, 거리해상도를 가지는 레이다 방식을 이용하여 이동하는 두 물체의 움직임을 측정하였다. 마지막으로, 지상용 SAR 방식으로 방위각 해상도를 높여 이차원의 영상을 획득하였다. 추가적으로 영상화에 사용되는 Deramp-FFT 알고리즘과 ${\omega}-k$ 알고리즘의 비교 및 안테나의 위치 측정 오차에 따른 영향을 분석하기 위해 시뮬레이션을 수행하였다. 향후 샘플링 주파수의 증가, I/Q 샘플링 및 보다 안정적인 회로를 구현하면 무인 항공기에 탑재할 수 있는 가벼운 SAR 시스템으로도 발전할 수 있을 것으로 기대된다.

의료 및 산업용 X-선 발생장치의 선량평가를 위한 면적선량계(DAP) 개발 (Development of DAP(Dose Area Product) for Radiation Evaluation of Medical and Industrial X-ray generator)

  • 곽동훈;이상헌;이승호
    • 전기전자학회논문지
    • /
    • 제22권2호
    • /
    • pp.495-498
    • /
    • 2018
  • 본 논문에서는 의료 및 산업용 X-선 발생장치의 선량평가를 위한 면적선량계(DAP)의 시스템을 제안한다. 제안하는 시스템은 Ion-Chamber를 이용한 면적선량 측정기술을 기반으로 진단용 X-선 장치에 의해 발생된 피폭선량을 명확히 측정할 수 있다. 면적선량계의 하드웨어부는 공기 중에서 X-선에 의해 전리되는 전하의 양을 측정한다. 미소 전류를 통한 누적선량 측정을 위한 고속 처리 알고리즘부는 입력 손실 없이 낮은 구현비용(전력)으로 X-선에 의해 전리되는 전하의 양을 측정한다. X-선 발생장치의 동작에 동기화된 유무선 송수신 프로토콜부는 통신 속도를 향상시킨다. 연동 및 에이징을 위한 PC 기반 제어 프로그램부는 실시간으로 발생된 X-선량을 측정하여 PC용 GUI를 통해 측정 그래프 및 수치 모니터링이 가능하도록 한다. 제안된 시스템의 성능을 공인시험기관에서 평가한 결과, 각각의 에너지 대역(30, 60, 100, 150kV)에서 면적선량계에 측정되는 값이 선형적으로 증가됨을 확인할 수가 있었다. 또한 4등분한 지점에서 측정기의 지시치에 대한 표준편차가 ${\pm}1.25%$를 나타내어서 면적선량계가 위치에 관계없이 균일한 측정값을 나타냄을 확인하였다. 한편, ${\pm}4.2%$의 불확도가 측정되어서 국제 표준인 ${\pm}15%$ 이하에서 정상동작 됨이 확인되었다.

멀티 세그먼트 곱셈 기반 저비용 타원곡선 암호 프로세서 (Low-Cost Elliptic Curve Cryptography Processor Based On Multi-Segment Multiplication)

  • 이동호
    • 대한전자공학회논문지SD
    • /
    • 제42권8호
    • /
    • pp.15-26
    • /
    • 2005
  • 본 논문에서는 효율적인 $GF(2^m)$ 멀티 세그먼트 곱셈 연산 구조를 제안하고 제안된 구조의 타원곡선 암호 프로세서 설계 응용을 연구한다. 제안된 멀티 세그먼트 곱셈 연산 구조는 유한체 크기 m에 비하여 아주 작은 워드 조합 곱셈기를 이용하여 부분곱을 계산하고 거의 모든 내부 버스는 워드 크기이며 m 비트 멀티플렉서와 m 비트 레지스터를 하나만 사용한다. 따라서 조합 곱셈기의 워드 크기 w를 줄이고 세그먼트 수 k를 크게 하여 전체 데이터패스 자원 사용량이 최소화할 수 있다. 제안된 곱셈기는 디지트 시리얼 곱셈기로 구현된 ECC 프로세서와 비교할 때 이론적으로 자원 효율성이 우수하다 암호 프로세서의 자원 사용량은 구현에 필요한 기본 하드웨어 요소 수뿐만 아니라 구성 요소들의 배치와 연결 상태에도 의존한다. 제안된 프로세서의 실질적인 자원사용량을 디지트 시리얼 곱셈기 기반 암호 프로세서와 비교하기 위하여 두 종류의 프로세서를 FPGA 상에 구현하였다. 실험 결과로 제안된 멀티 세그먼트 곱셈기 기반 EU 프로세서는 유사한 성능을 가지는 디지트 시리얼 곱셈기 기반 EU 프로세서보다 자원 사용면에서 2배 정도 우수함을 보였다.

심층 학습 기법을 이용한 탄성파 자료 잡음 제거 적용사례 분석 (Case Analysis of Applications of Seismic Data Denoising Methods using Deep-Learning Techniques)

  • 조준현;하완수
    • 지구물리와물리탐사
    • /
    • 제23권2호
    • /
    • pp.72-88
    • /
    • 2020
  • 최근 컴퓨터 하드웨어 성능의 급속한 발전으로 인해 계산 비용이 상대적으로 낮아지면서 기계 학습 기법을 지구물리학적 문제에 적용하는 사례가 점차 증가하고 있다. 특히 심층 학습 기법이 복잡하고 비선형적인 문제를 성공적으로 해결하는 사례가 많아지면서 큰 인기를 얻고 있다. 이 논문에서는 심층 학습 기법을 이용한 탄성파 자료 잡음 제거 적용사례를 조사하고 소개하였다. 감쇠하고자 하는 잡음 유형에 따라 일관성 잡음 적용사례, 무작위 잡음 적용사례, 일관성 잡음 및 무작위 잡음 적용사례로 분류하였고 해당 잡음 제거에 사용된 심층 학습 기법에 대해 조사하였다. 대표적인 심층 학습 기법인 심층 신경망은 탄성파 잡음 제거에 사용된 기존 기법과 달리 잡음의 특징을 스스로 학습하며 매개변수를 자동으로 최적화한다. 따라서 기존 기법에 비해 일반화 문제에 덜 민감하며 인적 비용을 절감할 수 있다. 또한 여러 연구 사례를 통해 계산 비용이나 잡음 제거 성능 측면에서도 심층 학습 기법이 뛰어난 성과를 달성하는 것을 보여주었다. 연구 결과들을 토대로 탄성파 잡음 제거에 사용된 심층 학습 기법의 장단점에 대해 분석하고 논의하였다.

MVC+Prefetch Controller 패턴을 사용한 모바일 기기의 성능향상 기법 (Performance improvement on mobile devices using MVC+Prefetch Controller Pattern)

  • 임병재;이은석
    • 정보처리학회논문지D
    • /
    • 제18D권3호
    • /
    • pp.179-184
    • /
    • 2011
  • 모바일 기기는 유연한 이동성을 제공하는 대신에 제한된 자원을 가지고 있는 휴대용 장치로서, 최근에는 단순한 몇 가지의 기능만 제공하던 기존의 한계를 넘어서 많은 부가기능들을 추가적으로 제공하고 있다. 하지만 낮은 성능의 프로세서와 제한된 배터리용량으로 인해 사용자가 만족할 수 있는 성능을 제공하지 못하는 문제점이 발생하고 있다. 이러한 성능이슈는 하드웨어 교체를 통해 쉽게 해결될 수 있으나, 제품가격 상승이라는 치명적 단점을 가지고 있다. 본 논문에서는 성능이슈와 제품가격 상승 이라는 두 가지 문제를 동시에 해결하기 위하여 사용자 체감성능을 개선하는 방법을 제시한다. 사용자 체감성능은 사용자가 화면터치 또는 키패드를 통해 모바일 기기에 화면갱신 명령을 입력하고 모바일 기기의 출력장치인 LCD화면에 화면구성을 완료하는데 까지 걸리는 시간이 매우 중요한 요소이다. 모바일 기기는 물리적으로 작은 LCD화면을 사용하기 때문에 한번에 보여줄 수 있는 데이터의 양이 제한적이다. 화면을 구성하기 위해서 LCD화면에 보여줄 수 있는 양의 데이터만 사용한다면 빠른 화면구성을 할 수 있다. 이렇게 최소한의 데이터를 계산하고 DB에서 가져와 빠른 화면구성을 할 수 있도록 하는 Controller를 기존의 MVC 패턴에 추가한 MVC+Prefetch Controller 패턴을 제안한다. 제안한 패턴을 사용하면 사용자가 만족할 만한 체감성능을 보장할 수 있다. MVC+Prefetch Controller 패턴을 삼성전자 휴대폰 모델 S8500에 적용하여 사용자 체감성능 개선을 확인하였다.