• 제목/요약/키워드: hardware optimization

검색결과 210건 처리시간 0.029초

소스코드의 분석을 통한 알고리즘 레벨에서의 소프트웨어 복잡도 측정 방법 (The Software Complexity Estimation Method in Algorithm Level by Analysis of Source code)

  • 임웅;남정학;심동규;조대성;최웅일
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.153-164
    • /
    • 2010
  • 프로그램은 실행파일 내의 각 명령어를 수행함으로써 전력을 소비한다. 소비 전력은 복잡도와 비례하기 때문에 프로그램의 복잡도를 측정함으로써 예측될 수 있다. 일반적으로 소프트웨어의 복잡도는 마이크로프로세서 시뮬레이터를 사용하여 측정한다. 그러나 시뮬레이터를 사용한 복잡도 측정방법은 하드웨어를 트랜지스터 레벨과 같은 낮은 레벨에서 모델링하기 때문에 수행시간이 오래 걸리고, 단순히 정량적 측정치만을 제공한다. 본 논문에서는 소프트웨어의 최상위 레벨인 프로그램의 소스코드를 분석하고, 복잡도 매트릭을 생성하여 프로그램 전체에 대한 복잡도를 수식화하여 표현하는 방법을 제안한다. 또한 복잡도 매트릭을 함수 단위로 생성함으로써 연산이 집중되는 모듈에 대한 세분화된 정보를 제공할 수 있다. 제안한 알고리즘의 성능분석은 게이트 레벨 마이크로프로세서 시뮬레이터인 SimpleScalar와의 비교를 통해서 수행하였다. 분석을 위해 사용된 소프트웨어는 최신 비디오코덱인 H.264/AVC에서 사용되는 $4{\times}4$ 정수변환, 화면 내 예측, 화면 간 예측 모듈이다. 각각의 소프트웨어에 대하여 정량적으로 측정된 성능 분석을 위하여 입력된 각 모듈에 대한 실행 명령어의 수를 비교하였으며, 정확도는 SimpleScalar를 통하여 측정된 시뮬레이션 결과 대비 약 11.6%, 9.6%, 3.5%의 오차를 보였다.

2.4GHz ISM 대역 응용을 위한 저전력 CMOS Fractional-N 주파수합성기 설계 (Design of a Low-Power CMOS Fractional-N Frequency Synthesizer for 2.4GHz ISM Band Applications)

  • 오근창;김경환;박종태;유종근
    • 대한전자공학회논문지SD
    • /
    • 제45권6호
    • /
    • pp.60-67
    • /
    • 2008
  • 본 논문에서는 Bluetooth, Zigbee, WLAN 등 2.4GHz 대역 ISM-band 응용 분야를 위한 저 전력 주파수 합성기를 설계하였다. 저 전력 특성을 얻기 위해 전류소모가 큰 VCO, prescaler, ${\Sigma}-{\Delta}$ modulator 등의 전력소모를 최적화하는데 중점을 두고 설계하였다. VCO는 전력소모 측면에서 유리한 NP-core 유형의 구조를 선택하여 위상잡음 특성과 전력소모를 최적화하였으며, prescaler는 정적 전류소모가 거의 없는 동적 회로 기술이 적용된 D-F/F을 사용하여 전력소모를 줄였다. 또한 다수의 로직으로 구성되는 3차 ${\Sigma}-{\Delta}$ modulator는 'mapping circuit'으로 구조를 단순화하여 작은 면적과 저 전력소모 특성을 갖도록 하였다. $0.18{\mu}m$ CMOS 공정으로 IC를 제작하여 성능을 측정한 결과 설계된 주파수 합성기는 1.8V 전원전압에서 7.9mA의 전류를 소모하고, 100kHz offset에서 -96dBc/Hz, 1MHz offset에서 -118dBc/Hz의 위상 잡음 특성을 보였다 또한 spur 잡음 특성은 -70dBc이며, 25MHz step의 주파수 변화에 따른 위상 고정 시간은 약 $15{\mu}s$이다. 설계된 회로의 칩 면적은 pad를 포함하여 $1.16mm^2$이며 pad를 제외한 면적은 $0.64mm^2$이다.

K-FPGA 패브릭 구조의 평가 툴킷 (Evaluation Toolkit for K-FPGA Fabric Architectures)

  • 김교선
    • 대한전자공학회논문지SD
    • /
    • 제49권4호
    • /
    • pp.15-25
    • /
    • 2012
  • FPGA용 CAD툴에 대한 학계의 연구는 상용 FPGA에 적용하기에는 단순하고 비효율적인 아키텍처를 가정하고 있기 때문에 실용성 측면에서 뒤처져 왔다. 최근 상용 FPGA 아키텍처의 배치 위치 및 배선 그래프 데이터베이스를 구축하고 인터페이스를 제공함으로써 상용 FPGA에 적용할 수 있는 배치 배선 툴의 개발을 가능하게 하려는 시도가 있었다. 본 논문은 신규 FPGA 아키텍처로 개발되고 있는 K-FPGA의 경쟁력을 벤치마킹 할 수 있는 툴킷 개발에 대해 기술한다. 이는 학계 CAD 툴의 실용성 한계를 한층 더 확장하고 있다. 기존 상용 툴과 매핑, 패킹, 배치, 배선 각 단계 별로 데이터를 교환할 수 있어 세부 툴별 비교 평가가 가능하며 이전 단계의 결과물을 기다리거나 결과의 질에 영향을 받지 않으면서 각 단계를 독립적으로 개발할 수 있는 체계를 구축하였다. 또한, 상용 FPGA의 아키텍처를 추출하여 단위 셀 라이브러리를 구축함으로써 FPGA 아키텍처의 신규 개발 시 참조 설계 역할을 할 뿐만 아니라 상시 벤치마킹 환경을 제공하도록 하였다. 특히, 아키텍처 정보를 툴 내에 하드 코딩하지 않고 하드웨어 설계자에게 익숙한 표준 HDL 형식으로 기술하여 읽어 들일 수 있도록 함으로써 아키텍처에 수시로 다양한 변경을 시도하면서 최적화해도 툴이 유연하게 수용할 수 있는 데이터 구동 방식의 툴 개발을 추구하였다. 실험을 통해 단위 셀 라이브러리 및 툴 기능을 검증하였으며 개발 중에 변경되고 있는 FPGA 아키텍처 상에서 임의의 설계를 매핑해 보고 정상 동작할 지 시뮬레이션으로 검증할 수 있음을 확인하였다. 배치 및 배선 툴이 개발 중이며 이들이 완성되면 실용적이고 다양한 신규 FPGA 아키텍처들을 개발하고 그 경쟁력을 평가할 수 있게 될 뿐만 아니라 신규 아키텍처를 위한 최적화 CAD 툴 개발 연구가 활발해지는 시너지 효과도 기대할 수 있다.

트램 운영을 위한 신호제어 전략 및 신호제어기의 개발 (Development of the Traffic Signal Control Strategy and Signal Controller for Tram)

  • 이인규;김영찬;이주일;오승훈
    • 대한교통학회지
    • /
    • 제33권1호
    • /
    • pp.70-80
    • /
    • 2015
  • 본 연구는 최근 국내 도입이 추진되고 있는 궤도교통수단인 트램이 일반교통류와 도로를 공유했을 때 발생할 수 있는 문제를 예상하고, 트램운영의 효율성과 안정성을 확보할 수 있는 신호운영 전략과 통합 신호운영이 가능한 신호제어기 시작품을 개발하는데 연구의 목적이 있다. 통합 신호운영을 위해 고정식 트램 우선신호와 능동식 트램 우선신호를 포함한 3단계의 유기적인 통합 신호제어 전략을 수립하였고, 각 단계별 전략수행을 위한 신호운영 알고리즘을 개발하였다. 개발된 신호제어 알고리즘을 S/W로 구현하고, 표준 신호제어기에 기반한 H/W로 제작하였고, 이를 평가하기 위한 통합 신호제어 시뮬레이터(Hardware in the Loop Simulation system: HILS)를 개발하였다. 미시적 시뮬레이션 프로그램을 통해 통합 신호제어 전략의 효과와 개발된 통합 신호제어기의 성능을 평가한 결과, 본 연구를 통해 개발된 신호제어 알고리즘으로 산출한 교차로 신호시간이 트램차량의 신호교차로 정지수와 통행시간을 감소시켰음을 확인하였고, 트램 우선신호에 따른 일반차량의 지체증가가 거의 나타나지 않음을 확인하였다. 또한 통합 신호제어 시뮬레이터를 통해 개발된 통합 신호제어기의 H/W와 S/W의 기능 수행 여부을 확인하였다.

SSD 수명 관점에서 리눅스 I/O 스택에 대한 실험적 분석 (An Empirical Study on Linux I/O stack for the Lifetime of SSD Perspective)

  • 정남기;한태희
    • 전자공학회논문지
    • /
    • 제52권9호
    • /
    • pp.54-62
    • /
    • 2015
  • 낸드 플래시 기반의 SSD (Solid-State Drive)는 HDD (Hard Disk Drive) 대비 월등한 성능에도 불구하고 쓰기 회수 제한이라는 태생적 단점을 가지고 있다. 이로 인해 SSD의 수명은 워크로드에 의해 결정되어 SSD의 기술 변화 추세인 SLC (Single Level Cell) 에서 MLC (Multi Level Cell) 로의 전환, MLC에서 TLC (Triple Level Cell) 로의 전환에 있어 큰 도전이 될 수 있다. 기존 연구들은 주로 wear-leveling 또는 하드웨어 아키텍처 측면에서 SSD의 수명 개선을 다루었으나, 본 논문에서는 호스트가 요청한 쓰기에 대해 SSD가 낸드플래시 메모리를 통해 처리하는 수명관점의 효율성을 대변하는 WAF (Write Amplification Factor) 관점에서 Host I/O 스택 중 파일 시스템, I/O 스케줄러, 링크 전력에 대해 JEDEC 엔터프라이즈 워크로드를 이용해 I/O 스택 최적 구성에 대해 실험적 분석을 수행하였다. WAF는 SSD의 FTL의 효율성을 측정하는 지표로 수명관점에서 가장 객관적으로 사용한다. I/O 스택에 대한 수명 관점의 최적 구성은 MinPower-Dead-XFS로 최대 성능 조합인 MaxPower-Cfq-Ext4에 비해 성능은 13% 감소하였지만 수명은 2.6 배 연장됨을 확인하였다. 이는 I/O 스택의 최적화 구성에 있어, SSD 성능 관점뿐만 아니라 수명 관점의 고려에 대한 유의미를 입증한다.

강 뼈대구조물의 총 경비와 부재연결과의 상반관계에 관한 연구 (Computational Approach for the Trade-Off Study between the Total Cost and the Member Connections in Steel Frames)

  • 최병한;임정환
    • 한국강구조학회 논문집
    • /
    • 제19권1호
    • /
    • pp.15-27
    • /
    • 2007
  • 지난 10년간 건설 환경에서 노무비는 재료비에 대해 상대적으로 계속해서 증가하고 있다. 따라서 강구조물의 최적 설계를 위해 널리 쓰이고 있는 최소중량설계는 더 이상 최소경비설계를 의미하지 못한다. 최근의 강 구조물의 제작 시 재료비 외에 부재연결에 소요되는 경비가 실제로 총 제작비에 커다란 영향을 미치는 것을 알 수 있다. 그럼에도 불구하고 대부분의 연구가 최소 중량설계나 구조물의 고등해석에만 이루어지고 있다. 따라서 본 연구는 횡 방향 하중에 효과적으로 저항하도록 보와 기둥이 모멘트 연결된 강 뼈대 구조물을 대상으로 안정성에 문제가 없이 경비절감에 효과적인 설계를 위해 재료비뿐만 아니라 제작비 및 현장에서 가설 시 부재연결에 소요되는 경비를 포함하는 최소 경비 설계를 수행하고자 한다. 하중저항계수설계법에 따른 전단과 처짐 및 보-기둥 상관관계식을 포함하는 비선형 해석과정과 유전알고리즘을 바탕으로 한 최적화 알고리즘을 결합하여 모멘트 부재연결의 수를 줄이고 또한 효과적인 배치를 수행함으로 최적 설계 해 및 모멘트 연결의 수와 총 경비와의 상반관계를 나타내고 이로부터 최적의 모멘트 연결의 수 및 그 배치를 구하였다. 현실적인 하중조건을 고려한 수치 예를 통해 본 연구의 적용성과 효율성을 나타내었다.

스마트폰의 CMOS 영상센서를 이용한 광용적맥파 측정방법 개발 (Development of a Photoplethysmographic method using a CMOS image sensor for Smartphone)

  • 김호철;정원식;이권희;남기창
    • 한국산학기술학회논문지
    • /
    • 제16권6호
    • /
    • pp.4021-4030
    • /
    • 2015
  • 맥파는 심전도와 같이 자율신경계를 통해 생리적 반응을 측정하는 신호이지만, 손가락에 센서 하나만 부착시키면 되기 때문에 상대적으로 신호의 측정이 간편하다는 장점을 가지고 있어 u-Healthcare 분야에서의 활용이 용이하다. 따라서 본 연구의 목적은 스마트폰 카메라의 CMOS 영상 센서를 활용하여 맥파를 비침습적으로 측정하는 방법 중의 하나인 광용적맥파를 획득하고 이로부터 스트레스 여부를 판단하는 휴대형 시스템을 개발하여 u-Healthcare 분야에서의 활용 가능성을 확인하는 것이다. 이를 위해 광용적맥파를 별도의 센서에 의한 측정이 아닌 스마트폰 카메라에서 획득되는 영상 데이터를 활용하여 광용적맥파를 획득한 후 분석하였다. 또한 확보된 광용적맥파 영상신호 데이터를 이용하여 심박변이도와 스트레스 지수를 별도의 호스트 장비 없이 스마트폰만을 이용해 사용자에게 제공 하였다. 또한 부가적으로 스마트폰에 부착가능한 별도의 하드웨어 디바이스를 개발함으로써 획득된 데이터의 신뢰도 및 정확성을 향상시켰다. 실험결과를 통해 스마트폰의 카메라 영상을 활용하여 광용적맥파 신호를 통한 심박수 측정과 스트레스의 정도를 분석하기 위한 스트레스 지수 추출이 가능함을 확인할 수 있었다. 본 연구에서는 상용화된 제품 또는 정형화된 센서가 아닌 스마트폰의 카메라를 이용하기 때문에 상용화된 외부 센서에 의한 광용적맥파 신호보다는 해상도가 떨어지는 단점이 있음에도 불구하고 결과 데이터의 신뢰도 향상을 위한 별도의 추가외부 장치 개발 및 여러 가지 최적화 알고리즘을 통해 신뢰성 있는 데이터를 확보할 수 있어 u-Healthcare 장비로써의 활용 가능성을 확인할 수 있었다.

가상화 시스템에서 Virtio와 SR-IOV 적용에 대한 단일 및 다중 네트워크 성능 평가 및 분석 (Performance Evaluation and Analysis on Single and Multi-Network Virtualization Systems with Virtio and SR-IOV)

  • 이재학;임종범;유헌창
    • 정보처리학회 논문지
    • /
    • 제13권2호
    • /
    • pp.48-59
    • /
    • 2024
  • 하드웨어 자체적으로 가상화를 지원하는 기능들이 추가됨에 따라 다양한 작업 유형을 가진 사용자 어플리케이션들이 가상화 시스템에서 효율적으로 운용되고 있다. 가상화 지원 기능 중 SR-IOV는 PCI 장치에 대한 직접 접근을 통해 하이퍼바이저 또는 운영체제 개입을 최소화하여 시스템 성능을 높이는 기술로 베어-메탈 시스템 대비 비교적 긴 I/O 경로 및 사용자 영역과 커널 영역에 대한 빈번한 컨텍스트 스위칭 등 가상화 계층의 추가로 낮은 네트워크 성능을 가진 가상화 시스템에서 네트워크 I/O 가속화를 실현하게 해준다. 이러한 성능적 이점을 이용하기 위해 가상머신 또는 컨테이너와 같은 인스턴스에 SR-IOV를 접목할 시 최적의 네트워크 I/O 성능을 도출할 수 있는 네트워크 자원 관리 정책이 활발히 연구되고 있다. 본 논문은 I/O 가속화를 실현하는 SR-IOV의 네트워크 성능을 1) 네트워크 지연 시간, 2) 네트워크 처리량, 3) 네트워크 공정성, 4) 성능간섭, 5) 다중 네트워크와 같은 측면으로 세밀한 성능 평가 및 분석을 Virtio와 비교하여 진행한다. 본 논문의 기여점은 다음과 같다. 첫째, 가상화 시스템에서 Virtio와 SR-IOV의 네트워크 I/O 과정을 명확히 설명했으며, 둘째, Virtio와 SR-IOV의 네트워크 성능을 다양한 성능 메트릭을 기반으로 분석하였다. 셋째, 가상머신 밀집도가 높은 환경에서 SR-IOV 네트워크에 대한 시스템 오버헤드 및 이에 대한 최적화 가능성을 실험으로 확인하였다. 본 논문의 실험 결과 및 분석들은 스마트 팩토리, 커넥티드-카, 딥러닝 추론 모델, 크라우드 소싱과 같은 네트워크 집약적인 서비스들을 운용하는 가상화 시스템에 대한 네트워크 자원 관리 정책에 활용될 것으로 기대된다.

안전한 센서 네트워크를 위한 스트림 암호의 성능 비교 분석 (Performance Analysis and Comparison of Stream Ciphers for Secure Sensor Networks)

  • 윤민;나형준;이문규;박근수
    • 정보보호학회논문지
    • /
    • 제18권5호
    • /
    • pp.3-16
    • /
    • 2008
  • 무선 센서 네트워크는 센서 노드 또는 모트(mote)라 불리는 소형 장치들로 이루어진 무선 네트워크이다. 최근 센서 네트워크에 대한 연구가 활발한 가운데 센서 네트워크에서의 보안에 관한 연구 또한 활발히 진행되고 있다. 센서 노드 및 센서 네트워크 상의 정보를 안전하게 저장, 전송하기 위해서는 암호 알고리즘의 구현이 필요하며, 이 암호 알고리즘들은 센서 노드의 한정된 자원을 효과적으로 활용할 수 있도록 효율적인 구현이 필수적이다. 센서 노드 상에서 이용될 수 있는 암호로는 TinyECC 등의 공개키 암호와 AES와 같은 표준 블록 암호가 있으나, 스트림 암호는 최근에서야 eSTREAM 프로젝트에서 표준화가 완료되어 아직 센서 노드상에서 사용 가능성이 명확하지 않은 실정이다. 이에 본 논문에서는 eSTREAM의 2단계와 3단계에 채택되었던 10개 소프트웨어 기반 암호들 중 9개의 암호들을 MicaZ 모트 상에 구현하여 성능을 비교하고, 특히 최종적으로 eSTREAM에 채택된 SOSEMANUK, Salsa20, Rabbit을 포함한 6개 암호에 대해서는 MicaZ에 적합하도록 최적화하였다. 또한 참조 구현으로써 하드웨어용 스트림 암호 및 AES-CFB에 대한 실험 결과도 제시한다. 본 논문의 실험에 따르면, 대부분의 스트림 암호가 약 31Kbps - 406Kbps의 암호화 성능을 보임으로써 센서 노드에서 사용하기에 큰 무리가 없음을 확인할 수 있었다. 특히 최종적으로 채택된 SOSEMANUK, Salsa20, Rabbit의 경우 센서 노드에 적합한 128바이트 크기의 작은 패킷의 암호화에서 각각 406Kbps, 176Kbps, 121Kbps의 속도를 보여주고, 70KB, 14KB, 22KB의 ROM및 2811B, 799B, 755B의 RAM을 사용함으로써, 106Kbps의 속도를 보여준 소프트웨어 기반 AES에 비해 우수한 성능을 보임을 알 수 있었다.

계층적 군집화 기반 Re-ID를 활용한 객체별 행동 및 표정 검출용 영상 분석 시스템 (Video Analysis System for Action and Emotion Detection by Object with Hierarchical Clustering based Re-ID)

  • 이상현;양성훈;오승진;강진범
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.89-106
    • /
    • 2022
  • 최근 영상 데이터의 급증으로 이를 효과적으로 처리하기 위해 객체 탐지 및 추적, 행동 인식, 표정 인식, 재식별(Re-ID)과 같은 다양한 컴퓨터비전 기술에 대한 수요도 급증했다. 그러나 객체 탐지 및 추적 기술은 객체의 영상 촬영 장소 이탈과 재등장, 오클루전(Occlusion) 등과 같이 성능을 저하시키는 많은 어려움을 안고 있다. 이에 따라 객체 탐지 및 추적 모델을 근간으로 하는 행동 및 표정 인식 모델 또한 객체별 데이터 추출에 난항을 겪는다. 또한 다양한 모델을 활용한 딥러닝 아키텍처는 병목과 최적화 부족으로 성능 저하를 겪는다. 본 연구에서는 YOLOv5기반 DeepSORT 객체추적 모델, SlowFast 기반 행동 인식 모델, Torchreid 기반 재식별 모델, 그리고 AWS Rekognition의 표정 인식 모델을 활용한 영상 분석 시스템에 단일 연결 계층적 군집화(Single-linkage Hierarchical Clustering)를 활용한 재식별(Re-ID) 기법과 GPU의 메모리 스루풋(Throughput)을 극대화하는 처리 기법을 적용한 행동 및 표정 검출용 영상 분석 시스템을 제안한다. 본 연구에서 제안한 시스템은 간단한 메트릭을 사용하는 재식별 모델의 성능보다 높은 정확도와 실시간에 가까운 처리 성능을 가지며, 객체의 영상 촬영 장소 이탈과 재등장, 오클루전 등에 의한 추적 실패를 방지하고 영상 내 객체별 행동 및 표정 인식 결과를 동일 객체에 지속적으로 연동하여 영상을 효율적으로 분석할 수 있다.