• 제목/요약/키워드: Processor Core

검색결과 396건 처리시간 0.027초

시각물체 추적 시스템을 위한 멀티코어 프로세서 기반 태스크 스케줄링 방법 (A Task Scheduling Strategy in a Multi-core Processor for Visual Object Tracking Systems)

  • 이민채;장철훈;선우명호
    • 한국자동차공학회논문집
    • /
    • 제24권2호
    • /
    • pp.127-136
    • /
    • 2016
  • The camera based object detection systems should satisfy the recognition performance as well as real-time constraints. Particularly, in safety-critical systems such as Autonomous Emergency Braking (AEB), the real-time constraints significantly affects the system performance. Recently, multi-core processors and system-on-chip technologies are widely used to accelerate the object detection algorithm by distributing computational loads. However, due to the advanced hardware, the complexity of system architecture is increased even though additional hardwares improve the real-time performance. The increased complexity also cause difficulty in migration of existing algorithms and development of new algorithms. In this paper, to improve real-time performance and design complexity, a task scheduling strategy is proposed for visual object tracking systems. The real-time performance of the vision algorithm is increased by applying pipelining to task scheduling in a multi-core processor. Finally, the proposed task scheduling algorithm is applied to crosswalk detection and tracking system to prove the effectiveness of the proposed strategy.

병렬 알고리즘의 가속화를 위한 GP-GPU의 Thread할당 기법 (Thread Distribution Method of GP-GPU for Accelerating Parallel Algorithms)

  • 이관호;김치용
    • 전기전자학회논문지
    • /
    • 제21권1호
    • /
    • pp.92-95
    • /
    • 2017
  • 본 논문에서는 적은 면적의 GP-GPU에서 성능을 향상시키기 위한 방법을 제안한다. 본 논문에서는 superscalar와 같이 과도하게 스케줄링 복잡성을 증가시키지 않는 대신 단순한 코어의 수를 늘려 성능을 극대화 시키는 방법을 제안한다. GP-GPU를 구성하는 Stream Processor의 구조를 단순화한다. 또한, Warp Schedule에서 thread 할당을 어플리케이션에 적합한 방법을 개발하여 성능을 개선한다. 성능을 검증하는 방안으로 neural network의 한 분야인 딥러닝에 대한 스레드 할당방식을 제안한다. Neural Network 알고리즘의 경우 Intel CPU 대비 90%에서 ARM Cortex-A15 4 core 대비 98% 성능 향상을 확인할 수 있었다.

비디오 감시 시스템을 위한 멀티코어 프로세서 기반의 병렬 SVM (Multicore Processor based Parallel SVM for Video Surveillance System)

  • 김희곤;이성주;정용화;박대희;이한성
    • 정보보호학회논문지
    • /
    • 제21권6호
    • /
    • pp.161-169
    • /
    • 2011
  • 최근 지능형 비디오 감시 시스템은 영상 분석 및 인식기술 등의 보다 진화된 기술 개발을 요구하고 있다. 특히, 비디오 영상에서 객체를 식별하기 위하여 Support Vector Machine(SVM)과 같은 기계학습 알고리즘이 이용된다. 그러나 SVM은 대용량의 데이터를 학습시키기 위하여 많은 계산량이 필요하기 때문에 수행시간을 효율적으로 감소시키기 위하여 병렬처리 기법을 적용할 필요가 있다. 본 논문에서는, 최근 사용이 증가하고 있는 멀티코어 프로세서를 활용한 SVM 학습의 병렬처리 방법을 제안한다. 4-코어 프로세서를 이용한 실험 결과, 제안 방법은 SVM 학습의 순차처리 방법과 비교하여 2.5배 정도 수행시간이 감소됨을 확인하였다.

Binutils를 이용한 Retargetable Assembler 와 Linker 의 개발 (Development of Retargetable Assembler & Linker based on Binutils)

  • 윤종희;김호균;안민욱;최영규;김대호;정지문;백윤홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.843-845
    • /
    • 2008
  • CE (Consumer Electronics) 시장에서 Embedded System 은 time-to-market 이라는 개념이 나날이 중요해 지고 있다. 시스템의 중심인 core processor 에 대하여 지원하는 여러 가지 software toolkit 의 빠른 개발은 무엇보다 중요해지고 있다. 이 논문에서는 GNU Binutils 를 기반으로 ADL 을 이용하여 Embedded system의 core processor 를 위하여 신속한 Assembler 와 Linker 를 개발하는 플랫폼을 개발하였다. 이 플랫폼은 서울대학교 소프트웨어 최적화 연구실에서 개발한 ADL (Architecture Description Language)[1] 을 이용하여 core processor 를 기술하면 자동으로 Assembler 와 Link 를 생성해주는 시스템이다.

내장형 제어용 프로세서를 위한 명령어 기반 범용 시뮬레이터 개발 (A Design of Instruction-Set Based Simulator of Processor for Embedded Application System)

  • 양훈모;정종철;김도집;이문기
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(2)
    • /
    • pp.357-360
    • /
    • 2001
  • As SOC design methodology becomes popular, processors, the essential core in embedded system are required to be designed fast and supported to customers with expansive behavior description. This paper presents new methodology to meet such goals with designer configurable instruction set simulator for processors. This paper proposes new language called PML(Processor Modeling Language), which is based on microprogramming scheme and is also successful in most behavior of processors. By using this, we can describe scalar processor very efficiently with by-far faster simulation speed in compared with HDL model.

  • PDF

ARM11 을 이용한 MoIP 월패드 플랫폼 구현 (Design and Implementation MoIP Wall-pad platform using ARM11)

  • 정용국;김대성;허광선;권민수;최영규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.46-49
    • /
    • 2011
  • This paper is to implement MoIP platform to send and receive video and audio at the same time by using high-performance Dual Core Processor. Even if Wall-Pad key component of a home network system is released by using embedded processors, it's lacking of performance in terms of multimedia processing and feature of video telephony through which video and voice are exchanged simultaneously. The main reason could be that embedded processors currently being used do not provide enough performance to support both MoIP call features and various home network features simultaneously. In order to solve these problems, Dual processor could be used, but in the other hands it brings another disadvantage of high cost. Therefore, this study is to solve the home automation features and video telephony features by using Dual Core Processor based on ARM 11 Processor and implement the MoIP Wall-Pad which can reduce the board design costs and component costs, and improve performance. The platform designed and implemented in this paper verified performance of MoIP to exchange the video and voice at the same time under the situation of Ethernet network.

DSP를 이용한 변류기 보상 알고리즘 (CT compensating algorithm Based on a Digital Signal Processor)

  • 강용철;이병은;소순홍;황태근;이지훈;차선희;김연희;장성일
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 추계학술대회 논문집 전력기술부문
    • /
    • pp.255-257
    • /
    • 2005
  • This paper proposes a compensating algorithm of a measurement torrent transformer (CT) using DSP. The core flux is calculated and then magnetizing current is estimated in accordance with the flux-magnetizing current curve. The core loss current is obtained with the core loss resistance and the secondary voltage. The correct secondary current is estimated by adding the exciting current to the measured secondary current. The performance of the proposed algorithm was tested using EMTP generated data. The experiment on the real CT was conducted using the prototype compensated system based on a digital signal processor. The results indicate that the algorithm can increase the accuracy of the measurement CT significantly.

  • PDF

Core-A 프로세서 기반의 멀티미디어 SoC 플랫폼 설계 (The Design of Multi-media SoC Platform Based on Core-A Processor)

  • 서학용;허경철;정승표;박주성
    • 전자공학회논문지
    • /
    • 제50권6호
    • /
    • pp.99-104
    • /
    • 2013
  • 최근 주목받는 스마트 폰, 스마트 TV 등 스마트 전자기기들은 전통기기의 기능과 컴퓨터를 결합하는 공통점을 갖고 있다. 단순히 프로세서가 내장되어 연산만 수행하는 것이 아니라 OS(Operating System)가 포함되고 사용자가 개인 용도에 따라 새로운 기능을 추가할 수 있고 유무선 통신으로 인터넷 또는 PC와 연결하여 통신할 수 있는 개장된 멀티미디어 SoC 플랫폼이 필요하다. 본 논문에서는 Core-A 프로세서와 AMBA 버스 기반으로 영상, 음성 또는 각종 통신 형태를 지원하는 다기능 SoC 플랫폼을 설계하여 FPGA로 구현과 검증을 하였다. SoC 플랫폼의 전체 성능을 검증하기 위해 JPEG 디코딩 알고리즘과 ADPCM 인코딩 디코딩 알고리즘을 실행하고 실행 결과를 모니터 또는 스피커로 출력하여 검증했다.

멀티프로세서 윈도우즈 상에서 실시간성 지원 (Real-Time Support on Multi-Processor for Windows)

  • 송창인;이승훈;주민규;이철훈
    • 한국콘텐츠학회논문지
    • /
    • 제12권6호
    • /
    • pp.68-77
    • /
    • 2012
  • 최근 시스템 개발 환경이 싱글프로세서 기반의 환경에서 멀티프로세서 기반의 환경으로 변화됨에 따라 개발된 시스템 프로그램들이 멀티프로세서 기반과 싱글프로세서 기반에서 호환이 가능하도록 설계 및 구현의 중요성이 부각되고 있다. 특히, 실시간성이 중요시 되는 내장형 소프트웨어 분야 및 측정 장비와 같이 정밀성을 요구하는 분야의 경우 멀티프로세서 기반의 실시간성을 제공하기 위한 연구가 필요하다. 운영체제에 종속적인 실시간성은 운영체제에 따라 지원여부를 결정하는데, 범용 운영체제인 윈도우즈의 경우 실시간성을 지원하기 위해 RTX나 INtime과 같은 고가의 서드파티를 사용해야 한다. 그러나 서드파티를 사용함으로써 제품 개발 시 고가의 구입비용 및 유지보수 비용으로 인한 개발 비용의 증가를 초래하는 문제점이 발생한다. 이러한 문제점을 해결하기 위해서, 본 논문에서는 멀티프로세서 기반의 윈도우즈에 실시간성을 제공하기 위해 x86 아키텍처의 Local APIC를 이용하여 윈도우즈에 실시간성을 제공하는 RTiK-MP(Real-Time implant Kernel-Multi Processor)를 설계 및 구현하였고, RTiK-MP의 성능 검증 및 평가를 위하여 휴대용 점검장비를 이용한 성능 측정 결과를 분석한다.

임베디드 시스템에서의 공유 메모리 컨트롤러 디바이스 드라이버 설계 (Design of Shared Memory Controller Device Driver in Embedded System)

  • 문지훈;오재철
    • 한국전자통신학회논문지
    • /
    • 제9권6호
    • /
    • pp.703-709
    • /
    • 2014
  • 단일 시스템에 코어별 운영체제를 사용하는 AMP(Asymmetric Multiprocessing) 기반 듀얼 코어에서 프로세서간 데이터를 전달하기 위해서 공유 메모리 기법을 사용한다. 서로 다른 운영체제에서 공유 메모리를 사용하기 위해서는 두 운영체제 사이의 메시지 통신 및 동기화 문제를 해결해 주어야 하는 문제점이 발생한다. 본 논문에서는 듀얼 코어 환경에서 서로 다른 프로세서 코어 사이에서 데이터 공유를 위해서 별도의 메모리 컨트롤러를 이용하였다. 이 컨트롤러는 두 프로세서에서 동시에 접근이 가능 하도록 두 개의 슬레이브 포트를 지정할 수 있으며, 두 프로세서에 의해서 동시에 데이터 처리를 수행할 경우 메모리 중재자에 의해서 슬레이브 포트의 우선 순위를 결정하게 된다. A에서 B 프로세서로 데이터를 전달 시, SRAM 영역을 논리적으로 8개의 페이지로 분리하였다. 여러 프로세스에서 메모리 영역을 사용 하도록 하였으며 페이지당 4KByte의 크기를 갖도록 하였으며, 현재 페이지가 사용 가능한지 아닌지를 판별하기 위해서 4바이트 크기의 컨트롤 레지스터를 이용하였다.