• 제목/요약/키워드: Many-core architecture

검색결과 136건 처리시간 0.023초

SMT 프로세서에 최적화된 명령어 페치 전략에 관한 연구 (An Optimal Instruction Fetch Strategy for SMT Processors)

  • 홍인표;문병인;김문경;이용석
    • 한국통신학회논문지
    • /
    • 제27권5C호
    • /
    • pp.512-521
    • /
    • 2002
  • 최근에 성능의 한계를 드러내고 있는 수퍼스칼라 RISC를 대체할 새로운 프로세서 구조로서 SMT(Simultaneous Multi-Threading)이 활발히 연구되고 있다. SMT는 하나의 프로세서에 여러 개의 스레드가 하드웨어 자원을 동적으로 공유하며 동시에 수행되는 구조이다. 이러한 환경에서는 프로세서 안에 존재하는 여러 스레드로부터 명령어를 원활하게 공급하여 주는 것이 중요하다. SMT 프로세서는 기존의 프로세서에 비하여 사이클 당 실제 처리되는 명령어 수가 월등히 많기 때문에, 사이클 당 명령어 페치량과 페치된 명령어를 임시 저장하는 페치 큐의 엔트리수가 신중하게 결정되어야 한다. 또한 사이클마다 페치할 스레드와 각 스레드의 페치량을 결정하는 것이 성능에 큰 영향을 미친다. 따라서 본 논문에서는 이러한 요소들이 프로세서 전체의 성능에 미치는 영향을 분석하고 그 결과를 바탕으로 SMT 프로세서에 최적화된 명령어 페치 전략에 대하여 논한다.

H.264 율제어 알고리듬의 하드웨어 설계 (A hardware design of Rate control algorithm for H.264)

  • 서기범
    • 한국산학기술학회논문지
    • /
    • 제11권1호
    • /
    • pp.175-181
    • /
    • 2010
  • 본 논문에서는 H.264 방식의 full HD실시간영상압축을 위한 율제어 모듈의 새로운 구조를 제안한다. 제안된 구조에서는 각 매크로블록 라인(full HD의 경우 120 매크로 블록, CIF 의 경우 22 매크로 블록)을 따라 율제어 알고리즘을 사용함으로서 QP 가 변경된다. JM의 H.264 율제어 알고리듬에는 복잡한 산술연산과 부동 소숫점 연산을 가지고 있기 때문에, 정수형 산술 CPU 를 통한 율제어 알고리듬의 구현은 불가능하다. 따라서 우리는 부동 소숫점 연산 유닛을 채용하고, 이 부동소숫점 연산 유닛을 이용하여, 율제어 알고리듬을 구현하였으며, 이 하드웨어를 통하여 실시간에 동작할 수 있음을 확인하였다.

뉴로모픽 아키텍처 기반 자율형 IoT 응용 통합개발환경 응용 시나리오 (Application Scenario of Integrated Development Environment for Autonomous IoT Applications based on Neuromorphic Architecture)

  • 박지수;김서연;김회남;정재혁;김경수;정진만;윤영선
    • 스마트미디어저널
    • /
    • 제11권2호
    • /
    • pp.63-69
    • /
    • 2022
  • 다양한 IoT 디바이스 사용이 증가함에 따라 IoT 플랫폼의 중요성 또한 대두되고 있다. 최근에는 IoT 디바이스에 인공지능 기술이 결합되는 추세이며, 저전력으로 많은 연산 처리가 가능한 뉴로모픽 아키텍처를 적용하는 연구도 증가하고 있다. 본 논문에서는 GUI 형식의 뉴로모픽 아키텍처 기반 자율형 IoT 응용 통합개발환경(NA-IDE:Integrated Development Environment for Autonomic IoT Applications based on Neuromorphic Architecture)에서 IoT 디바이스와 뉴로모픽 아키텍처 FPGA 디바이스를 사용하여 NA-IDE의 가능성 및 유효성을 확인하기 위한 IoT 응용 시나리오를 제안한다. 제안된 시나리오는 IoT 디바이스에 카메라 모듈을 연결하여 실시간으로 MNIST 데이터셋 이미지를 수집하여 뉴로모픽 보드를 통해 수집된 이미지를 인식하고 다른 IoT 디바이스에 연결된 센서 모듈을 통해 인식 결과를 표시한다. 이와 같이 이기종 IoT 디바이스에 뉴로모픽 아키텍처를 적용하여 다양한 응용 서비스에 활용한다면 뉴로모픽 아키텍처 기반 자율형 IoT 응용 통합개발환경은 4차 산업혁명을 주도하는 핵심 기술로 부상할 것으로 전망한다.

캐쉬 구성에 따른 3차원 쿼드코어 프로세서의 성능 및 온도 분석 (Analysis on the Performance and Temperature of the 3D Quad-core Processor according to Cache Organization)

  • 손동오;안진우;최홍준;김종면;김철홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권6호
    • /
    • pp.1-11
    • /
    • 2012
  • 공정기술이 지속적으로 발달함에 따라 멀티코어 프로세서는 성능 향상이라는 장점과 함께 내부 연결망의 긴 지연 시간, 높은 전력 소모, 그리고 발열 현상 등의 문제점들을 내포하고 있다. 이와 같은 2차원 멀티코어 프로세서의 문제점들을 해결하기 위한 방안 중 하나로 3차원 멀티코어 프로세서 구조가 주목을 받고 있다. 3차원 멀티코어 프로세서는 TSV를 이용하여 수직으로 쌓은 여러 개의 레이어들을 연결함으로써 2차원 멀티코어 프로세서와 비교하여 배선 길이를 크게 줄일 수 있다. 하지만, 3차원 멀티코어 프로세서에서는 여러 개의 코어들이 수직으로 적층되므로 전력밀도가 증가하고, 이로 인해 발열문제가 발생하여 높은 냉각 비용과 함께 신뢰성에 부정적인 영향을 유발한다. 따라서 3차원 멀티코어 프로세서를 설계할 때에는 성능과 함께 온도를 반드시 고려하여야 한다. 본 논문에서는 캐쉬 구성에 따른 3차원 쿼드코어 프로세서의 온도를 상세히 분석하고, 이를 기반으로 발열문제를 해결하기 위해저온도 캐쉬 구성 방식을 제안하고자 한다. 실험결과, 명령어 캐쉬는 최고온도가 임계값보다 낮고 데이터 캐쉬는 많은 웨이를 가지는 구성을 적용할 때 최고온도가 임계값보다 높아짐을 알 수 있다. 또한, 본 논문에서 제안하는 캐쉬구성은 쿼드코어 프로세서를 사용하는 3차원 구조에서 캐쉬의 온도 감소에 효과적일 뿐만 아니라 성능 저하 또한 거의 없음을 알 수 있다.

Service adaptive Network Architecture(SaNA)을 활용한 콘텐츠 전송 시스템 (Effective Contents Delivery System Using Service Adaptive Network Architecture(SaNA))

  • 공석환;이재용
    • 한국통신학회논문지
    • /
    • 제39B권6호
    • /
    • pp.406-413
    • /
    • 2014
  • 최근 몇 년 사이 인터넷을 통해 접속 가능한 디바이스가 다양해지는 한편 디바이스가 콘텐츠의 사용자가 아닌 제공자가 되면서 콘텐츠 트래픽이 급속하게 증가하고 있다. 이와 같은 콘텐츠 트래픽이 기존과는 다른 패턴을 갖기 때문에, 효율적인 콘텐츠 전송 서비스를 위한 다양한 연구가 진행 중이다. 대표적 콘텐츠 전송 서비스 기술인 CCN(Contents Centric Network)은 기존의 기술 구조와 상이한 혁신적인 구조를 갖고 있기 때문에 기존의 네트워크와의 호환 문제가 발생한다. 이와 같은 문제를 해결하기 위해 본 논문에서는 CCN과 기존 망과의 연동 시 효율적 콘텐츠 전송을 위한 SaNA(Software adaptive Network Architecture) 구조를 제안한다. 이는 미래 인터넷의 핵심 기술 분야인 CCN 과 소프트웨어 정의 네트워킹 기술(Software Defined Networking : SDN) 을 활용하여 기존 망에 점진적으로 적용해 나가기 위한 융합 시스템이다. SaNA를 통해 콘텐츠를 서비스하는 경우, 기존 네트워크 대비 네트워크 대역폭 효율성을 두 배로 높일 수 있고, 콘텐츠 전송 시간도 약 1.7 배 단축시킬 수 있다.

An active learning method with difficulty learning mechanism for crack detection

  • Shu, Jiangpeng;Li, Jun;Zhang, Jiawei;Zhao, Weijian;Duan, Yuanfeng;Zhang, Zhicheng
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.195-206
    • /
    • 2022
  • Crack detection is essential for inspection of existing structures and crack segmentation based on deep learning is a significant solution. However, datasets are usually one of the key issues. When building a new dataset for deep learning, laborious and time-consuming annotation of a large number of crack images is an obstacle. The aim of this study is to develop an approach that can automatically select a small portion of the most informative crack images from a large pool in order to annotate them, not to label all crack images. An active learning method with difficulty learning mechanism for crack segmentation tasks is proposed. Experiments are carried out on a crack image dataset of a steel box girder, which contains 500 images of 320×320 size for training, 100 for validation, and 190 for testing. In active learning experiments, the 500 images for training are acted as unlabeled image. The acquisition function in our method is compared with traditional acquisition functions, i.e., Query-By-Committee (QBC), Entropy, and Core-set. Further, comparisons are made on four common segmentation networks: U-Net, DeepLabV3, Feature Pyramid Network (FPN), and PSPNet. The results show that when training occurs with 200 (40%) of the most informative crack images that are selected by our method, the four segmentation networks can achieve 92%-95% of the obtained performance when training takes place with 500 (100%) crack images. The acquisition function in our method shows more accurate measurements of informativeness for unlabeled crack images compared to the four traditional acquisition functions at most active learning stages. Our method can select the most informative images for annotation from many unlabeled crack images automatically and accurately. Additionally, the dataset built after selecting 40% of all crack images can support crack segmentation networks that perform more than 92% when all the images are used.

미국방성의 전력개발 프로세스를 활용한 스마트 시티 개념설계 방안 (Concept Design Method of Smart City using Defense System Development Process of DoD)

  • 이중윤
    • 시스템엔지니어링학술지
    • /
    • 제15권2호
    • /
    • pp.98-107
    • /
    • 2019
  • The defense system development process is a process of developing various systems that perform functions in various functional areas such as battlefield awareness, command control, force application, and logistical support. In other words, the defense system development process is a process of developing many systems simultaneously in various functional areas. Various systems developed through this process should be interoperable so that they can be integrated and operated in a joint warfighting environment. To successfully implement this, the US Department of Defense uses the Joint Capability Integrated Development System(JCIDS) for the defense system development, and within this JCIDS processes the Capability Based Assessment(CBA) methodology as its core technology. This CBA methodology transforms the mission activity requirements to functional capability requirements logically and transforms the functional capability requirements to system requirements logically also. Smart City is a city that improves the convenience and quality of life of the citizen by integrates various systems that perform various functions of the city and smarties various functional systems with smart services by using IT technology. In other words, defense system development and smart city development have a common feature of the process of developing many systems simultaneously in various functional areas. In order to address the problem of having to develop many systems simultaneously in each functional area, it is important to logically transform the various mission scenarios into functions and logically transform the functions into systems. Therefore, a joint capability integrated development system and its core methodology, Capability Based Assessment(CBA), can be applied to smart city development. This paper proposes a method for performing a smart city concept design method using the capability based evaluation (CBA) method.

프로덕트 라인 기반의 모바일 소프트웨어 개발 프로세스 (Product Line Development Process for Mobile Software based on Product Line)

  • 김행곤;손이경
    • 정보처리학회논문지D
    • /
    • 제12D권3호
    • /
    • pp.395-408
    • /
    • 2005
  • 유비쿼터스 컴퓨팅은 매우 광범위한 기술 분야에 적용될 수 있고 완벽한 사용자 요구를 필요로 하며, 많은 시나리오와 기술들을 포함하고 있으므로 이러한 요구를 충족시켜주는 새로운 소프트웨어 개발 툴과 방법론이 필수적이다. 이를 위한 새로운 기술로써 소프트웨어 프로덕트 라인은 공통의 유사한 기능을 가지고 있는 소프트웨어 제품 혹은 소프트웨어 시스템 집합으로 특정 영역의 시장과 용도의 요구사항에 따라 재사용 가능한 아키텍처 및 컴포넌트를 구성함으로써 생산성과 품질을 향상시킬 수 있다. 특히, 시스템을 분할하고 구조화하여 시스템의 성능과 효율성을 향상시킬 수 있는 소프트웨어 아키텍처 개념이 중요시되면서 아키텍처의 개발과 평가에 대한 체계적인 연구가 필요하다. 본 논문에서는 CBD(Component Based Development)를 기반한 소프트웨어 프로덕트 라인(PLD : Product Line based Development)을 도입하여 모바일 비즈니스 도메인에 적합한 모바일 응용 시스템 아키텍처(MASA. Mobile Application System Architecture)를 제시한다.

멀티 코어 시스템에서 통신 프로세스의 동적 스케줄링 (Dynamic Scheduling of Network Processes for Multi-Core Systems)

  • 장혜천;진현욱;김학영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.968-972
    • /
    • 2009
  • 멀티 코어 프로세서는 현재 많은 고성능 서버에 적용되어 사용되고 있다. 최근 이들 서버는 점차 높은 네트워크 대역폭 활용을 요구하고 있다. 이러한 요구를 만족시키기 위해서는 멀티 코어를 효율적으로 활용하여 네트워크 처리율을 향상시키는 방안이 필요하다. 그러나 현재 운영체제들은 멀티 코어 시스템을 멀티 프로세서 환경과 거의 동일하게 다루고 있으며 아직 멀티 코어의 고유 특성을 고려한 성능 최적화 시도는 미흡한 상태이다. 이러한 문제를 해결하기 위해서 본 논문에서는 멀티 코어의 특성을 최대한으로 고려하여 프로세스 스케줄링을 결정함으로써 통신 성능을 향상시키는 방안에 대해서 연구한다. 제안되는 프로세스 스케줄링은 멀티 코어 프로세서의 캐쉬 구조, 프로세스의 통신 집중도, 그리고 각 코어의 부하를 기반으로 해당 프로세스에게 최적의 코어를 결정하고 스케줄링한다. 제안된 기법은 리눅스 커널에 구현되었으며 측정 결과는 최신 리눅스 커널의 네트워크 처리율을 20%까지 향상시켰으며 프로세서 자원은 55% 더 절약할 수 있음을 보인다.

실리카테인: 생규화 및 응용 (Silicatein: Biosilicification and Its Applications)

  • 양병선;윤진영;차형준
    • 한국해양바이오학회지
    • /
    • 제10권2호
    • /
    • pp.34-43
    • /
    • 2018
  • Silicon has become of increasing importance as the basic element of many high-technology products. Its synthesis is very difficult requiring high temperature solid-state reactions (> $1000^{\circ}C$) or lower temperature methods ($100-200^{\circ}C$) involving hydrothermal and solvothermal reactions under extreme pH conditions. In nature, on the other hand, a wide range of living organisms have collectively evolved the means of biosilicification at the astounding rate of gigatons/year. This is impressive because biosilicification in these organisms occurs under mild physiological conditions. Marine sponges possess the ability to sequester soluble silicon sources from their environments and assemble them into intricate 3D architecture. The advent of molecular biology has recently made it possible to glean molecular information about biosilicification from these systems and it turned out that enzyme silicatein is the core of biosilicification. In this review, biosilicification regulated by silicatein and its mechanism are described. Also, production of silicatein through recombinant technology and several applications of recombinant silicatein are described including immobilization of silicatein, formation of Au or Ag nanoparticles on nanowires, nanolithography approaches, core-shell materials, encapsulation, bone replacement materials, and microstructured optical fibers.