• 제목/요약/키워드: bottlenecks

검색결과 203건 처리시간 0.023초

인텔 차세대 매니코어 프로세서에서의 다중 병렬 프로그램 성능 향상기법 연구 (Enhancing the Performance of Multiple Parallel Applications using Heterogeneous Memory on the Intel's Next-Generation Many-core Processor)

  • 노승우;김서영;남덕윤;박근철;김직수
    • 정보과학회 논문지
    • /
    • 제44권9호
    • /
    • pp.878-886
    • /
    • 2017
  • 본 논문에서는 고성능컴퓨팅 분야에서 주로 활용되는 MPI 응용들을 인텔의 차세대 매니코어 프로세서인 Knights Landing(KNL)에서 실행할 때 발생할 수 있는 성능 병목 현상 및 이를 해결하기 위한 효율적인 자원 할당 방법에 대해서 논의하고자 한다. KNL은 기존의 가속기 형태의 매니코어 프로세서 형태뿐만 아니라 자체적으로 부팅이 가능한 형태의 호스트 프로세서로 구성되어 있으며, 기존의 DDR4 기반의 메모리와 함께 향상된 대역폭을 가진 새로운 형태의 온-패키지 메모리를 장착해서 출시되었다. 이러한 새로운 매니코어 프로세서 아키텍처에 최적화된 자원 할당 방법을 연구함으로써 다중 MPI 응용 실행 성능의 향상과 전체적인 시스템 활용률을 높일 수 있음을 실험적으로 검증하였다.

Development of web-based collaborative framework for the simulation of embedded systems

  • Yang, Woong;Lee, Soo-Hong;Jin, Yong Zhu;Hwang, Hyun-Tae
    • Journal of Computational Design and Engineering
    • /
    • 제3권4호
    • /
    • pp.363-369
    • /
    • 2016
  • Cyber Physical System (CPS) and Internet of Things (IoT) are hot objects of interest as an extension of the embedded system. These interactive products and systems contain Mobile Devices which are most popular and used most frequently. Also these have been widely used from the control of the Nuclear Power Control System (NPCS) to IoT Home Service. Information & Communication Technology (ICT) topics of trend fused-complex current Information Technology (IT) and Communication Technology (CT) are closely linked to real space and virtual space. This immediately means the arrival of the ultra-connected society. It refers to a society in which various objects surrounding the human innovation and change in the social sector are expected through the connection between the data which are to be generated. In addition, studies of Tool-kit for the design of such systems are also actively pursued. However, only increased cooperation and information sharing between the physical object consists of a variety of machinery and equipment. We have taken into consideration a number of design variables of the high barriers to entry about the product. In this study, It has been developed a Web-based collaboration framework which can be a flexible connection between macroscopically virtual environment and the physical environment. This framework is able to verifiy and manage physical environments. Also it can resolve the bottlenecks encountered during the base expansion and development process of IoT (Internet of Things) environment.

접합 공정 조건이 Al-Al 접합의 계면접착에너지에 미치는 영향 (Effect of Bonding Process Conditions on the Interfacial Adhesion Energy of Al-Al Direct Bonds)

  • 김재원;정명혁;장은정;박성철;;;;김성동;박영배
    • 한국재료학회지
    • /
    • 제20권6호
    • /
    • pp.319-325
    • /
    • 2010
  • 3-D IC integration enables the smallest form factor and highest performance due to the shortest and most plentiful interconnects between chips. Direct metal bonding has several advantages over the solder-based bonding, including lower electrical resistivity, better electromigration resistance and more reduced interconnect RC delay, while high process temperature is one of the major bottlenecks of metal direct bonding because it can negatively influence device reliability and manufacturing yield. We performed quantitative analyses of the interfacial properties of Al-Al bonds with varying process parameters, bonding temperature, bonding time, and bonding environment. A 4-point bending method was used to measure the interfacial adhesion energy. The quantitative interfacial adhesion energy measured by a 4-point bending test shows 1.33, 2.25, and $6.44\;J/m^2$ for 400, 450, and $500^{\circ}C$, respectively, in a $N_2$ atmosphere. Increasing the bonding time from 1 to 4 hrs enhanced the interfacial fracture toughness while the effects of forming gas were negligible, which were correlated to the bonding interface analysis results. XPS depth analysis results on the delaminated interfaces showed that the relative area fraction of aluminum oxide to the pure aluminum phase near the bonding surfaces match well the variations of interfacial adhesion energies with bonding process conditions.

인터넷 구조 기반의 동적 데이터 그리드 복제 정책 (A Dynamic Data Grid Replication Strategy Based on Internet Architecture)

  • 김준상;이원주;전창호
    • 전자공학회논문지CI
    • /
    • 제45권3호
    • /
    • pp.1-6
    • /
    • 2008
  • 데이터 그리드는 지리적으로 분산된 대용량의 데이터 자원을 광대역 통신망을 통해 공유한다. 이러한 그리드 환경은 물리적 네트워크인 인터넷 상에서 구현되기 때문에 대용량의 데이터를 전송하는데 많은 시간이 소요된다. 이러한 문제를 극복하기 위해서 여러 가지 복제 정책들이 제안되었는데, 기존의 데이터 그리드 복제 정책은 실제 인터넷의 구조를 고려하지 않고 논리적인 토폴로지를 바탕으로 제안되었기 때문에 실제 구축된 데이터 그리드에서 최적의 성능을 기대할 수 없다. 그리드에서 데이터 접근시간은 물리적 네트워크인 인터넷의 구조에 의해 가장 큰 영향을 받기 때문이다. 본 논문에서는 인터넷 구조 기반의 새로운 데이터 그리드 복제 정책으로 RSIA(Replication Strategy based on Internet Architecture) 복제 정책을 제안한다. 이 정책은 인터넷의 각 요소들 사이에 존재하는 구조적인 계층성을 고려하여 데이터 복사본을 배치하고, 데이터 전송 시 대역폭의 병목 구간을 피함으로써 시스템의 성능 저하를 줄인다. 본 논문에서는 시뮬레이션을 통하여 제안하는 RSIA가 기존의 복제 정책에 비해 데이터 그리드의 성능 향상 면에서 우수함을 보인다.

고층의 주상복합건축물 계단폭과 수용인원 산정기준에 따른 피난효율의 비교 (Comparison of Evacuation Efficiency for Stair Width and Code for Occupant Load Calculation in High-rise Buildings)

  • 이양주;고경찬;박외철
    • 한국화재소방학회논문지
    • /
    • 제25권1호
    • /
    • pp.1-6
    • /
    • 2011
  • 고층건축물에서의 피난효율과 수용인원 산정기준의 문제점을 확인하기 위하여 피난 시뮬레이션을 수행하였다. 지상 39층 주상복합 건축물의 계단폭이 각각 1.2m, 1.5m, 1.8m일 때, 피난시간과 피난자수를 Simulex로 계산하였다. 소방법 기준으로 산정한 총수용인원은 실거주자의 2.3배, NFPA 101 인명구조코드 기준의 2.6배였다. 소방법 기준의 경우, 계단폭이 작을수록 증간층에서의 병목현상으로 인해 피난효율이 낮았지만, 실거주나 NFPA 기준에서는 피난효율이 높고 계단폭이 피난효율에 미치는 영향이 미미함을 확인하였다. 소방법 기준을 적용할 때 계단폭이 1.8m에서도 병목현상이 일어나지만, 실거주 또는 NFPA 기준을 적용할 때는 계단폭 1.2m에서도 안전한 것으로 나타 남에 따라 수용인원 산정관련 소방법 기준의 완화가능성에 대한 추가연구가 필요하다.

TCP/IP 기반 보안통제 RFID 멀티리더 시스템 개발 (An RFID Multi-Reader System Development for TCP/IP Based Security Control)

  • 조성목
    • 한국정보통신학회논문지
    • /
    • 제13권8호
    • /
    • pp.1587-1592
    • /
    • 2009
  • Ubiquitous 시대의 도래와 함께 RFID는 Ubiquitous 기술의 핵심적인 역할을 담당하고 있으며, RFID를 읽고 판독하는 단말기의 개발 역시 매우 중요한 기술개발 분야로 대두되고 있다. 본 논문에서는 RFID중 현재 교통카드, 신용카드 등에서 많이 사용되고 있는 13.56Mhz RFID와 보안회사에서 사용하고 있는 125Khz의 인프라를 그대로 사용할 수 있고, TCP/IP 통신을 통해 위치파악, 출입통제, 보안통제 등의 응용이 가능한 하드웨어 시스템을 개발하였다. 기존의 로컬 RFID 방식은 기업체 내에 별도의 서버를 두어 운영하기 때문에 관리문제, 기술문제 등의 애로사항이 빈번하게 발생하는 문제점이 있다. 따라서 본 논문에서는 이러한 문제점을 해소할 수 있도록 TCP/IP로 중앙관리 서버에 연결되는 RFID multi reader를 개발하여 보안통제가 가능하도록 하였고, RFID 인프라의 설치, 이전 및 관리 등이 용이하도록 하였다.

멀티-코어 서버의 성능 분석 및 특성화 (Performance Analysis and Characterization of Multi-Core Servers)

  • 이명호;강준석
    • 정보처리학회논문지A
    • /
    • 제15A권5호
    • /
    • pp.259-268
    • /
    • 2008
  • 멀티-코어 프로세서는 최근 마이크로프로세서 시장의 주류 제품으로 자리 잡았다. 이러한 멀티-코어 프로세서를 기반으로 하는 서버들은 고성능 컴퓨팅 분야와 상용 응용 프로그램 분야에서 그 사용 범위를 넓혀가고 있다. 멀티-코어 프로세서는 높아진 병렬성으로 인하여 응용 프로그램의 성능도 한 단계 더 높여줄 것으로 기대된다. 하지만, 칩 내부의 여러 코어들이 공유 자원들을 사용하면서 발생하는 경쟁과 충돌이 성능에 병목으로 작용하기도 한다. 그러므로 멀티-코어 서버 상에서 높은 성능과 확장성을 얻기 위해서는 공유 자원의 사용을 최적화 하는 것이 필수적이다. 본 논문에서는 코어들 간의 공유 자원 사용에서 발생하는 긍정적/부정적인 효과들이 실제 응용 프로그램의 성능에 어떻게 반영되는지 실험을 통하여 분석해 본다. 또한 이러한 분석을 통하여 멀티-코어 서버의 성능을 특성화한다.

네트워크 상황 정보를 이용한 다중 인터페이스 단말의 배터리 수명 연장 기법 (Battery life time extension method in the multi-interfaced terminal by using the network state information)

  • 이재균;윤동근;김용운;최성곤
    • 중소기업융합학회논문지
    • /
    • 제2권1호
    • /
    • pp.19-24
    • /
    • 2012
  • 본 논문에서는 네트워크 상황 정보를 이용한 다중 인터페이스 단말의 배터리 수명 연장 방법을 제안한다. 단말은 현재 접속 네트워크에 병목현상이 발생하는 경우, 다중 인터페이스를 이용하여 다중 경로로 데이터를 수신한다. 하지만 다중 인터페이스를 이용하는 경우 단말의 배터리 소모가 많아 단말의 배터리 수명이 짧아진다. 이러한 배터리 소모를 줄이기 위해 OLT를 통해 네트워크의 병목현상 유무를 판단하고 단말에게 네트워크 상황 정보를 전송한다. 단말은 네트워크 상황 정보를 통해 하나의 인터페이스를 비활성화 시켜 에너지 소비를 절감시킨다. 단일 인터페이스와 다중 인터페이스를 사용함에 따른 배터리 소비량을 계산하여 제안 방안의 효과를 확인하였다.

  • PDF

유전 알고리즘을 이용한 Work-In-Process 수준 최적화 (Optimizing Work-In-Process Parameter using Genetic Algorithm)

  • 김정섭;정지용;이종환
    • 산업경영시스템학회지
    • /
    • 제40권1호
    • /
    • pp.79-86
    • /
    • 2017
  • This research focused on deciding optimal manufacturing WIP (Work-In-Process) limit for a small production system. Reducing WIP leads to stable capacity, better manufacturing flow and decrease inventory. WIP is the one of the important issue, since it can affect manufacturing area, like productivity and line efficiency and bottlenecks in manufacturing process. Several approaches implemented in this research. First, two strategies applied to decide WIP limit. One is roulette wheel selection and the other one is elite strategy. Second, for each strategy, JIT (Just In Time), CONWIP (Constant WIP), Gated Max WIP System and CWIPL (Critical WIP Loops) system applied to find a best material flow mechanism. Therefore, pull control system is preferred to control production line efficiently. In the production line, the WIP limit has been decided based on mathematical models or expert's decision. However, due to the complexity of the process or increase of the variables, it is difficult to obtain optimal WIP limit. To obtain an optimal WIP limit, GA applied in each material control system. When evaluating the performance of the result, fitness function is used by reflecting WIP parameter. Elite strategy showed better performance than roulette wheel selection when evaluating fitness value. Elite strategy reach to the optimal WIP limit faster than roulette wheel selection and generation time is short. For this reason, this study proposes a fast and reliable method for determining the WIP level by applying genetic algorithm to pull system based production process. This research showed that this method could be applied to a more complex production system.

H.264/AVC Baseline Profile Decoder의 성능 예측 모델의 구현과 분석 (Implementation and Analysis of Performance Estimation Model of H.264/AVC Baseline Profile Decoder)

  • 문경환;송용호
    • 전자공학회논문지CI
    • /
    • 제44권3호
    • /
    • pp.108-123
    • /
    • 2007
  • H.264/AVC 표준이 멀티미디어 어플리케이션 분야를 대표하는 기술로서 인정받게 되면서 H.264/AVC 표준의 성능 향상을 위한 연구가 활발하게 진행되고 있다. H.264/AVC 표준에 대한 연구는 알고리즘의 분석과 개선 또는 성능 제한을 일으키는 구조적 문제에 대한 개선 등 여러 가지 방향으로 이루어지고 있는데, 연구의 대상과 방향이 동일하지 않아도 초기 단계에서는 공통적으로 H.264/AVC 표준의 성능에 대한 분석이 이루어지게 된다. 분석 단계는 H.264/AVC 표준이 가지고 있는 문제점을 파악하고, 파악된 문제점에 어떠한 요소가 가장 큰 영향을 미치는지를 결정하는 과정으로서 연구의 전체 방향과 대상을 결정짓는 중요한 단계이다. 본 연구는 H.264/AVC Baseline Profile 디코더의 성능 향상을 위한 연구 진행 시 초기의 성능 분석 단계에서 활용이 가능한 성능 예측 모델을 제안한다. 제안된 모델은 H.264/AVC 디코더의 동작 중 나타나는 다양한 가변 요소들을 반영하여 설계되었으며 각 요소의 변화에 따라 성능이 어떻게 예측되는지를 쉽게 알 수 있도록 고안되었다.