• Title/Summary/Keyword: 연산 효율

Search Result 2,610, Processing Time 0.031 seconds

Analysis on the Temperature and Power Efficiency of Graphic Processors according to Cooling Effects (냉각에 따른 그래픽 프로세서의 온도 및 소비 전력 분석)

  • Son, DongOh;Joo, SeYoon;Jeon, HyungGue;Kim, CheolHong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.07a
    • /
    • pp.9-11
    • /
    • 2012
  • 프로세서 설계 기술의 발달로 인해 그래픽 프로세서 또한 기술적으로 크게 발전하였다. 그래픽 프로세서는 단순한 그래픽 표현장치에서 대용량의 데이터를 병렬로 처리하는 고성능 장치로 변화하고 있다. 뿐만 아니라 그래픽 프로세서는 대용량의 데이터처리가 가능한 병렬 프로세서로 특화되어 있기 때문에 이를 활용하여 CPU의 작업을 보조하며 빠른 연산 수행을 가능하게 한다. 이로 인해, 최신의 고성능 시스템 설계에서 그래픽 프로세서는 매우 중요한 역할을 한다. 그래픽 프로세서를 활용하는 고성능의 시스템을 설계하기 위해서는 발열과 소비 전력을 고려해야 한다. 본 논문에서는 그래픽 프로세서의 온도를 제어하는 냉각팬의 세기를 조절하여 그에 따른 온도와 소비 전력을 분석한다. 실험 결과 냉각팬 세기가 낮은 경우 그래픽 프로세서의 온도는 $100^{\circ}C$까지 급격히 상승한다. 냉각팬 세기가 높은 경우 그래픽 프로세서의 온도는 천천히 증가하여 일정 온도에 수렴함을 알 수 있다. 또한, 그래픽 프로세서의 소비 전력은 작업량을 할당하지 않았을 때보다 최대작업량을 할당하였을 때 냉각팬 세기에 따른 소비전력 차이가 큼을 알 수 있다.

  • PDF

An efficient parallel solution algorithm on the linear second-order partial differential equations with large sparse matrix being based on the block cyclic reduction technique (Block Cyclic Reduction 기법에 의한 대형 Sparse Matrix 선형 2계편미분방정식의 효율적인 병렬 해 알고리즘)

  • 이병홍;김정선
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.15 no.7
    • /
    • pp.553-564
    • /
    • 1990
  • The co-efficient matrix of linear second-order partial differential equations in the general form is partitioned with (n-1)x(n-1) submartices and is transformed into the block tridiagonal system. Then the cyclic odd-even reduction technique is applied to this system with the large-grain data granularity and the block cyclic reduction algorithm to solve unknown vectors of this system is created. But this block cyclic reduction technique is not suitable for the parallel processing system because of its parallelism chanigng at every computing stages. So a new algorithm for solving linear second-order partical differential equations is presentes by the block cyclic reduction technique which is modified in order to keep its parallelism constant, and to reduce gteatly its execution time. Both of these algoriths are compared and studied.

  • PDF

Design of DSP Instructions and their Hardware Architecture for Reed-Solomon Codecs (Reed-Solomon 부호화/복호화를 위한 DSP 명령어 및 하드웨어 설계)

  • 이재성;선우명훈
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.28 no.6A
    • /
    • pp.405-413
    • /
    • 2003
  • This paper presents new DSP (Digital Signal Processor) instructions and their hardware architecture to efficiently implement RS (Reed-Solomon) codecs, which is one of the most widely used FEC (Forward Error Control) algorithms. The proposed DSP architecture can implement various primitive polynomials by program, and thus, hardwired codecs can be replaced. The new instructions and their hardware architecture perform GF (Galois Field) operations using the proposed GF multiplier and adder. Therefore, the proposed DSP architecture can significantly reduce the number of clock cycles compared with existing DSP chips. It can perform RS decoding rate of up to 228.1 Mbps on 130MHz DSP chips.

Design of Unproved Diffie-Hellman Key Agreement Protocol Based on Distance Bounding for Peer-to-peer Wireless Networks (향상된 경계 결정 기반의 Diffie-Hellman 키 일치 프로토콜)

  • Park, Sern-Young;Kim, Ju-Young;Song, Hong-Yeop
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.33 no.1C
    • /
    • pp.117-123
    • /
    • 2008
  • We propose an improved Diffie-Hellman(DH) key agreement protocol over a radio link in peer-to-peer networks. The proposed protocol ensures a secure establishment of the shared key between two parties through distance bounding(DB). Proposed protocol is much improved in the sense that we now reduce the number of messages exchanged by two, the number of parameters maintained by four, and 2(7682(k/64)-64) of XOR operations, where k is the length of the random sequence used in the protocol. Also, it ensures a secure reusability of DH public parameters. Start after striking space key 2 times.

An Effective Algorithm for Diagnosing Sensor Node Faults (효율적인 센서 노드 고장 진단 알고리즘)

  • Oh, Won-Geun;Lee, Sung-Keun
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.10 no.2
    • /
    • pp.283-288
    • /
    • 2015
  • The possible erroneous output data of the sensor nodes can cause the performance limit or the degradation of the reliability in the whole wireless sensor networks(WSN). In this paper, we propose a new sensor node scheme with multiple sensors and a new fault diagnostic algorithm. The algorithm can increase the reliability of the whole WSNs by utilizing measurements of the multiple sensors on the node and by determining the validity of the date by comparing the value of each sensor. It can increase the cost and complexity of the node, but is suitable for the area where the high reliability is critical.

An Architecture of the Fast Parallel Multiplier over Finite Fields using AOP (AOP를 이용한 유한체 위에서의 고속 병렬연산기의 구조)

  • Kim, Yong-Tae
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.7 no.1
    • /
    • pp.69-79
    • /
    • 2012
  • In this paper, we restrict the case as m odd, n=mk, and propose and explicitly exhibit the architecture of a new parallel multiplier over the field GF($2^m$) with a type k Gaussian period which is a subfield of the field GF($2^n$) implements multiplication using the parallel multiplier over the extension field GF($2^n$). The complexity of the time and area of our multiplier is the same as that of Reyhani-Masoleh and Hasan's multiplier which is the most efficient among the known multipliers in the case of type IV.

Spatial and Frequency Diversity Combining Order in Uplink SC-FDMA with SIMO Systems (상향링크 SIMO 시스템에서 공간 및 주파수 다이버시티 컴바이닝 순서에 따른 SC-FDMA 성능 분석)

  • Lee, Jin-Hui;Choi, Kwonhue
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.40 no.3
    • /
    • pp.432-440
    • /
    • 2015
  • We investigate BER performance according to the order of spatial and frequency diversity combining in uplink SC-FDMA of SIMO systems. It is found that frequency diversity combining (FDC) after spatial diversity combining (SDC) is better than the reverse order combing in all SNR (Signal to Noise Ratio) range. Also, it is shown that FDC after SDC requires less computational complexity than the reverse order combining.

Parallel Accessed Mirroring based on Stripping (스트라이핑 기반의 병렬 접근 미러링 기법)

  • Kang, Dong-Jae;Kim, Chang-Soo;Shin, Bum-Joo;Kim, Hag-Young
    • Annual Conference of KIPS
    • /
    • 2002.11a
    • /
    • pp.539-542
    • /
    • 2002
  • 멀티미디어와 인터넷의 대중화가 야기한 급격한 데이터의 증가는 테라(Tera)바이트 이상의 대용량 저장공간과 대용량 정보의 효율적인 공유를 지원하는 스토리지 시스템을 요구하고 있으며 이를 위하여 SAN 기반의 스토리지 클러스터링 시스템들이 많이 사용되고 있다. 이러한 환경에서 하드웨어 또는 소프트웨어 RAID(Redundant Array of Independent Disks)는 대용량 정보의 고성능의 입출력과 신뢰성을 위해서 필수적이 되었다. 범용적인 RAID로는 RAE-0, RAID-1, RAID-5가 주로 사용되고 있으며 각각의 레벨은 장단점을 갖는다. 본 논문에서는 RAID-0와 RAID-1이 갖는 문제점들의 보완을 위하여 변형된 RAID 레벨인 RAID-SM을 제안한다. RAID-SM은 기존의 RAID-1이 가지는 데이터의 가용성을 유지하면서 추가적인 비용 없이 RAID-0의 우수한 입출력 성능을 얻기 위한 RAID-1의 변형된 방식이다. RAID-SM의 구현을 위하여 디스크상의 데이터의 배치 및 데이터 맵핑 탕식을 정의하고 RAID-SM에서의 I/O방법을 기술한다. 제안하는 RAID-SM은 멀티미디어나 GIS 데이터와 같은 읽기 연산 집약적인 시스템을 대상으로 하는 안정적인 레이드 방식이며 RAID-SM의 장점 및 성능은 본 논문에서의 실험을 통한 결과로서 제시한다.

  • PDF

Real-Time Face Tracking System Of Object Segmentation Tracking Method Applied To Motion and Color Information (움직임과 색상정보에서 객체 분할 추적 기법을 적용한 실시간 얼굴 추적 시스템)

  • Choi, Young-Kwan;Cho, Sung-Min;Choi, Chul;Hwang, Hoon;Park, Chang-Choon
    • Annual Conference of KIPS
    • /
    • 2002.11a
    • /
    • pp.669-672
    • /
    • 2002
  • 최근 멀티미디어 기술의 급속한 발달로 인해 개인의 신원 확인, 보안 시스템 등의 영역에서 얼굴과 관련된 연구가 활발히 진행 되고 있다. 기존의 연구에서는 원거리 추적이 어려우며, 연산시간, 잡음(noise), 배경과 조명등에 따라 추적 효율이 낮은 단점을 가지고 있다. 본 논문에서는 빠르고 정확한 얼굴 추적을 위한 차 영상 기법(differential image method)을 이용한 분할영역(segmentation region)에서 움직임(motion)과 피부색(skin color) 특성 기반의 객체분할추적(Tracking Of Object segmentation) 방법을 이용하였다. 객체분할추적은 얼굴을 하나의 객체(object)로 인식하고 제안한 방법으로 얼굴 부분만 분할하는 단계와 얼굴특징추출 단계를 적용하여 피부색 기반의 연구에서 나타난 입력영상(Current Frame)에서의 유동적인 피부색의 노출 대한 얼굴 추적 연구의 문제점을 해결했다. 시스템은 현재 컴퓨터에 일반적으로 사용되는 카메라를 이용하여 구현 하였고, 실시간(real-time) 영상에서 비교적 성공적인 얼굴 추적을 하였다[4].

  • PDF

An Analysis of Continuous Beam by Material Non-linear Transfer Matrix Method (재료비선형 전달행렬법에 의한 연속보의 해석)

  • Seo, Hyun Su;Kim, Jin Sup;Kwon, Min Ho
    • Journal of the Korea institute for structural maintenance and inspection
    • /
    • v.15 no.1
    • /
    • pp.77-84
    • /
    • 2011
  • This study is to develop nonlinear analysis algorithm for transfer matrix method, which can be applied to continuous beam analysis. Gauss-Lobatto integral rule is adopted and the transfer matrix is derived from stiffness matrix. In the transfer matrix method, the system equation has a constant number of unknowns regardless of number of D.O.F. Therefore, the transfer matrix method has computational efficiencies not only in linear elastic analysis but also in nonlinear analysis. To verify the developed method, the analysis results of several examples are compared with commercial code in moment-curvature, moment-displacement and load-displacement relation.