• 제목/요약/키워드: Floating Point Unit

검색결과 76건 처리시간 0.029초

부동 소수점 유닛의 고속처리를 위한 가산기 모듈의 설계 및 검증 (Design and Verification of Adder Module for Fast Floating-Point Unit)

  • 정명수;손승일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.611-614
    • /
    • 2005
  • 1970년대 말까지 초창기에 출시된 컴퓨터들은 부동 소수점을 표현하기 위한 자신들의 내부적 표현방식을 사용하였다. 따라서 각 컴퓨터마다 부동 소수점 연산에 대한 계산 결과가 약간씩 차이가 나기도 하였다. 이러한 문제점을 해결하기 위해 IEEE에서는 부동 소수점에 대한 표준안을 제안하였다. 이는 서로 다른 컴퓨터 간에 부동 소수점 데이터의 교환이 가능하게 할 뿐만 아니라 하드웨어 설계자들에게도 정확한 모델을 제공하는 것이 목적이었다. 이 당시 제정된 부동 소수점 표준안은 IEEE Standard 754 부동 소수점이며, 오늘날 인텔 CPU 기반의 PC, 매킨토시 및 대부분의 유닉스 플랫폼에서 컴퓨터 상의 실수를 표현하기 위해 사용하는 가장 일반적인 표현 방식으로 발전하였다. 본 논문에서는 부동 소수점의 기본적인 표현방식에 대해 연구하고, 이 중 32 bit 단일 정밀도 부동 소수점 가산기를 Microsoft Visual C++ 6.0을 이용해 시뮬레이션하고 이를 VHDL로 구현한다.

  • PDF

신경회로망의 고속 구현 방법에 관한 연구 (A Study on Tools for Implementing High-speed Neural Network)

  • 김병근;김두식;이상호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.377-380
    • /
    • 2002
  • 신경회로망은 문자인식, 자동제어 등의 여러 분야에 널리 쓰이는 방식이다. 그러나 신경회로망을 구현하는데는 연산량이 많아서 실시간으로 구현하기에 어려움이 많이 따른다. 본 논문은 신경회로망을 구현하는데 필요한 연산을 살펴보고 그 연산을 구현하는 방법을 비교 분석하였다. 신경회로망을 구현하기 위해 DSP(Digital Signal Processor), PC의 FPU(Floating Point Unit), Intel사의 Pentium 계열 프로세서에서 지원하는 SIMD(Single Instruction Multiple Data) 기술을 사용하여 결과를 비교 분석 하였다. 신경회로망의 핵심인 MLP(Multi Layer Perceptron) 연산에 대해 실험한 결과 SIMD 기술을 이용하는 방법이 다른 방법에 비해 2배이상 좋은 결과를 나타내었다.

  • PDF

GPGPU를 위한 공유 메모리 최적화 (Optimizing Shared Memory Accesses for GPGPU Computations)

  • 쟌 느앗 프엉;이명호;홍석원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.197-199
    • /
    • 2012
  • 최근 GPU 의 뛰어난 부동 소수점 연산 능력을 활용하여 그래픽 이외에 다양한 응용 프로그램들의 병렬화 및 성능최적화가 활발하게 이루어지고 있다. 이러한 GPU 의 성능을 극대화하기 위해서는 메모리 계층구조 및 shared memory 를 비롯한 on-chip 메모리의 사용을 최적화하는 것이 필수적이다. 본 논문에서는 이러한 shared memory 의 사용을 최적화하기 위한 기법들을 제안하고, 이를 패턴 매칭 응용 프로그램에 적용하여 효용성을 검증한다.

작은 룩업테이블을 가지는 새로운 파이프라인 나눗셈기 (A New Pipelined Divider with a Small Lookup Table)

  • 정웅;박우찬;곽승호;양훈모;정철호;한탁돈;이문기
    • 대한전자공학회논문지SD
    • /
    • 제40권9호
    • /
    • pp.724-733
    • /
    • 2003
  • 기존의 나눗셈 연산기들은 대부분 반복적인 방식으로 연산을 수행하여 왔으나, 최근에는 파이프라인드 나눗셈 연산기에 대한 연구가 시도되고 있다. 현재 발표된 파이프라인 나눗셈 연산기는 큰 사이즈의 룩업테이블을 필요로 하기 때문에 면적을 크게 차지한다는 단점이 있다. 본 논문에서는 기존의 파이프라인드 나눗셈 연산기에 비해 룩업테이블을 크게 줄여, 비용에 효과적인 파이프라인 나눗셈 연산기를 제안한다. 제안하는 나눗셈 연산기는 단정밀도에서 3 사이클의 지연시간를 가지며, P. Hung의 방식에 비하여 약 30퍼센트 정도의 면적을 줄일 수 있다.

LIN/CAN 차량용 인터페이스와 칼만 필터 기능을 통합한 차량용 ECU 설계 (Vehicle ECU Design Incorporating LIN/CAN Vehicle Interface with Kalman Filter Function)

  • 정선우;김용빈;이성수
    • 전기전자학회논문지
    • /
    • 제25권4호
    • /
    • pp.762-765
    • /
    • 2021
  • 본 논문에서는 자동차의 위치 및 자세 추정에 사용되는 칼만 필터 가속기를 내장한 차량용 ECU(electronic control unit)를 설계하고 구현하였다. 프로세서 코어는 RISC-V를 사용하였으며 칼만 필터의 행렬 연산을 수행하는 가속기, 차량 내 통신에 사용되는 CAN(controller area network) 제어기, 센서 연결에 사용되는 LIN(local interconnect network) 제어기를 내장하였다. 칼만 필터 연산은 시간 업데이트와 측정 업데이트의 두 단계로 나뉘며 시간 업데이트 단계에서는 현재 상태변수와 오차 공분산을 예측하고 측정 업데이트 단계에서는 입력값을 받아 칼만 이득을 계산하여 값을 보정한다. 보통 소프트웨어에서는 곱셈에 부동소숫점 연산을 사용하지만 본 논문에서는 하드웨어 면적을 줄이기 위해 정밀도 분석을 고려한 고정소숫점 곱셈기를 사용하였다. 설계된 ECU는 Verilog HDL을 이용하여 검증하였으며 28nm 실리콘 공정으로 구현하였다. 28nm 실리콘 공정으로 구현하였을 때 동작 주파수는 100MHz, 면적은 0.37mm2, 게이트 수는 76만 게이트였다.

벡터화된 SIMD 프로그램어블 통합 셰이더를 위한 특수 함수 유닛 설계 (Design of Special Function Unit for Vectorized SIMD Programmable Unified Shader)

  • 정진하;김경섭;윤정희;서장원;최상방
    • 대한전자공학회논문지SD
    • /
    • 제47권5호
    • /
    • pp.56-70
    • /
    • 2010
  • 현실감 있는 3차원 그래픽 영상을 지원하기 위해서는 3차원의 그래픽 데이터를 기반으로 사실감을 부여하여 2차원 영상을 생성하는 렌더링 기술과 방대한 양의 데이터에 대해 복잡한 연산을 효율적으로 처리할 수 있는 고성능 그래픽 프로세서가 요구된다. 이로 인해 그래픽 하드웨어는 급속히 발전하였고 기존에 실시간 처리가 불가능했던 여러 고급 렌더링 효과들을 가능하게 하고 있다. 과거에 비해 셰이딩 기술이 발전하면서 사실적인 영상의 렌더링이 가능하게 되었으나 아직 많은 계산 시간을 필요로 하고 있다. 실사와 같은 영상을 빠르게 처리하기 위해서 그래픽 프로세서는 많은 데이터에 대해 복잡한 부동소수점 연산을 효율적으로 처리 할 수 있도록 다수의 연산유닛이 집적되는 방향으로 발전하고 있다. 본 논문에서는 프로그램어블 통합 셰이더 프로세서에서 고성능 3차원 컴퓨터 그래픽 영상을 지원하기 위해 특수 함수 유닛을 설계하고 구현하였다. 설계한 특수 함수 유닛에 대해 기능적 레벨의 시뮬레이션을 하여 동작을 검증 하였으며, FPGA Virtex-4(xc4vlx200)에 구현하여 하드웨어 리소스 사용율과 동작속도를 확인 하였다.

TMS320C25 DSP를 이용한 실시간 TWS 시스템 구현 (On the Real Time Implementation of the TWS System Using the TMS320C25 DSP)

  • 기석철;이상욱
    • 대한전자공학회논문지
    • /
    • 제26권6호
    • /
    • pp.147-155
    • /
    • 1989
  • 본 논문에서는 고속 신호처리 프로세서(digital signal processor)인 TMS320C25를 사용하여 칼만 필터링 기법을 이용한 실시간 TWS(track-while-scan) 시스템의 구현에 대하여 고찰하였다. 먼저 고정 소숫점 연산에 의해 칼만 필터를 구현 할 때 생기는 FWL(finite word length)의 영향에 대하여 알아 보았다. 실시간 TWS 시스템은 TWS연산부, 스캔 컨버터(scan converter) 그리고 시스템 제어부로 구성하였고 시스템 버스는 multi-bus를 채택하였다. TWS 시스템은 최대 8개의 표적을 동시 추적하기 위하여 제작되었으며, 실험을 통하여 8개의 표적을 동시에 추적하는데 부동 소숫점 연산시 약 0.35sce, 고정 소숫점 연산시 약 0.28sec의 시간이 소요된다는 결과를 보임으로써 칼만 필터를 실시간으로 처리 할 수 있는 충분한 가능성을 제시하였다.

  • PDF

Daubechies D4 필터를 사용한 시간가변(time-varying) 볼륨 데이터의 압축 (Compression of time-varying volume data using Daubechies D4 filter)

  • 허영주;이중연;구기범
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.982-987
    • /
    • 2007
  • The necessity of data compression scheme for volume data has been increased because of the increase of data capacity and the amount of network uses. Now we have various kinds of compression schemes, and we can choose one of them depending on the data types, application fields, the preferences, etc. However, the capacity of data which is produced by application scientists has been excessively increased, and the format of most scientific data is 3D volume. For 2D image or 3D moving pictures, many kinds of standards are established and widely used, but for 3D volume data, specially time-varying volume data, it is very difficult to find any applicable compression schemes. In this paper, we present a compression scheme for encoding time-varying volume data. This scheme is aimed to encoding time-varying volume data for visualization. This scheme uses MPEG's I- and P-frame concept for raising compression ratio. Also, it transforms volume data using Daubechies D4 filter before encoding, so that the image quality is better than other wavelet-based compression schemes. This encoding scheme encodes time-varying volume data composed of single precision floating-point data. In addition, this scheme provides the random reconstruction accessibility for an unit, and can be used for compressing large time-varying volume data using correlation between frames while preserving image qualities.

  • PDF

3차원 그래픽프로세서용 특수 목적 연산장치의 하드웨어 설계 (Hardware Design of Special-Purpose Arithmetic Unit for 3-Dimensional Graphics Processor)

  • 최병윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.140-142
    • /
    • 2011
  • 본 논문에서는 모바일 그래픽프로세용 특수목적 연산 회로를 설계하였다. 특수목적 연산회로(SFU)는 6개의 연산, 즉, $1/{\chi}$, $\frac{1}{{\sqrt{x}}$, $log_2x$, $2^x$, $sin(x)$, $cos(x)$를 지원한다. 특수목적 연산 회로는 높은 정밀도 조건을 만족하기 위해 IEEE 표준 부동 소수점 형식을 사용하는 2차 다항식 minimax 알고리즘을 사용하였으며, 높은 연산 성능을 위해 5-단 파이프라인 구조를 갖고 있다. 설계한 특수목적 연산회로 는 65nm 삼성 CMOS 표준셀 공정 조건에서 약 23,000개의 게이트로 구성되며, 약 400 Mhz의 동작 주파수를 가진다. 설계된 회로는 파이프라인 구조로 동작하므로 약 400 MOPS(Million Operations Per Second)의 연산 성능을 갖고 있어서, 고성능 3차원 그래픽 프로세서에 적용이 가능하다.

  • PDF

Card 목록작성에 있어서 기선(Indention) 설정을 위한 시도 (An Attempt for Establishing Indention on Drawing up Card Catalogue.)

  • 김남석
    • 한국도서관정보학회지
    • /
    • 제4권
    • /
    • pp.61-90
    • /
    • 1977
  • The historical development of books examination with utilizing science become inevitable to the machanization of library catalogues. With the advance of times, like this, a new- development of $Indention('||'&'||'$ : Kisun) must be sought for which is a kind of descriptive catalogues being used now. This paper is scheduled to grasp problems in the course of using and logical grounds of Indention which hal-e been used disordering. It must be considered that four kinds of Icdention settlement is suitable to the features of Korean letters. 1) TI-e must consider the features of Korean Language and Oriental Language writing(Japan, China). There must be a establishment of floating $Indention('||'&'||'E$ : Kisun), which are suitable for the writting style or hand writting man on the point of most of Koreans are depend upon hand witting, then books catalogues like western language, not left edge of the cards of the $Indention(B$ : Kisun) establishing, from edge to Call Number, from the last of the Call Number to First Indention(%-Bl63). First Indention(%-%%) to a space of Second $indention($\ulcorner^%)$ must be established and then, every catalogue and Indentions are distinguished surely. 2) \Then we consider the developing catalogue making in the future. It is important to establish a fixed $Indention('||'&'||'$ : Kisun) for machinization of typewriter(Korean, Mimeographing) and computer, etc ... not "Cm" unit but "Space" unit, and consider oriental letter, ne make more surplus space as a Indention, we can give anadaptablity of using machines. 3) Considering typography printing and type-setting printing by printing type, we must fit the $Indention(\ulcorner'||'&'||'$ : Kisun) as a "Cm" unit, and there must be a re-adjustment of $Indention(g$$ : Kisun) which considered the complexity of Call Number by a mass of collecting books like this, the establishment of Indention(E'||'&'||'j!: Kisun). We must not use a uilified one as a concrete conception by "Space" or "Cm" unit which has been used now but re-adjusted adaptably which can be fited as a method of making of catalogues. 4) The name of $Indcntion(J, S$ : Kisun) has becll called 7;arious methods until now, but English Indention which has been used without any concrete mexirig must be used as a ours fitable as a our mind. The above mentioned is presented as a Indention and examinational l~letilods by myself style, I wants these r i l l be helpful to the future developments of the machanization of Indention $(sf:$ Ki sun). Concrete studies must be continued in the future for development of $Indention(zj:$ : Kisun). : Kisun).

  • PDF