• 제목/요약/키워드: Floating Point Number

검색결과 83건 처리시간 0.025초

OpenGL을 이용한 OpenGL ES 1.1 구현 (OpenGL ES 1.1 Implementation Using OpenGL)

  • 이환용;백낙훈
    • 정보처리학회논문지A
    • /
    • 제16A권3호
    • /
    • pp.159-168
    • /
    • 2009
  • 본 논문에서는 데스크탑과 같이 OpenGL 기능이 전용 하드웨어로 제공되는 환경을 대상으로, OpenGL ES 1.1 표준을 효율적으로 구현하는 방법을 제시한다. OpenGL ES는 기존의 OpenGL 표준을 바탕으로 하였지만, 고정소수점 연산, 이를 수용하는 버퍼 기능, 완전히 새로운 텍스처 처리 등의 도입으로, 임베디드 시스템에 특화된 3차원 그래픽스 라이브러리로 새롭게 제정되어, 구글 안드로이드, 애플 아이폰, 플레이스테이션3 등에서 공식 3차원 그래픽스 API로 채택되었다. 본 논문에서는 OpenGL ES의 특징적 자료형인 고정소수점 표현에 대한 산술 연산들을 개선하였고, 특히 고정소수점 자료형들을 부동소수점 형태로 변환하여 하위의 OpenGL API로 넘기는 과정에서 표준을 준수하면서도 효율적인 처리가 가능하도록 하였다. 새로 도입된 고정소수점 자료형을 허용하는 버퍼 기능에 대해서는 변환된 자료들을 별도의 메모리 공간에서 관리하는 방식으로 속도 향상에 중점을 두었으며, 요구 사항이 완전히 달라진 텍스처 처리 부분은 전체 기능을 별도의 소프트웨어로 완전히 새롭게 구현하였다. 최종 구현 결과인 OpenGL ES 라이브러리는 OpenGL ES 1.1 표준에 규정된 총 200여 함수를 제공하며, 표준인증 테스트를 완전히 통과하여 1.1 표준을 완벽히 만족시켰음을 보였다. 수행 속도 면에서는 OpenGL ES에 특화된 응용 프로그램들에 대한 처리 속도 측정에서 기존의 구현 사례들에 비해 최대 33.147배의 속도 향상을 가져왔으며, 동일한 범주의 구현 사례들 중에서 가장 빠른 구현 결과이다.

작은 크기의 Warp 스케쥴러 기반 SIMT구조 고성능 모바일 GPGPU 설계 (Design of a High-Performance Mobile GPGPU with SIMT Architecture based on a Small-size Warp Scheduler)

  • 이광엽
    • 전기전자학회논문지
    • /
    • 제25권3호
    • /
    • pp.479-484
    • /
    • 2021
  • 본 논문은 SIMT구조의 GPGPU에서 적은 core수로 고성능을 달성하기 위한 구조를 제안하고 설계하였다. 모바일기기에 적용하기 위한 GPGPU는 소모전력대비 성능을 높이기 위한 구조가 필수적이다. 소모전력을 줄이기 위해서 core수가 줄어든 대신 성능을 높이기 위해 thread를 관리하기 위한 warp scheduler의 size를 4로 하여 일반적인 GPGPU의 32 보다 크게 줄였다. Warp size를 적게 되면 pipeline의 idle cycle수를 줄일 수 있고 cache 메모리 접근시 miss penalty를 줄이기 위한 memory latency 적용이 효율적이다. 설계된 GPGPU는 부동소수점 연산을 포함하는 테스트 프로그램으로 연산 성능을 측정하고 28nm CMOS공정으로 소비전력을 측정하여 전력당 성능지수로 104.5GFlops/Watt를 얻었다. 본 논문의 결과는 Nvidia의 Tegra K1과 비교하였을 때 약 4배 우수한 전력당 성능지수를 보였다.

A DSP Implementation of Subband Sound Localization System

  • Park, Kyusik
    • The Journal of the Acoustical Society of Korea
    • /
    • 제20권4E호
    • /
    • pp.52-60
    • /
    • 2001
  • This paper describes real time implementation of subband sound localization system on a floating-point DSP TI TMS320C31. The system determines two dimensional location of an active speaker in a closed room environment with real noise presents. The system consists of an two microphone array connected to TI DSP hosted by PC. The implemented sound localization algorithm is Subband CPSP which is an improved version of traditional CPSP (Cross-Power Spectrum Phase) method. The algorithm first split the input speech signal into arbitrary number of subband using subband filter banks and calculate the CPSP in each subband. It then averages out the CPSP results on each subband and compute a source location estimate. The proposed algorithm has an advantage over CPSP such that it minimize the overall estimation error in source location by limiting the specific band dominant noise to that subband. As a result, it makes possible to set up a robust real time sound localization system. For real time simulation, the input speech is captured using two microphone and digitized by the DSP at sampling rate 8192 hz, 16 bit/sample. The source location is then estimated at once per second to satisfy real-time computational constraints. The performance of the proposed system is confirmed by several real time simulation of the speech at a distance of 1m, 2m, 3m with various speech source locations and it shows over 5% accuracy improvement for the source location estimation.

  • PDF

Mooring Cost Sensitivity Study Based on Cost-Optimum Mooring Design

  • Ryu, Sam Sangsoo;Heyl, Caspar;Duggal, Arun
    • 한국해양공학회지
    • /
    • 제23권1호
    • /
    • pp.1-6
    • /
    • 2009
  • The paper describes results of a sensitivity study on an optimum mooring cost as a function of safety factor and allowable maximum offset of the offshore floating structure by finding the anchor leg component size and the declination angle. A harmony search (HS) based mooring optimization program was developed to conduct the study. This mooring optimization model was integrated with a frequency-domain global motion analysis program to assess both cost and design constraints of the mooring system. To find a trend of anchor leg system cost for the proposed sensitivity study, optimum costs after a certain number of improvisation were found and compared. For a case study a turret-moored FPSO with 3 ${\times}$ 3 anchor leg system was considered. To better guide search for the optimum cost, three different penalty functions were applied. The results show that the presented HS-based cost-optimum offshore mooring design tool can be used to find optimum mooring design values such as declination angle and horizontal end point separation as well as a cost-optimum mooring system in case either the allowable maximum offset or factor of safety varies.

부유식 해양구조물을 위한 돌핀 계류시스템의 설계 연구 (A Study on the Design of Dolphin System for VLFS)

  • 조규남
    • 한국전산구조공학회논문집
    • /
    • 제19권1호
    • /
    • pp.105-111
    • /
    • 2006
  • 돌핀계류시스템은 부유식 해양구조물의 계류장치로서 강도 및 유용도 관점에서 바람직한 대안이 될 수 있다. 돌핀계류시스템 설계과정에서 정확한 파력산정과 필요한 지지파일의 개수선정은 주요 설계요인이 된다 본 논문에서는 파의 충격하중을 포함한 외력에 대한 구조해석을 통하여 적정한 돌핀시스템의 설계과정과 형식을 제시하였다. 부유식 해양구조물을 위한 돌핀계류시스템의 경우 다수의 지지파일시스템보다 단주의 지지파일시스템이 설계관점에서, 제한적이기는 하나, 유용성이 높다는 점을 알 수 있었다.

최적화 정수형 여현 변환 (Optimized Integer Cosine Transform)

  • 이종하;김혜숙;송인준;곽훈성
    • 전자공학회논문지B
    • /
    • 제32B권9호
    • /
    • pp.1207-1214
    • /
    • 1995
  • We present an optimized integer cosine transform(OICT) as an alternative approach to the conventional discrete cosine transform(DCT), and its fast computational algorithm. In the actual implementation of the OICT, we have used the techniques similar to those of the orthogonal integer transform(OIT). The normalization factors are approximated to single one while keeping the reconstruction error at the best tolerable level. By obtaining a single normalization factor, both forward and inverse transform are performed using only the integers. However, there are so many sets of integers that are selected in the above manner, the best OICT matrix obtained through value minimizing the Hibert-Schmidt norm and achieving fast computational algorithm. Using matrix decomposing, a fast algorithm for efficient computation of the order-8 OICT is developed, which is minimized to 20 integer multiplications. This enables us to implement a high performance 2-D DCT processor by replacing the floating point operations by the integer number operations. We have also run the simulation to test the performance of the order-8 OICT with the transform efficiency, maximum reducible bits, and mean square error for the Wiener filter. When the results are compared to those of the DCT and OIT, the OICT has out-performed them all. Furthermore, when the conventional DCT coefficients are reduced to 7-bit as those of the OICT, the resulting reconstructed images were critically impaired losing the orthogonal property of the original DCT. However, the 7-bit OICT maintains a zero mean square reconstruction error.

  • PDF

신경망 보상기를 이용한 PMSM의 간단한 지능형 강인 위치 제어 (Simple Al Robust Digital Position Control of PMSM using Neural Network Compensator)

  • 고종선;윤성구;이태호
    • 대한전기학회논문지:전기기기및에너지변환시스템부문B
    • /
    • 제49권8호
    • /
    • pp.557-564
    • /
    • 2000
  • A very simple control approach using neural network for the robust position control of a Permanent Magnet Synchronous Motor(PMSM) is presented. The linear quadratic controller plus feedforward neural network is employed to obtain the robust PMSM system approximately linearized using field-orientation method for an AC servo. The neural network is trained in on-line phases and this neural network is composed by a feedforward recall and error back-propagation training. Since the total number of nodes are only eight, this system can be easily realized by the general microprocessor. During the normal operation, the input-output response is sampled and the weighting value is trained multi-times by error back-propagation method at each sample period to accommodate the possible variations in the parameters or load torque. In addition, the robustness is also obtained without affecting overall system response. This method is realized by a floating-point Digital Signal Processor DS1102 Board (TMS320C31).

  • PDF

CMA 알고리즘을 이용한 고속 DFE 등화기 설계 (Design of a High-speed Decision Feedback Equalizer using the Constant-Modulus Algorithm)

  • 전영섭;선우명훈;김경호
    • 대한전자공학회논문지TC
    • /
    • 제39권4호
    • /
    • pp.173-179
    • /
    • 2002
  • 본 논문은 DFE (Decision Feedback Equalizer)구조와 CMA (Constant Modulus Algorithm), 그리고 LMS (Least Mean Square) 알고리즘을 이용한 등화기에 대하여 기술한다. DFE 구조는 기존의 transversal 구조의 등화기에 비하여 빠른 채널 적응 속도와 낮은 BER (Bit Error Rate) 값을 가지며 ISI(Intersymbol Interference)가 심한 환경에서도 좋은 성능을 나타낸다. 본 등화기는 16/64 QAM(Quadrature Amplitude Modulation) 변복조 방식에 적용할 수 있으며, 고속으로 동작할 수 있도록 고속의 곱셈기와 많은 수의 CSA (Carry Save Adder)를 사용하였다. COSSAP/sup TM/ 캐드 툴을 사용하여 부동 소수점 모델과 고정 소수점 모델을 개발하였으며, VHDL 모델을 개발하였다. 시뮬레이션 결과에 따라 feedback 부분과 feedforward 부분에 각각 12개와 8개의 탭을 사용하였으며, 다중 경로 페이딩 채널에서 BER이 10-6일 때를 기준으로 보면 등화기를 사용하지 않은 채널의 BER 보다 SNR(Signal to Noise Ratio)이 4dB 정도 향상되었다. SYNOPSYS/sup TM/ 캐드 툴과 삼성의 0.5 ㎛ standard cell library (STD80) 를 이용하여 로직 합성을 수행하였으며, 전체 게이트 카운트는 약 13만개를 보였다.

고속 동영상 부호기를 위한 부호화 방법에 관한 연구 (A study on the Encoding Method for High Performance Moving Picture Encoder)

  • 김용욱;허도근
    • 한국정보통신학회논문지
    • /
    • 제8권2호
    • /
    • pp.352-358
    • /
    • 2004
  • 본 논문은 움직임 벡터의 분포특성을 이용한 새로운 움직임 벡터 탐색 알고리즘과 정수 연산만을 필요로 하는 정수형 DCT(Discrete Cosine Transform)를 사용하여 H.263 환경에서 동영상 부호기의 성능향상에 대해 연구한다. 정수형 DCT는 Un(Walsh-Hadamard Transform)와 정수 lifting을 이용하여 정수의 덧셈 연산만으로 DCT연산을 수행하므로 부동소수점수의 곱셈을 포함하는 기존 DCT에 비하여 연산량은 줄이면서도 동일한 PSNR을 얻는다. 새로운 움직임 벡터 탐색 알고리즘은 기존의 움직임 벡터 탐색 알고리즘인 3SS(Step Search)나 4SS에 비하여 움직임 추정에 필요한 연산량을 감소시키면서 거의 비슷한 PSNR을 보인다. 또한 모의 실험에서 H.263 부호기 환경에서 정수형 DCT와 기존 DCT는 서로 호환됨을 보인다. 따라서 본 논문에서 제안한 부호화 방법은 H.263 부호화 과정에서 동영상 정보의 효율적인 실시간 처리를 가능하게 하며 다른 동영상 부호기에도 적용하여 부호화 성능을 향상시킬 수 있다.

JPEG 영상 복원을 위한 다중 모드 채도 복원과 연산 재배열 기반의 시간 최적화된 컬러 변환 (Time-optimized Color Conversion based on Multi-mode Chrominance Reconstruction and Operation Rearrangement for JPEG Image Decoding)

  • 김영주
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.135-143
    • /
    • 2009
  • 최근 모바일 장치에서 고해상도 영상의 인코딩 및 디코딩에 대한 요구가 늘어남에 따라 효율적인 영상 코덱 개발의 필요성이 증대되고 있다. 본 논문은 JPEG 디코딩 과정에서 IDCT 변환과 컬러변환 배열간의 선형성을 바탕으로 이들 연산순서를 재배열함으로써 컬러변환 과정에서 요구되는 계산 횟수를 줄이고 재배열된 부동소수점 연산에 정수 맵핑을 적용하여 시간 복잡도를 줄임으로써 실행시간을 크게 단축하는 컬러변환 기법을 제안한다. 또한, 제안된 기법은 연산 재배열 및 정수 맵핑의 양자화오류로 인한 화질 저하를 다중 모드 채도 재구성 기법을 적용하여 보상하도록 한다. 임베디드 시스템 개발 플랫폼에서의 성능평가를 통해 제안 된 기법이 기존의 컬러변환 기법들과 비교하여 복원 영상의 화질 저하를 최소화하면서 실행시간을 크게 단축함을 알 수 있었다.