• Title/Summary/Keyword: 부동점

Search Result 246, Processing Time 0.024 seconds

Research on PEFT Feasibility for On-Device Military AI (온 디바이스 국방 AI를 위한 PEFT 효용성 연구)

  • Gi-Min Bae;Hak-Jin Lee;Sei-Ok Kim;Jang-Hyong Lee
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.51-54
    • /
    • 2024
  • 본 논문에서는 온 디바이스 국방 AI를 위한 효율적인 학습 방법을 제안한다. 제안하는 방법은 모델 전체를 재학습하는 대신 필요한 부분만 세밀하게 조정하여 계산 비용과 시간을 대폭 줄이는 PEFT 기법의 LoRa를 적용하였다. LoRa는 기존의 신경망 가중치를 직접 수정하지 않고 추가적인 낮은 랭크의 매트릭스를 학습하는 방식으로 기존 모델의 구조를 크게 변경하지 않으면서도, 효율적으로 새로운 작업에 적응할 수 있다. 또한 학습 파라미터 및 연산 입출력에 데이터에 대하여 32비트의 부동소수점(FP32) 대신 부동소수점(FP16, FP8) 또는 정수형(INT8)을 활용하는 경량화 기법인 양자화도 적용하였다. 적용 결과 학습시 요구되는 GPU의 사용량이 32GB에서 5.7GB로 82.19% 감소함을 확인하였다. 동일한 조건에서 동일한 데이터로 모델의 성능을 평가한 결과 동일 학습 횟수에선 LoRa와 양자화가 적용된 모델의 오류가 기본 모델보다 53.34% 증가함을 확인하였다. 모델 성능의 감소를 줄이기 위해서는 학습 횟수를 더 증가시킨 결과 오류 증가율이 29.29%로 동일 학습 횟수보다 더 줄어듬을 확인하였다.

  • PDF

Automotive Engine Performance Analysis of antifreeze content and water type (부동액 함유량과 냉각수 종류에 따른 자동차 엔진 성능분석)

  • Hong, Sung-In
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.16 no.3
    • /
    • pp.1594-1599
    • /
    • 2015
  • The world car industry is in an era of internal combustion engines in the past 100 years of environmental, energy and IT is eco-friendly, high-tech cars technologies are bringing an era of change. Until now, the study of new technologies in automobile research and development has been focused on. The car's new technology development is also important, but it's cutting-edge technology is used in the car before the car's performance, and became an important point in the customer experience improvement problems. New technology development, as well as effective for existing technology applied is also important. This study was to determine the effects of temperature and the performance of automobile engine and determine the cause of the content in accordance with the type(tap water, distilled water, underground water) of anti-freeze and water that is contained in the automotive engine cooling water for the effective application of the anti-freeze. In the freezing point of the coolant -10, -20, -30, -40, $-50^{\circ}C$ dynamo performance test was conducted with the numerical analysis. Water (distilled water) were measured at the reference point peak performance 71.112, 99.622hp freezing $-10^{\circ}C$.

A common fixed point theorem in the intuitionistic fuzzy metric space (직관적 퍼지거리공간에서 공통 부동점 정리)

  • Park Jong-Seo;Kim Seon-Yu;Kang Hong-Jae
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.05a
    • /
    • pp.71-74
    • /
    • 2006
  • The purpose of this paper is to establish the common fixed point theorem in the intuitionistic fuzzy metric space in which it is a little revised in Park [11]. Our research are an extension of Jungck's common fixed point theorem [8] in the intuitionistic fuzzy metric space.

  • PDF

Development of Spectrometer with 1 GFLOPs Digital Signal Processors

  • 김휴정;정민영;김치영;고광혁;이상철;이흥규;안창범
    • Proceedings of the KSMRM Conference
    • /
    • 2001.11a
    • /
    • pp.178-178
    • /
    • 2001
  • 목적: 본 연구에서는 초당 $10^{9}$ 부동점 연산이 가능한 Texas Instrument사의 TMS320C6701 DSP를 이용하여 연속적으로 변하는 경사자계를 real-time으로 계산하여 후, 4 채널의 phase array 코일을 이용하여 영상을 얻은 후 빠른 재구성을 통하여 영상을 확인할 수 있는 spectrometer를 개발하였다. 대상 및 방법: 실시간 구현을 위하여 DSP 보드에 Texas Instruments(Tl)사의 TMS320C6701을 장착하였다. Transmitter, receiver, 그리고 gradient를 담당하는 DSP 보드들과 이들과 연결되어 rf modulation, gradient waveform을 만드는 analog board와 phased array coil을 위한 4 채널까지 측정이 가능한 receiver board로 구성하였다. Gradient 보드의 경우 각 경사자계의 채널(Gx, Gy, Gz)의 sampling points를 real-time으로 각각 계산함으로써 blipped-EPI 뿐만 아니라, 경사자계 파형이 연속적으로 변화하는 spiral-EPI의 실험도 가능하게 하였다.

  • PDF

Real-Time Implementation of the EHSX Speech Coder Using a Floating Point DSP (부동 소수점 DSP를 이용한 4kbps EHSX 음성 부호화기의 실시간 구현)

  • 이인성;박동원;김정호
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.5
    • /
    • pp.420-427
    • /
    • 2004
  • This paper presents real time implementation of 4kbps EHSX (Enhanced Harmonic Stochastic Excitation) speech coder that combines the harmonic vector excitation coding with time-separated transition coding. The harmonic vector excitation coding uses the harmonic excitation coding for voiced frames and used the vector excitation coding with the structure of analysis-by-synthesis for unvoiced frames, respectively. For transition frames mixed with voiced and unvoiced signal, we use the time-separated transition coding. In this paper. we present the optimization methods of implementation speech coder on the EMS320C6701/sup (R)/ DSP. To reduce the complex for real-time implementation. we perform the optimization method in algorithm by replacing the complex sinusoidal synthesis method with IFFT. and we apply fully pipelines hand assembly coding after converting it from floating source to fixed source. To generate a more efficient code. we also make use or the available EMS320C6701/sup (R)/ resources such as Fastest67x library and memory organization.

Fixed-point Implementation of LPD Decoder in MPEG-D USAC (MPEG-D USAC : LPD 복호화기의 고정 소수점 알고리즘 구현)

  • Song, Eunwoo;Song, Jeongook;Kang, Hong-Goo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2012.07a
    • /
    • pp.254-256
    • /
    • 2012
  • 본 논문에서는 MPEG-D 오디오 서브그룹에서 진행 중인 Unified Speech and Audio Coding (USAC) 표준의 Linear Prediction Domain (LPD) 복호화기 모듈을 고정소수점 알고리즘으로 제안한다. USAC 부호화기는 두 개의 최신 음성-오디오 부호화기가 융합된 형태로, 음성 및 오디오 신호에 대하여 우수한 성능을 갖는 부호화기이다. USAC의 표준 완료와 본격적인 서비스화에 앞서서 USAC LPD 복호화기의 구조적인 특성을 분석하고, Digital Signal Processor (DSP)구현을 위한 LPD 복호화기의 고정소수점 알고리즘을 구축하는 동시에 모듈의 복잡도를 측정하고자 한다. 또한 고정소수점 알고리즘으로 구현된 LPD 복호화기와 기존의 부동소수점 복호화기의 성능을 비교하고, LPD 복호화기의 두 가지 부호화 모드에 따른 복잡도 이슈를 다루도록 한다.

  • PDF

Optimization of Gaussian Mixture Computation of ASR on DSP 67x (DSP 67x 기반 음성인식 시스템의 가우시안 확률 계산 최적화 구현)

  • Choi Taeil;Kim Taeyun;Ko Hanseok
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.53-56
    • /
    • 2004
  • 본 논문은 HMM 기반 임베디드 음성인식 시스템 구현에 관한 몇 가지 주제들을 설명한다. 임베디드 환경은 한정된 자원을 가지고 있고 그러한 가운데 타당한 인식률과 향상된 인식 속도를 얻기 위해서 몇가지 방법들을 이 논문에서 설명한다. 구현 환경은 DSP6711 기반에서 이루어졌다. 가우시안 mixture 계산 루틴을 부동소수점 연산에서 고정소수점 연산 및 software pipelining을 적용하였다. 고정소수점 변환 전과 후 비슷한 인식률을 얻었고 고정소수점 변환과 software pipelining 적용 후 연산 속도의 향상을 얻었다.

  • PDF

The Design of a Structure of Network Co-processor for SDR(Software Defined Radio) (SDR(Software Defined Radio)에 적합한 네트워크 코프로세서 구조의 설계)

  • Kim, Hyun-Pil;Jeong, Ha-Young;Ham, Dong-Hyeon;Lee, Yong-Surk
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.32 no.2A
    • /
    • pp.188-194
    • /
    • 2007
  • In order to become ubiquitous world, the compatibility of wireless machines has become the significant characteristic of a communication terminal. Thus, SDR is the most necessary technology and standard. However, among the environment which has different communication protocol, it's difficult to make a terminal with only hardware using ASIC or SoC. This paper suggests the processor that can accelerate several communication protocol. It can be connected with main-processor, and it is specialized PHY layer of network The C-program that is modeled with the wireless protocol IEEE802.11a and IEEE802.11b which are based on widely used modulation way; OFDM and CDM is compiled with ARM cross compiler and done simulation and profiling with Simplescalar-Arm version. The result of profiling, most operations were Viterbi operations and complex floating point operations. According to this result we suggested a co-processor which can accelerate Viterbi operations and complex floating point operations and added instructions. These instructions are simulated with Simplescalar-Arm version. The result of this simulation, comparing with computing only one ARM core, the operations of Viterbi improved as fast as 4.5 times. And the operations of complex floating point improved as fast as twice. The operations of IEEE802.11a are 3 times faster, and the operations of IEEE802.11b are 1.5 times faster.

Floating Point Unit Design for the IEEE754-2008 (IEEE754-2008을 위한 고속 부동소수점 연산기 설계)

  • Hwang, Jin-Ha;Kim, Hyun-Pil;Park, Sang-Su;Lee, Yong-Surk
    • Journal of the Institute of Electronics Engineers of Korea SD
    • /
    • v.48 no.10
    • /
    • pp.82-90
    • /
    • 2011
  • Because of the development of Smart phone devices, the demands of high performance FPU(Floating-point Unit) becomes increasing. Therefore, we propose the high-speed single-/double-precision FPU design that includes an elementary add/sub unit and improved multiplier and compare and convert units. The most commonly used add/sub unit is optimized by the parallel rounding unit. The matrix operation is used in complex calculation something like a graphic calculation. We designed the Multiply-Add Fused(MAF) instead of multiplier to calculate the matrix more quickly. The branch instruction that is decided by the compare operation is very frequently used in various programs. We bypassed the result of the compare operation before all the pipeline processes ended to decrease the total execution time. And we included additional convert operations that are added in IEEE754-2008 standard. To verify our RTL designs, we chose four hundred thousand test vectors by weighted random method and simulated each unit. The FPU that was synthesized by Samsung's 45-nm low-power process satisfied the 600-MHz operation frequency. And we confirm a reduction in area by comparing the improved FPU with the existing FPU.

Fingerprint Matching Algorithm using the String-Based MHC Detector Set (스트링기반 MHC 인식부 구성에 의한 지문 매칭 알고리즘)

  • 정재원;이동욱;심귀보;이민영
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2004.04a
    • /
    • pp.206-209
    • /
    • 2004
  • 사람의 지문은 그 인식성능과 종생불변성 및 만인부동성으로 인하여 신원인증을 위한 생채인식에서 가장 많이 이용되고 있다. 최근에는 지문인식의 신뢰성에 더하여, 그 인증속도가 지문인식을 각종 보안 어플리케이션에 응용하는데 있어서 매우 중요한 요소로 부각되고 있다. 본 논문에서는 생체면역계에서의 '자기-비자기' 구별과정에 착안한 빠르고 신뢰성 있는 지문인식 알고리즘을 제안한다. 제안한 매칭알고리즘은 지문영상으로부터 추출된 특징점과 방향성분에 기반하여 만들어지는 자기공간(self-space)에 기반하여 이루어지는 1차 매칭과, 특징점의 기하학적 구조에 의하여 구성되는 로컬구조(local structure)에 의하여 구성되는 로컬구조에 의해 수행되는 2차 매칭의 두 단계로 구성되어 인식의 신뢰성을 유지하면서 인증속도를 향상시켰다.

  • PDF