• Title/Summary/Keyword: Recursive gradient

Search Result 36, Processing Time 0.042 seconds

A MULTILEVEL BLOCK INCOMPLETE CHOLESKY PRECONDITIONER FOR SOLVING NORMAL EQUATIONS IN LINEAR LEAST SQUARES PROBLEMS

  • Jun, Zhang;Tong, Xiao
    • Journal of applied mathematics & informatics
    • /
    • v.11 no.1_2
    • /
    • pp.59-80
    • /
    • 2003
  • An incomplete factorization method for preconditioning symmetric positive definite matrices is introduced to solve normal equations. The normal equations are form to solve linear least squares problems. The procedure is based on a block incomplete Cholesky factorization and a multilevel recursive strategy with an approximate Schur complement matrix formed implicitly. A diagonal perturbation strategy is implemented to enhance factorization robustness. The factors obtained are used as a preconditioner for the conjugate gradient method. Numerical experiments are used to show the robustness and efficiency of this preconditioning technique, and to compare it with two other preconditioners.

Tunnel Ventilation Controller Design Employing RLS-Based Natural Actor-Critic Algorithm (RLS 기반의 Natural Actor-Critic 알고리즘을 이용한 터널 환기제어기 설계)

  • Chu B.;Kim D.;Hong D.;Park J.;Chung J.T.;Kim T.H.
    • Proceedings of the Korean Society of Precision Engineering Conference
    • /
    • 2006.05a
    • /
    • pp.53-54
    • /
    • 2006
  • The main purpose of tunnel ventilation system is to maintain CO pollutant and VI (visibility index) under an adequate level to provide drivers with safe driving condition. Moreover, it is necessary to minimize power consumption used to operate ventilation system. To achieve the objectives, the control algorithm used in this research is reinforcement teaming (RL) method. RL is a goal-directed teaming of a mapping from situations to actions. The goal of RL is to maximize a reward which is an evaluative feedback from the environment. Constructing the reward of the tunnel ventilation system, two objectives listed above are included. RL algorithm based on actor-critic architecture and natural gradient method is adopted to the system. Also, the recursive least-squares (RLS) is employed to the learning process to improve the efficiency of the use of data. The simulation results performed with real data collected from existing tunnel are provided in this paper. It is confirmed that with the suggested controller, the pollutant level inside the tunnel was well maintained under allowable limit and the performance of energy consumption was improved compared to conventional control scheme.

  • PDF

A New Gradient Estimation of Euclidean Distance between Error Distributions (오차확률분포 사이 유클리드 거리의 새로운 기울기 추정법)

  • Kim, Namyong
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.51 no.8
    • /
    • pp.126-135
    • /
    • 2014
  • The Euclidean distance between error probability density functions (EDEP) has been used as a performance criterion for supervised adaptive signal processing in impulsive noise environments. One of the drawbacks of the EDEP algorithm is a heavy computational complexity due to the double summation operations at each iteration time. In this paper, a recursive method to reduce its computational burden in the estimation of the EDEP and its gradient is proposed. For the data block size N, the computational complexity for the estimation of the EDEP and its gradient can be reduced to O(N) by the proposed method, while the conventional estimation method has $O(N^2)$. In the performance test, the proposed EDEP and its gradient estimation yield the same estimation results in the steady state as the conventional block-processing method. The simulation results indicates that the proposed method can be effective in practical adaptive signal processing.

A Study on the Recursive Identification of Modal Parameters (회귀적 방법에 의한 모우드 변수 규명에 관한 연구)

  • 고장욱;이재응
    • Proceedings of the Korean Society for Noise and Vibration Engineering Conference
    • /
    • 1995.04a
    • /
    • pp.147-152
    • /
    • 1995
  • 실험에 의한 모우드 해석 방법들은 1980년대부터 활발히 연구되어 많은 새로운 방법들이 개발되어 발표되었다. 그러나 개발된 대부분의 방법들은 측정된 데이타를 일괄처리하는 밸치(또는 off-line) 방법들이다. 최근에는 시간에 따라서 변하는 구조물의 동특성을 규명하는 분야에 모우드 해석 방법이 응용되어 사용되고 있다. 이러한 응용분야에서는 모우드 변수들의 변화되는 값을 새로운 데이타가 샘플링 될 때마다 그 값들을 수정하면서 추정할 수 있는 회귀적인(recursive 또는 on-line) 방법을 사용하여야 한다. Davies와 Hammond[1]는 회귀적 선형 자승법(Recursive Least Squares : RLS)을 이용하여 모우드 변수를 구하고 이를 벧치방법인 Instrumental Variable 방법과 Fourier 방법의 결과와 비교하였다. 그러나, 그 결과에서 보여준것처럼 RLS 방법은 잡음 대 시호비가 낮을 때에만 모우드 변수 값들을 정확하게 추정할 수 있었다. Sundararajan과 Montgomrey[2]는 회귀적 선형 최소자승 격자필터(lattice filter)를 이용하여 구조물의 차수(order)와 고유진동형, 그리고 진폭을 결정한 후 이를 토대로 회귀적 gradient형태의 방정식 오차 규명 방법(equation-error identification algorithm)에 의하여 모우드 변수들을 추정하였다. 이 방법은 2차원 격자구조물의 모우드 변수 추정에 사용되었으며, 또한 적응모우드제어에도 성공적으로 이용되었다. 그러나, 이 방법도 잡음 대 신호비가 낮은 환경에서만 사용할 수 있다는 단점이 있다. 위에서 언급한 방법들은 모두 RLS 방법을 기초로 하여 개발되었으나, RLS 방법은 전형적인 결정적(deterministic)방법으로서 잡음이 섞인 데이타를 처리하기에는 부적절한 방법임이 널리 알려진 사실이다[3]. 최근에 Ben Mrad와 Fassois[4]는 신호에 잡음이 존재하여도 이를 잘 처리할 수 있는 확률적(stochastic) 방법을 개발하여 기존의 결정적 방법들과 그 결과를 비교하였다. 그러나, 개발된 방법은 응답 신호에 백색잡음(white noise)이 섞이는 특수한 경우에만 사용할 수 있게 만들어져서 이 방법의 실질적인 적용에는 어려움이 있다. 본 연구에서는 기존의 방법들의 단점을 극복할 수 있는 새로운 회귀적 모우드 변수 규명 방법을 개발하였다. 이는 Fassois와 Lee가 ARMAX모델의 계수를 효율적으로 추정하기 위하여 개발한 뱉치방법인 Suboptimum Maximum Likelihood 방법[5]를 기초로 하여 개발하였다. 개발된 방법의 장점은 응답 신호에 유색잡음이 존재하여도 모우드 변수들을 항상 정확하게 구할 수 있으며, 또한 알고리즘의 안정성이 보장된 것이다.

  • PDF

Performance Comparison of Crawling Robots Trained by Reinforcement Learning Methods (강화학습에 의해 학습된 기는 로봇의 성능 비교)

  • Park, Ju-Yeong;Jeong, Gyu-Baek;Mun, Yeong-Jun
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.04a
    • /
    • pp.33-36
    • /
    • 2007
  • 최근에 인공지능 분야에서는, 국내외적으로 강화학습(reinforcement learning)에 관한 관심이 크게 증폭되고 있다. 강화학습의 최근 경향을 살펴보면, 크게 가치함수를 직접 활용하는 방법(value function-based methods), 제어 전략에 대한 탐색을 활용하는 방법(policy search methods), 그리고 액터-크리틱 방법(actor-critic methods)의 세가지 방향으로 발전하고 있음을 알 수 있다. 본 논문에서는 이중 세 번째 부류인 액터-크리틱 방법 중 NAC(natural actor-critic) 기법의 한 종류인 RLS-NAC(recursive least-squares based natural actor-critic) 알고리즘을 다양한 트레이스 감쇠계수를 사용하여 연속제어입력(real-valued control inputs)으로 제어되는 Kimura의 기는 로봇에 대해 적용해보고, 그 성능을 기존의 SGA(stochastic gradient ascent) 알고리즘을 이용하여 학습한 경우와 비교해보도록 한다.

  • PDF

Self-Organizing Fuzzy Modeling using Creation of Clusters (클러스터 생성을 이용한 자기구성 퍼지 모델링)

  • 고택범
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.05a
    • /
    • pp.245-251
    • /
    • 2002
  • 본 논문에서는 상대적으로 큰 퍼지 엔트로피를 갖는 입력-출력 데이터 집단에 다중 회귀 분석을 적용하여 다차원 평면 클러스터를 생성하고, 이 클러스터를 새로운 퍼지 모델의 규칙으로 추가한 후 퍼지 모델 파라미터의 개략 동조와 정밀 동조를 수행하는 자기구성 퍼지 모델링을 제안한다. Weighted recursive least squared 알고리즘과 fuzzy C-regression model 클러스터링에 의해 퍼지 모델의 파라미터를 개략적으로 동조한 후 gradient descent 알고리즘에 의해 파라미터를 정밀 동조하면서 감수분열 유전 알고리즘을 이용하여 최적의 학습률을 탐색한다. 그리고 자기 구성 퍼지 모델링 기법을 이용하여 Box-Jenkins의 가스로 데이터, 다변수비선형 정적 함수의 데이터와 하수 처리 활성오니 공정의 모델링을 수행하고, 기존의 방법에 의한 모델링 결과와 비교하여 그 성능을 입증한다.

  • PDF

Trading Strategy Using RLS-Based Natural Actor-Critic algorithm (RLS기반 Natural Actor-Critic 알고리즘을 이용한 트레이딩 전략)

  • Kang Daesung;Kim Jongho;Park Jooyoung;Park Kyung-Wook
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.11a
    • /
    • pp.238-241
    • /
    • 2005
  • 최근 컴퓨터를 이용하여 효과적인 트레이드를 하려는 투자자들이 늘고 있다. 본 논문에서는 많은 인공지능 방법론 중에서 강화학습(reinforcement learning)을 이용하여 효과적으로 트레이딩하는 방법에 대해서 다루려한다. 특히 강화학습 중에서 natural policy gradient를 이용하여 actor의 파라미터를 업데이트하고, value function을 효과적으로 추정하기 위해 RLS(recursive least-squares) 기법으로 critic 부분을 업데이트하는 RLS 기반 natural actor-critic 알고리즘을 이용하여 트레이딩을 수행하는 전략에 대한 가능성을 살펴 보기로 한다.

  • PDF

The Design of Fuzzy-Neural Networks using FCM Algorithms (FCM 알고리즘을 이용한 퍼지-뉴럴 네트워크 설계)

  • Yoon, Ki-Chan;Park, Byoung-Jun;Oh, Sung-Kwun;Lee, Sung-Hwan
    • Proceedings of the KIEE Conference
    • /
    • 2000.11d
    • /
    • pp.803-805
    • /
    • 2000
  • In this paper, we propose fuzzy-neural Networks(FNN) which is useful for identification algorithms. The proposed FNN model consists of two steps: the first step, which determines premise and consequent parameters approximately using FCM_RI method, the second step, which adjusts the premise and consequent parameters more precisely by gradient descent algorithm. The FCM_RI algorithm consists FCM clustering algorithm and Recursive least squared(RLS) method, this divides the input space more efficiently than convention methods by taking into consideration correlations between components of sample data. To evaluate the performance of the proposed FNN model, we use the time series data for gas furnace.

  • PDF

Comparison of Different Schemes for Speed Sensorless Control of Induction Motor Drives by Neural Network (유도전동기의 속도 센서리스 제어를 위한 신경회로망 알고리즘의 추정 특성 비교)

  • 이경훈;국윤상;김윤호;최원범
    • Proceedings of the KIPE Conference
    • /
    • 1999.07a
    • /
    • pp.526-530
    • /
    • 1999
  • This paper presents a newly developed speed sensorless drive using Neural Network algorithm. Neural Network algorithm can be divided into three categories. In the first one, a Back Propagation-based NN algorithm is well-known to gradient descent method. In the second scheme, a Extended Kalman Filter-based NN algorithm has just the time varying learning rate. In the last scheme, a Recursive Least Square-based NN algorithm is faster and more stable than the classical back-propagation algorithm for training multilayer perceptrons. The number of iterations required to converge and the mean-squared error between the desired and actual outputs is compared with respect to each method. The theoretical analysis and experimental results are discussed.

  • PDF

Implementation of Speed-Sensorless Induction Motor Drives with RLS Algorithm (RLS 알로리즘을 이용한 유도전동기의 속도 센서리스 운전)

  • 김윤호;국윤상
    • Proceedings of the KIPE Conference
    • /
    • 1998.07a
    • /
    • pp.384-387
    • /
    • 1998
  • This paper presents a newly developed speed sensorless drive using RLS(Recursive Least Squares) based on Neural Network Training Algorithm. The proposed algorithm based on the RLS has just the time-varying learning rate, while the well-known back-propagation (or generalized delta rule) algorithm based on gradient descent has a constant learning rate. The number of iterations required by the new algorithm to converge is less than that of the back-propagation algorithm. The RLS based on NN is used to adjust the motor speed so that the neural model output follows the desired trajectory. This mechanism forces the estimated speed to follow precisely the actual motor speed. In this paper, a flux estimation strategy using filter concept is discussed. The theoretical analysis and experimental results to verify the effectiveness of the proposed analysis and the proposed control strategy are described.

  • PDF