Performance Improvement of Genetic Programming Based on Reinforcement Learning

강화학습에 의한 유전자 프로그래밍의 성능 개선

  • 전효병 (중앙대학교 전자전기공학부) ;
  • 이동욱 (중앙대학교 전자전기공학부) ;
  • 심귀보 (중앙대학교 전자전기공학부)
  • Published : 1998.06.01

Abstract

This paper proposes a reinforcement genetic programming based on the reinforcement learning method for the performance improvement of genetic programming. Genetic programming which has tree structure program has much flexibility of problem expression because it has no limitation in the size of chromosome compared to the other evolutionary algorithms. But worse results on the point of convergence associated with mutation and crossover operations are often due to this characteristic. Therefore the sizes of population and maximum generation are typically larger than those of the other evolutionary algorithms. This paper proposes a new method that executes crossover and mutation operations based on reinforcement and inhibition mechanism of reinforcement learning. The validity of the proposed method is evaluated by appling it to the artificial ant problem.

본 논문에서는 유전자 프로그래밍의 성능을 향상시키기 위하여 강화학습법에 기반한 강화 유전자 프로그래밍을 제안한다. 트리구조와 프로그램을 염색체로 가지는 유전자 프로그래밍(GP)은 다른 진화 알고리즘에 비해 염색체의 크기에 제한이 없기 때문에 표현력에 융통성이 많다는 장점이 있다. 그러나 이러한 특징은 반대고 교차 및 돌연변이 연산에 있어서 수렴성을 떨어뜨리는 단점을 나타낸다. 따라서 유전자 프로그래밍은 다른 진화알고리즘에 비해 개체군의 크기 및 진화 세대수를 크게 잡는 것이 일반적이다. 본 논문에서는 유전자 프로그래밍의 이러한 성질을 개선하기 위해서 프로그램에 강화신호를 주어 이것의 보답/벌칙의 정도에 기반한 교차 및 돌연번이 연산을 실행하는 방법을 제안한다. 제안된 방법은 인공개미(Artificial Ant)문제에 적용하여 그 유효성을 입증한다.

Keywords

References

  1. Artificial Life Ⅱ C.Langton;C.Taylor;J.Farmer;S.Rasmussen
  2. 人工生命の方法 上田完次;下原勝憲;伊庭濟志
  3. 대한전자공학회지 v.22 no.11 유전 알고리즘의 이론 및 응용 장병탁
  4. Genetic Programming:On the Programming of Computers by Means of Natural Selection John R.Koza
  5. Genetic Programming Ⅱ:Automatic Discovery of Reuseble Programs John R.Koza
  6. Alternatives in Automatic Function Definition:A Comparison of Performance in Advances in Genetic Programming Kenneth E.;Kinnear,Jr.
  7. Proc.of The First IEEE Int.Conf.on Evolutionary Computation v.1 Context Preserving Crossover in Genetic Programming P.D'haeseleer
  8. Proc.of The First IEEE Int.Conf.on Evolutionary Computation v.1 Experiments with a Coroutine Execution Model for Genetic Programming Sidney R.Maxwell Ⅲ
  9. 제11회 한국자동제어학술회의 논문집 v.2 유전 프로그래밍에 의한 자율이동 로봇군의 협조행동 및 제어 이동욱;심귀보
  10. Proc.of 2nd Asian Control Conference v.2 Cooperative Behavior and Control of Collective Autonomous Mobile Robots using Genetic Programming H.B.Jun;D.W.Lee;K.B.Sim
  11. Machine Learning v.8 Learning to Predict by the Methods of Temporal Differences R.S.Sutton
  12. Machine Learning v.8 Technical Note:Q-Learning C.J.C.H Watkins;P.Dayan
  13. Neuro-Fuzzy and Soft Computing J.S.R.Jang;C.T.Sun;E.Mizutani
  14. Proc.of 6th IEEE International workshop on Ro-MAN Behavior Learning and Evolu-tion of Collective Autonomous Mobile Robots based on Reinforcement Learning and Distributed Genetic Algorithm H.B.Jun;K.B.Sim
  15. 한국정보과학회 가을학술발표 논문집(Ⅱ) 강화학습에 의한 유전자 프로그래밍의 성능개선 이동욱;전효병;이준섭;심기보
  16. Proc.of SICE Annual Conf.(Japan,International Session) Fuzzy Inference Based Reinforcement Learning of Recurrent Neural Networks H.B.Jun;D.W.Lee;D.J.Kim;K.B.Sim