• 제목/요약/키워드: 적응 학습 제어

검색결과 169건 처리시간 0.024초

운반차-막대 시스템을 위한 적응비평학습에 의한 CMAC 제어계 (CMAC Controller with Adaptive Critic Learning for Cart-Pole System)

  • 권성규
    • 한국지능시스템학회논문지
    • /
    • 제10권5호
    • /
    • pp.466-477
    • /
    • 2000
  • 이 논문에서는 운반차-막대 시스템을 제어하기 위한 CMAC을 이용한 적응 학습 제어계를 개발하기 위하여, 적응비평학습을 이용하는 신경망 제어계에 관한 여러 연구 문헌들을 조사하고, ASE 요소를 이용하는 적응비평학습 기법을 CMAC을 바탕으로 하는 제어계에 통합하였다. 적응비평학습 기법을 CMAC에 구현하는데 있어서의 변환 문제를 검토하고, CMAC 제어계와 ASE 제어계가 운반차-막대 문제를 학습하는 속도를 비교하여, CMAC 제어계의 학습 속도가 빠르기는 하지만, 입력 공간의 더 넓은 영역에 대해서는 학습효과를 발휘하지 못하는 문제의 관점에서 적응비평학습 방법이 CMAC의 특성과 어울리는지를 고찰하였다.

  • PDF

多入力 시스템의 자율학습제어를 위한 차등책임 적응비평학습 (Differentially Responsible Adaptive Critic Learning ( DRACL ) for the Self-Learning Control of Multiple-Input System)

  • 김형석
    • 전자공학회논문지S
    • /
    • 제36S권2호
    • /
    • pp.28-37
    • /
    • 1999
  • 재 강화 학습 방법을 다수의 제어입력을 가진 시스템에 대한 자율적 제어 기법 습득에 활용하기 위해서 차등책임 적응비평 학습구조를 제안하였다. 재 강화 학습은 여러 단계의 제어동작 끝에 얻어지는 최종 비평값을 활용하여 그 전에 행해졌던 제어 동작을 강화 혹은 약화 학습하는 자율적 학습방법이다. 대표적인 재강화학습 방법은 적응비평학습 구조를 이용하는 방법인데 비평모듈과 동작모듈을 이용하여 외부 비평 값을 최대로 활용함으로써 학습효과를 극대화시키는 방법이다. 이 학습방법에서는 단일한 제어입력을 갖는 시스템으로만 적용이 제한된다는 단점이 있다. 제안한 차등책임 적응비평 학습 구조에서는 비평함수를 제어 입력 인자의 함수로 구축한 다음 제어인자에 대한 차별 화된 비평 값을 부분미분을 통하여 산출함으로써 다수의 제어입력을 가진 시스템의 제어기술 학습이 가능하게 하였다. 제안한 학습제어 구조는 학습속도가 빠른 CMAC 신경회로망을 이용하여 구축하였으며 2개의 제어입력을 갖는 2-D Cart-Pole 시스템과 3 개의 제어입력을 갖는 인간구조 로봇시스템의 앉는 동작의 학습제어 시뮬레이션을 통하여 효용성을 확인하였다.

  • PDF

라마키안 상호 적응에 의한 뉴로-퍼지 제어기의 최적 설계 (An Optimal Design of Neuro-Fuzzy Logic Controller Using Lamarckian Co-adaptation)

  • 이한별;김대진
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 추계학술대회 학술발표 논문집
    • /
    • pp.384-389
    • /
    • 1998
  • 본 논문은 특정 응용에 적합한 퍼지 제어기의 최적 설계 파라메터(퍼지 규칙과 소속 함수)를 찾는데 역전파 학습 과정과 유전 알고리즘을 결합한 Lamarckian 상호적응 기법을 이용한 뉴로-퍼지 제어기의 새로운 설계 방법을 제안한다. 설계 파라메타들은 진화에 의한 전역적 탐색을 통해 높은 포함값과 유용한 퍼지 규칙들을 갖는 규칙 베이스와 작은 근사화 오차와 좋은 제어 성능을 갖는 소속 함수들을 얻도록 제어기간 파라메타 조절을 수행하며, 학습에 의한 국부적 탐색을 통해 각 퍼지 제어기가 원하는 제어 결과를 나타내도록 제어기내 파라메타 조절을 수행한다. 제안한 상호적응 설계 방법은 유전 알고리즘의 모든 세대에서 역전파 학습이 이루어지므로 보다 좋은 근사화 능력을 나타나고, 사용한 무게 중심 비퍼지화기가 정확한 비퍼지화값을 계산하므로 보다 좋은 제어 성능을 가지며, 퍼지 규칙 베이스와 소속 함수들의 최적화 탐색 과정이 입출력 공간의 같은 퍼지 분할 상에서 통합된 적응 함수에 의하여 동시에 수행되므로 탐색을 위한 작업 공간이 아주 작아지는 장점이 있다. 시뮬레이션 결과는 Lamarckian 상호 적응에 의해 얻어진 FLC가 퍼지 규\ulcorner 수, 근사화 능력, 제어 성능등 모든면에서 다른 방법에 의해 얻어진 FLC보다 가장 우수함을 보여준다.

  • PDF

학습/적응력을 갖는 퍼지제어시스템들에 관한 고찰 (A Survey on the Fuzzy Control Systems with Learning/Adaptation Capability)

  • 김용태;이연정;이승하;정태신;변증남
    • 한국지능시스템학회논문지
    • /
    • 제5권3호
    • /
    • pp.11-35
    • /
    • 1995
  • 본 논문에서는 학습/적응능력을 갖는 퍼지제어시스템들이 여러가지 관점에서 고찰되었다. 먼저, 기존에 제안된 다양한 학습/적응 퍼지제어시스템들의 기본적인 구성요소들을 바탕으로하여 이러한 시스템들의 일반적인 구조를 제안하였다. 그리고 제안된 구조의 중요한 구성요소들을 중심으로 고찰기준을 설정하였다. 고찰기준으로는 퍼지제어기나 퍼지모델 등에 사용되는 퍼지추론시스템의 구조, 학습/적응에 사용되는 퍼지추론시스템의 조정계수와 제어성능 평가함수, 그리고 학습/적응알고리즘을 설정하였다. 다음으로, 이러한 고찰기준들을 바탕으로하여 학습/적응 퍼지제어시스템들을 분류하고 각각의 특징들을 고찰하였다. 마지막으로, 사용된 퍼지추론시스템들의 범용 함수근사화 성질에 대하여도 알아 보았다.

  • PDF

이산시간 파라미터 적응형 학습제어 시스템에 관한 연구 (A Study on the Discrete Time Parameter Adaptive Learning Control System)

  • 최순철;양해원
    • 한국통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.352-359
    • /
    • 1988
  • 학습제어 시스템은 제어대상 시스템의 파라미터를 모르는 경우에 파라미터 적응의 개념을 도입해서, 일종의 hybrid형 적응제어 시스템으로 간주하여 설계될 수 있다. 이러한 파라미터 적응형 학습제어 시스템은 이미 보고되었으나 연속시간 시스템에만 적용될 수 있었다. 본 논문에서는 메모리소자를 반드시 포함하여야 하는 학습시스템에 대하여, 위의 제어알고리즘을 이산화 함으로써 디지탈기술의 발전에 비추어 실제의 적용을 용이하도록 하였으며, 그 타당성을 시뮬레이션으 통하여 확인하였다.

  • PDF

뉴로제어 및 반복학습제어 기법을 결합한 미지 비선형시스템의 적응학습제어 (Adaptive Learning Control fo rUnknown Monlinear Systems by Combining Neuro Control and Iterative Learning Control)

  • 최진영;박현주
    • 한국지능시스템학회논문지
    • /
    • 제8권3호
    • /
    • pp.9-15
    • /
    • 1998
  • 본 논문은 뉴로제어 및 반복학습 제어기법에 기반한 미지의 비선형시스템의 적응학습제어 방법을 제안한다. 제안된 제어 시스템에서 반복학습제어기는 새로운 기준 궤적에 대해 시스템의 출력이 원하는 궤적으로 정확히 수렴하도록 하는 적응과 단기간 제어정보를 기억하는 기능을 수행한다. 상대차수만 알고 있는 미지 시스템에 대한 박복학습 법칙이 학습이득은 신경회로망을 이용하여 추정된다. 반복학습제어기에 의해 습득된 제어정보는 장기메모리에 기반한 앞먹임 뉴로제어기로 이전되어 누적기억됨으로써 과거에 겸험된 기준 궤적에 대해서는 신속하게 추종할 수 있도록 한다. 2자유도 매니퓰레이터에 적용하여 제안된 기법의 타당성을 검증한다.

  • PDF

세포성 면역 반응과 경사감소학습에 의한 비선형 적응 PID 제어기 (Nonlinear Adaptive PID Controller based on a Cell-mediated Immune Response and a Gradient Descent Learning)

  • 박진현;이태환;최영규
    • 한국정보통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.88-95
    • /
    • 2006
  • PID 제어기는 구조가 간단하고 적용이 용이하다는 장점으로 인하여 널리 사용되고 있는 제어방식이다. 이러한 선형 PID 제어기는 시스템의 파라메터가 변화가 있거나 부하 특성이 비 선형적으로 변화할 때에 적절한 이득과 성능을 얻기 어려워 고성능 제어 특성을 기대하기 어렵다. 본 연구에서는 세포성 면역 반응과 경사감소학습에 기초하여 비선형 PID 제어기를 설계하고, 설계된 제어기의이득과 비선형 함수의 파라메터들을 실시간 적응적으로 학습할 수 있는 학습 알고리즘을 개발하고, 이를 제어시스템에 적용하였다. 제안된 비선형 PID 제어기는 비선형 직류 모터 시스템의 파라메터들이 변화하거나 주파수가 다른 추종 명령에 대하여, 적응적으로 이득을 변화 시키며 추종함을 보였다.

6축다관절 로봇 동력분산학습제어

  • 이수철
    • 한국산업정보학회논문지
    • /
    • 제3권1호
    • /
    • pp.183-191
    • /
    • 1998
  • 다양한 산업분야의 생산공장에서 주로 활용되고 있는 6축 수직다관절로보트는 대부분 단순반복운동을 하고 있다. 단순반복중 point-to-point제어보다 품질을 요하는 tracking-to-trajectory 제어를 위한 분산학습제어에 대하여 연구하고자 한다. 관련 학습제어기법으로는 선형누적형기법과 간접적응기법이 있다. 두기법의 차이는 시스템 정보의 유무이며, 시스템의 주어진 상황에 따라 두 기법중 하나를 선택할 수 있다. 간접적응형 기법은 zero tracking error를 보장받기 위해서 보다 많은 반복을 요하는 경비를 부담하여야 한다.

6축다관절 로봇 동력분산학습제어

  • 이수철
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1998년도 춘계공동학술대회 발표논문집 IMF시대의정보화 추진전략
    • /
    • pp.125-128
    • /
    • 1998
  • 다양한 산업분야의 생산공장에서 주로 활용되고 있는 6축 수직다관절보트은 대부분 단순반복운동을 하고 있다. 단순반복중 point-to-point제어보다 품질을 요하는 tracking -to-trajectory제어를 위한 분산학습제어에 대하여 연구하고자 한다. 관련 학습제어기법으로는 선형누적기법과 간접적응기법이 있다. 두 기법의 차이는 시스템의 정보의 유무이며 시스템의 주어진상황에 따라 두 기법중 하나를 선택할 수 있다. 간접적응형 기법은 zero tracking error를 보장받기 위해서 보다 많은 반복을 요하는 경비를 부담하여야 한다.

비선형 시스템에 대한 강인성 적응 학습 제어기의 개발 (Development of Robust Adaptive Learning Control for Nonlinear System)

  • 유영순;하환수
    • 대한기계학회논문집A
    • /
    • 제25권12호
    • /
    • pp.1895-1902
    • /
    • 2001
  • This paper gives an overview of the relationships between methods of loaming and adaptive control. It is the objective of this paper to develop adaptive learning control algorithms that combine the advantages of adaptive control with those of leaning control to the extent possible for the type of system model used. The robustness of this adaptive loaming control with respect to reinitialization errors and fluctuation of dynamics from disturbance is analyzed extensively. Simulation results have shown to verify the effectiveness of the proposed control algorithm.