• 제목/요약/키워드: 근사적 동적계획법

검색결과 3건 처리시간 0.015초

주행문제를 위한 최신 근사적 동적계획법의 적용 (Application of Recent Approximate Dynamic Programming Methods for Navigation Problems)

  • 민대홍;정근우;권기영;박주영
    • 한국지능시스템학회논문지
    • /
    • 제21권6호
    • /
    • pp.737-742
    • /
    • 2011
  • 주행문제는 불확실한 외란의 영향을 받는 이동로봇 등의 시스템에 대하여 각종 제약조건들을 만족하도록 하는 제어 입력을 결정하는 과제를 포함한다. 이러한 과제는 제약조건을 갖는 확률 제어 문제로 모델링될 수 있다. 이러한 종류의 제어문제를 풀기 위하여, 최적 가치함수 개념에 의존하는 동적 계획법의 활용을 시도해볼 수 있다. 하지만, 대부분의 실제 문제에서 이러한 시도는 많은 어려움, 예컨대, 시스템의 완벽한 모델이 알려지지 않거나, 최적 제어정책을 구하기 위한 계산이 불가능하거나, 수없이 많은 계산 자원을 필요로 하는 등의 문제점을 안겨줄 수 있다. 이러한 동적 계획법의 어려움을 극복하기 위한 전략으로, 근사적 가치함수에 의존하여 준최적 제어정책을 구하는 근사적 동적 계획법을 사용할 수 있다. 본 논문에서는 최근에 제시된 근사 동적 계획법들을 복잡한 제약조건을 갖는 주행 문제에 적용하여 보고 그 결과로 얻어지는 성능 특성을 관찰해 본다.

동적계획법을 이용한 철근가공용 소프트웨어의 구현 (An Implementation of Cutting-Ironbar Manufacturing Software using Dynamic Programming)

  • 김성훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권4호
    • /
    • pp.1-8
    • /
    • 2009
  • 이 논문에서는 철근 절단 작업의 계획 문제를 동적 계획법으로 해결하여 근사 최적의 절단 계획을 생성하도록 하는 소프트웨어의 구현을 다룬다. 일반적으로 실제 절단 작업에 요구되는 제약사항을 반영하여 최적의 자재 절단문제의 해를 얻는 알고리듬의 설계가 필요하다. 하지만, 이것은 다중 규격의 1차원 자재 절단 문제를 풀어야 하는 것으로, 최적의 해를 얻는 선형계획법은 폭발적인 계산량과 기억용량의 한계로 적용하기 어렵다. 이러한 한계를 해결하기 위하여, 동적계획법에 근거하며 자재 절단 문제를 재구성하고, 휴리스틱을 적용하여 유한 범위의 조합 열에서도 근사 최적의 해를 찾을 수 있는 탐색 기법을 사용한 자재 절단 계획 알고리듬을 제시하였다. 그리고, 자동화된 철근 가공 산업용 소프트웨어는 작업 환경에 맞게 사용이 편리한 그래픽 화면과 사용자 인터페이스가 요구되는데, 공개 소프트웨어를 활용한 GUI 라이브러리 툴킷인 GTK+를 활용하여 이를 구현하였다. 개발된 소프트웨어는 철근 가공의 현장 지식을 바탕으로 휴리스틱 지식을 획득하여 동적계획법에 적용시킨 것으로, 지역 전통 산업과 첨단 IT 산업이 접목된 융합 IT를 시도한 사례 연구이다.

데이터 기반 확률론적 최적제어와 근사적 추론 기반 강화 학습 방법론에 관한 고찰 (Investigations on data-driven stochastic optimal control and approximate-inference-based reinforcement learning methods)

  • 박주영;지승현;성기훈;허성만;박경욱
    • 한국지능시스템학회논문지
    • /
    • 제25권4호
    • /
    • pp.319-326
    • /
    • 2015
  • 최근들어, 확률론적 최적제어(stochastic optimal control) 및 강화학습(reinforcement learning) 분야에서는 데이터를 활용하여 준최적 제어 전략을 찾는 문제를 위한 많은 연구 노력이 있어 왔다. 가치함수(value function) 기반 동적 계획법(dynamic programming)으로 최적제어기를 구하는 고전적인 이론은 확률론적 최적 제어 문제를 풀기위해 확고한 이론적 근거 아래 확립된바 있다. 하지만, 이러한 고전적 이론은 매우 간단한 경우에만 성공적으로 적용될 수 있다. 그러므로, 엄밀한 수학적 분석 대신에 상태 전이 및 보상 신호 값 등의 관련 데이터를 활용하여 준최적해를 구하고자 하는 데이터 기반 현대적 접근 방법들은 실용적인 응용분야에서 특히 매력적이다. 본 논문에서는 확률론적 최적제어 전략과 근사적 추론 및 기계학습 기반 데이터 처리 방법을 접목하는 방법론들을 고려한다. 그리고 이러한 고려를 통하여 얻어진 방법론들을 금융공학을 포함한 다양한 응용 분야에 적용하고 그들의 성능을 관찰해보도록 한다.