• 제목/요약/키워드: Optimal Control Problem

검색결과 1,157건 처리시간 0.031초

함수근사와 규칙추출을 위한 클러스터링을 이용한 강화학습 (Reinforcement Learning with Clustering for Function Approximation and Rule Extraction)

  • 이영아;홍석미;정태충
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1054-1061
    • /
    • 2003
  • 강화학습의 대표적인 알고리즘인 Q-Learning은 상태공간의 모든 상태-행동 쌍(state-action pairs)의 평가값이 수렴할 때까지 반복해서 경험하여 최적의 전략(policy)을 얻는다. 상태공간을 구성하는 요소(feature)들이 많거나 요소의 데이타 형태가 연속형(continuous)인 경우, 상태공간은 지수적으로 증가하게 되어, 모든 상태들을 반복해서 경험해야 하고 모든 상태-행동 쌍의 Q값을 저장하는 것은 시간과 메모리에 있어서 어려운 문제이다. 본 논문에서는 온라인으로 학습을 진행하면서 비슷한 상황의 상태들을 클러스터링(clustering)하고 새로운 경험에 적응해서 클러스터(cluster)의 수정(update)을 반복하여, 분류된 최적의 전략(policy)을 얻는 새로운 함수근사(function approximation)방법인 Q-Map을 소개한다. 클러스터링으로 인해 정교한 제어가 필요한 상태(state)는 규칙(rule)으로 추출하여 보완하였다. 미로환경과 마운틴 카 문제를 제안한 Q-Map으로 실험한 결과 분류된 지식을 얻을 수 있었으며 가시화된(explicit) 지식의 형태인 규칙(rule)으로도 쉽게 변환할 수 있었다.

퍼지 엔트로피를 이용한 퍼지 뉴럴 시스템 모델링 (Fuzzy Neural System Modeling using Fuzzy Entropy)

  • 박인규
    • 한국멀티미디어학회논문지
    • /
    • 제3권2호
    • /
    • pp.201-208
    • /
    • 2000
  • 이 논문에서는 시계열 예측을 위하여 퍼지 엔트로피에 의한 입력공간의 분할과 퍼지 제어규칙을 자동으로 생성하는 방법을 제안하고, Mackey-Glass 데이터 Set을 이용한 시계열 예측 문제에 적용하여 그 성능을 검증한다. 이 방법은 샤논 함수와 퍼지 엔트로피 함수를 이용하여 입력공간을 분할하고, 분할된 부 공간에 대해 이력 데이터와 부합할 수 있는 각각의 규칙에 등급을 정하여 불필요한 제어규칙을 제거하여 최적의 규칙베이스를 구성하도록 한다. 적용되는 퍼지 신경망의 기본적인 구조는 퍼지 제어기의 규칙베이스와 추론의 과정을 신경회로망을 이용하여 구현하며 퍼지 제어규칙의 매개변수들은 최대 급경사 강하법에 의해 적응되어진다. 제안되는 알고리즘을 매개변수의 수를 줄이기 위하여 제어 규칙의 결론부의 출력값은 신경망의 가중치로 구성하여 퍼지 신경망의 복잡도를 줄임으로서 추론형과 기술형 접근법을 혼합한 형태의 학습 알고리즘이다.

  • PDF

가상 환경에서의 강화학습을 이용한 비행궤적 시뮬레이션 (Flight Trajectory Simulation via Reinforcement Learning in Virtual Environment)

  • 이재훈;김태림;송종규;임현재
    • 한국시뮬레이션학회논문지
    • /
    • 제27권4호
    • /
    • pp.1-8
    • /
    • 2018
  • 인공지능을 이용하여 목표 지점까지 제어하는 가장 대표적인 방법은 강화학습이다. 하지만 그동안 강화학습을 처리하기 위해서는 구현하기 어렵고 복잡한 연산을 처리해야만 했다. 본 논문에서는 이를 개선한 Proximal Policy Optimization (PPO) 알고리즘을 이용하여 가상환경에서 목표지점에 도달하기 위한 계획된 비행궤적을 찾는 방법을 시뮬레이션 하였다. 또한 외부 환경요소가 비행궤적 학습에 미치는 영항을 알아보기 위하여 궤적의 변화, 보상 값의 영향 및 외부 바람등과 같은 변수를 추가하고 궤적 학습 성능 및 학습 속도에 미치는 영향을 비교 분석을 수행한다. 본 결과를 통하여 에이전트가 다양한 외부환경의 변화에도 계획된 궤적을 찾을 수 있다는 것을 시뮬레이션 결과에 따라 알 수 있었으며, 이는 실제 비행체에 적용할 수 있을 것이다.

조종사 임무 효율을 고려한 공군 비행 스케줄 최적화 (Optimized Air Force Flight Scheduling Considering Pilot' s Mission Efficiency)

  • 권민석;윤찬일;김지용
    • 산업경영시스템학회지
    • /
    • 제43권4호
    • /
    • pp.116-122
    • /
    • 2020
  • Human and material resource planning is one representative example of Operations Research. Resource planning is important not only in civilian settings but also in military ones. In the Air Force, flight scheduling is one of the primary issues that must be addressed by the personnel who are connected to flight missions. However, although the topic is of great importance, relatively few studies have attempted to resolve the problem on a scientific basis. Each flight squadron has its own scheduling officers who manually draw up the flight schedules each day. While mistakes may not occur while drafting schedules, officers may experience difficulties in systematically adjusting to them. To increase efficiency in this context, this study proposes a mathematical model based on a binary variable. This model automatically drafts flight schedules considering pilot's mission efficiency. Furthermore, it also recommends that schedules be drawn up monthly and updated weekly, rather than being drafted from scratch each day. This will enable easier control when taking the various relevant factors into account. The model incorporates several parameters, such as matching of the main pilots and co-pilots, turn around time, availability of pilots and aircraft, monthly requirements of each flight mission, and maximum/minimum number of sorties that would be flown per week. The optimal solution to this model demonstrated an average improvement of nearly 47% compared with other feasible solutions.

SDN에서 심층강화학습 기반 라우팅 알고리즘 (A Routing Algorithm based on Deep Reinforcement Learning in SDN)

  • 이성근
    • 한국전자통신학회논문지
    • /
    • 제16권6호
    • /
    • pp.1153-1160
    • /
    • 2021
  • 본 논문은 소프트웨어 정의 네트워크에서 심층강화학습을 활용하여 최적의 경로를 결정하는 라우팅 알고리즘을 제안한다. 학습을 위한 심층강화학습 모델은 DQN 을 기반으로 하고, 입력은 현재 네트워크 상태, 발신지, 목적지 노드이고, 출력은 발신지에서 목적지까지의 경로 리스트를 반환한다. 라우팅 작업을 이산 제어 문제로 정의하며, 라우팅을 위한 서비스 품질 파라미터는 지연, 대역폭, 손실률을 고려하였다. 라우팅 에이전트는 사용자의 서비스 품질 프로파일에 따라 적절한 서비스 등급으로 분류하고, SDN에서 수집된 현재 네트워크 상태로부터 각 링크 별로 제공할 수 있는 서비스 등급을 변환한다. 이러한 변환된 정보를 토대로 발신지에서부터 목적지까지 요구되는 서비스 등급을 만족시키는 경로를 선택하도록 학습을 한다. 시뮬레이션 결과는 제안한 알고리즘이 일정한 에피소드를 진행하게 되면 올바른 경로를 선택하게 되고, 학습이 성공적으로 수행됨을 나타냈다.

3D 프린팅 적층 방향을 고려한 위상최적설계의 실험적 검증 (Experimental Validation of Topology Design Optimization Considering Lamination Direction of Three-dimensional Printing)

  • 박희만;이규빈;김진산;선채림;윤민호
    • 한국전산구조공학회논문집
    • /
    • 제35권3호
    • /
    • pp.191-196
    • /
    • 2022
  • 본 연구에서는 3D 프린팅 FDM 방식의 적층 방향에 따라 기계적 물성이 달라지는 이방성 특성을 확인하고 이를 이용하여 위상 최적설계를 수행하였다. 벤치마크 문제인 자동차 현가장치 부품 중 하나인 로어 컨트롤 암에 대하여 밀도법 기반 위상 최적설계를 수행하였으며, 외부 하중과 이방성 특성에 따라 위상 최적결과가 다르게 나타나는 것을 확인하였다. 이를 이용하여 최적화된 모델에 대하여 3D 프린터로 적층 방향을 달리하여 2가지 시험품을 제작하였으며 인장시험을 수행하였다. 시험시 3D 비접촉 변형률 측정기를 이용하여 변형률을 구하였으며 이를 CAE 응답해석으로 얻은 변형률과 비교한 결과가 정량 및 정성적으로 일치하는 것을 확인하였다. 3D 프린팅 적층 방향을 고려한 위상 최적모델의 인장 실험 결과를 통해 해당 최적설계 방법론의 유효성을 검증하였다.

차별적이니 드랍-확률을 갖는 동적-VQSDDP를 이용한 상대적 손실차별화의 달성 (Achieving Relative Loss Differentiation using D-VQSDDP with Differential Drop Probability)

  • 조경래;구자환;정진욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.1332-1335
    • /
    • 2008
  • In order to various service types of real time and non-real time traffic with varying requirements are transmitted over the IEEE 802.16 standard is expected to provide quality of service(QoS) researchers have explored to provide a queue management scheme with differentiated loss guarantees for the future Internet. The sides of a packet drop rate, an each class to differential drop probability on achieving a low delay and high traffic intensity. Improved a queue management scheme to be enhanced to offer a drop probability is desired necessarily. This paper considers multiple random early detection with differential drop probability which is a slightly modified version of the Multiple-RED(Random Early Detection) model, to get the performance of the best suited, we analyzes its main control parameters (maxth, minth, maxp) for achieving the proportional loss differentiation (PLD) model, and gives their setting guidance from the analytic approach. we propose Dynamic-multiple queue management scheme based on differential drop probability, called Dynamic-VQSDDP(Variable Queue State Differential Drop Probability)T, is proposed to overcome M-RED's shortcoming as well as supports static maxp parameter setting values for relative and each class proportional loss differentiation. M-RED is static according to the situation of the network traffic, Network environment is very dynamic situation. Therefore maxp parameter values needs to modify too to the constantly and dynamic. The verification of the guidance is shown with figuring out loss probability using a proposed algorithm under dynamic offered load and is also selection problem of optimal values of parameters for high traffic intensity and show that Dynamic-VQSDDP has the better performance in terms of packet drop rate. We also demonstrated using an ns-2 network simulation.

무인 육상 새우 양식장 통합 모니터링 시스템 개발 (Development of an Unmanned Land-Based Shrimp Farm Integrated Monitoring System)

  • 박형빈;박경욱;이성근
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.209-216
    • /
    • 2024
  • 육상 새우 양식장은 연안 양식에 비해 생장 환경을 보다 안정적으로 제어할 수 있어 고품질의 대규모 생산에 유리하다. 최적의 새우 생장 환경을 유지하기 위해서는 물의 순환, 적정 수온 유지, 산소 공급, 사료 공급 등 다양한 요소들을 관리해야 한다. 특히, 적절한 수질 관리가 되지 못하면 새우 폐사로 이어지기 때문에 양식장에 24시간 사람이 상주하여 지속적으로 관리해야 하는 어려움이 있다. 본 논문에서는 이러한 문제를 해결하기 위하여 최소한의 인력으로 운영 가능한 육상 양식장 통합 모니터링 시스템을 제안한다. 제안된 시스템은 IoT 기술을 활용하여 육상 양식장의 실시간 영상, 펌프 상태, 수질 데이터, 에너지 사용 현황을 수집하여 서버로 전송한다. 관리자는 웹 인터페이스 및 스마트폰 앱을 통해 서버에 저장된 양식장의 상황을 언제 어디서나 실시간으로 확인하고 필요한 조치를 취할 수 있다. 따라서 관리자가 양식장에 상주할 필요 없이 현장 작업 시간을 크게 줄일 수 있다.

가중연관규칙 탐사를 이용한 재활훈련운동과 근육 활성의 연관성 분석 (Analysis on Relation between Rehabilitation Training Movement and Muscle Activation using Weighted Association Rule Discovery)

  • 이아름;박용군;권대규;김정자
    • 전자공학회논문지CI
    • /
    • 제46권6호
    • /
    • pp.7-17
    • /
    • 2009
  • 효과적인 재활 시스템을 구상하는데 있어서 훈련 데이터의 정교한 분석은 다음 단계 훈련을 위한 피드백 자료로서 매우 중요하다. 현재 다양한 생체 역학적 실험을 통해 인간의 운동 능력을 평가하고 이로부터 생성된 데이터의 분석을 위한 객관적이고 신뢰성 있는 연구결과들이 발표되고 있다. 그러나 대부분의 기존 연구들은 기초 통계적인 방법에 근거한 정량분석만을 수행함으로써, 획득된 정보를 임상에 적용 하는데 있어서는 충분한 신뢰성을 보장할 수 없다. 데이터마이닝은 대용량 데이터에 들어있는 숨겨진 규칙과 패턴을 탐사함으로써 임상 데이터에 숨어있는 의미 있는 정보추출에 성공적으로 사용되고 있으며, 특히 임상 연구 분야에서는 훌륭한 의사 결정 지원 시스템으로서 점점 그 사용이 증가되고 있다. 본 연구에서는 신뢰성 있는 자세 제어 능력(Postural control ability) 평가를 위해서 측정된 훈련 데이터에 가중연관규칙 탐사를 적용하여 자세 훈련 유형에 따른 근육 활성 패턴과의 연관성을 분석, 효율적인 재활 훈련 규칙을 탐사하였다. 탐사된 규칙은 재활 및 임상 전문가의 의사결정에 더욱 정성적이고 유용한 선험적 지식으로 사용 될 수 있으며, 이를 근거로 환자 맞춤형 최적의 재활 훈련 모델을 구상하기 위한 지표로서 사용될 수 있다.

Korean Mistletoe Viscum album coloratum Induces Specific and Non-Specific Immune Responses in Japanese Eel Anguilla japonica

  • 최상훈;노진구;최민순;박성우;윤종만;박경이
    • 한국양식학회지
    • /
    • 제22권1호
    • /
    • pp.56-62
    • /
    • 2009
  • Effects of Korean mistletoe extracts (KM-110), Viscum album coloratum on the specific and non-specific immune responses of Japanese eel Anguilla japonica were examined. The optimal concentration not showing toxicity of KM-110 was determined to $30-40{\mu}g/ml$ in vitro and $100{\mu}g$/100 g of fish in vivo. Even $1000{\mu}g$ of KM-110/100 g of fish did not show any clinical problem in fish though the levels of toxic parameters were slightly increased. In terms of antibody production, KM-110 significantly elicited more antibody production than FCA or $\beta$-glucan. $\beta$-glucan plus KM-110 group synergistically enhanced antibody production. There was no significant difference between KM-110 and KM-110 plus $\beta$-glucan group. The ROI production by head kidney (HK) leucocytes of eel injected with 500 or $1000{\mu}g$ KM-110 was significantly (P<0.05) enhanced than the control and FCA-treated group. Maximum increase in the NBT reduction value was observed in $1000{\mu}g$ KM-110 group but no significant difference was found between 500 and $1000{\mu}g$ KM group. The level of serum lysozyme activity was significantly (P<0.05) higher in the 500 and $1000{\mu}g$ KM-110- or FCA-treated group than in the control and $200{\mu}g$ KM-110 group. The phagocytic activities of HK leucocytes isolated from eel injected with 500 and $1000{\mu}g$ KM-110 were significantly (P<0.05) higher than $200{\mu}g$ KM-110 and PBS-injected control group. Korean mistletoe appeared to be a good activator of the specific and non-specific immune responses of Japanese eel.