• Title/Summary/Keyword: 상태 공간 탐색

Search Result 86, Processing Time 0.023 seconds

Reinforcement learning model for water distribution system design (상수도관망 설계에의 강화학습 적용방안 연구)

  • Jaehyun Kim;Donghwi Jung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.229-229
    • /
    • 2023
  • 강화학습은 에이전트(agent)가 주어진 환경(environment)과의 상호작용을 통해서 상태(state)를 변화시켜가며 최대의 보상(reward)을 얻을 수 있도록 최적의 행동(action)을 학습하는 기계학습법을 의미한다. 최근 알파고와 같은 게임뿐만 아니라 자율주행 자동차, 로봇 제어 등 다양한 분야에서 널리 사용되고 있다. 상수도관망 분야의 경우에도 펌프 운영, 밸브 운영, 센서 최적 위치 선정 등 여러 문제에 적용되었으나, 설계에 강화학습을 적용한 연구는 없었다. 설계의 경우, 관망의 크기가 커짐에 따라 알고리즘의 탐색 공간의 크기가 증가하여 기존의 최적화 알고리즘을 이용하는 것에는 한계가 존재한다. 따라서 본 연구는 강화학습을 이용하여 상수도관망의 구성요소와 환경요인 간의 복잡한 상호작용을 고려하는 설계 방법론을 제안한다. 모델의 에이전트를 딥 강화학습(Deep Reinforcement Learning)으로 구성하여, 상태 및 행동 공간이 커 발생하는 고차원성 문제를 해결하였다. 또한, 해당 모델의 상태 및 보상으로 절점에서의 압력 및 수요량과 설계비용을 고려하여 적절한 수량과 수압의 용수 공급이 가능한 경제적인 관망을 설계하도록 하였다. 모델의 행동은 실제로 공학자가 설계하듯이 절점마다 하나씩 차례대로 다른 절점과의 연결 여부를 결정하는 것으로, 이를 통해 관망의 레이아웃(layout)과 관경을 결정한다. 본 연구에서 제안한 방법론을 규모가 큰 그리드 네트워크에 적용하여 모델을 검증하였으며, 고려해야 할 변수의 개수가 많음에도 불구하고 목적에 부합하는 관망을 설계할 수 있었다. 모델 학습과정 동안 에피소드의 평균 길이와 보상의 크기 등의 변화를 비교하여, 제안한 모델의 학습 능력을 평가 및 보완하였다. 향후 강화학습 모델을 통해 신뢰성(reliability) 또는 탄력성(resilience)과 같은 시스템의 성능까지 고려한 설계가 가능할 것으로 기대한다.

  • PDF

An Optimization method of CDHMM using Genetic Algorithms (유전자 알고리듬을 이용한 CDHMM의 최적화)

  • 백창흠
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.71-74
    • /
    • 1998
  • HMM (hidden Markov model)을 이용한 음성인식은 현재 가장 널리 쓰여지고 있는 방법으로, 이 중 CDHMM (continuous observation density HMM)은 상태에서 관측심볼확률을 연속확률밀도를 사용하여 표현한다. 본 논문에서는 가우스 혼합밀도함수를 사용하는 CDHMM의 상태천이확률과, 관측심볼확률을 표현하기 위한 인자인 평균벡터, 공분산 행렬, 가지하중값을 유전자 알고리듬을 사용하여 최적화하는 방법을 제안하였다. 유전자 알고리듬은 매개변수 최적화문제에 대하여 자연의 진화원리를 모방한 알고리듬으로, 염색체 형태로 표현된 개체군 (population) 중에서 환경에 대한 적합도 (fitness)가 높은 개체가 높은 확률로 살아남아 재생 (reproduction)하게 되며, 교배 (crossover)와 돌연변이 (mutation) 연산 후에 다음 세대 개체군을 형성하게 되고, 이러한 과정을 반복하면서 최적의 개체를 구하게 된다. 본 논문에서는 상태천이확률, 평균벡터, 공분산행렬, 가지하중값을 부동소수점수 (floating point number)의 유전자형으로 표현하여 유전자 알고리듬을 수행하였다. 유전자 알고리듬은 복잡한 탐색공간에서 최적의 해를 찾는데 효과적으로 적용되었다.

  • PDF

Convergence Properties of Bayesian Evolutionary Algorithms with Population Size Greater Than 1 (개체군 크기 2 이상인 베이지안 진화 알고리즘의 수렴 특성)

  • 이시은;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.15-17
    • /
    • 2000
  • 진화 연산의 확률적 모델인 베이지안 진화 알고리즘이 개체군의 크기를 1로 제한하고 고정된 차원의 탐색 공간을 갖는 경우, 목표 확률분포에 수렴함이 이전 연구[2]를 통해 증명되었다. 본 논문에서는 개체군의 크기가 2 이상인 경우의 베이지안 진화 알고리즘을 개체군 자체를 하나의 상태로 보는 단일 체인의 베이지안 입자 필터(particle filter)로 변환하여, 입자 필터의 수렴 특성을 이용하여 목표 확률분포에 수렴함을 증명한다.

  • PDF

Design of Heuristics Using Vertex Information in a Grid-based Map (그리드 기반 맵에서 꼭지점 정보를 이용한 휴리스틱의 설계)

  • Kim, Ji-Hyui;Jung, Ye-Won;Yu, Kyeon-Ah
    • Journal of the Korea Society of Computer and Information
    • /
    • v.20 no.1
    • /
    • pp.85-92
    • /
    • 2015
  • As computer game maps get more elaborate, path-finding by using $A^*$ algorithm in grid-based game maps becomes bottlenecks of the overall game performance. It is because the search space becomes large as the number of nodes increases with detailed representation in cells. In this paper we propose an efficient pathfinding method in which the computer game maps in a regular grid is converted into the polygon-based representation of the list of vertices and then the visibility information about vertices of polygons can be utilized. The conversion to the polygon-based map does not give any effect to the real-time query process because it is preprocessed offline. The number of visited nodes during search can be reduced dramatically by designing heuristics using visibility information of vertices that make the accuracy of the estimation enhanced. Through simulations, we show that the proposed methods reduce the search space and the search time effectively while maintaining the advantages of the grid-based method.

Robot Task Planning within a Distributed Control Framework (분산 제어 구조내의 로봇 작업 계획)

  • Kim, Hyun-Sik;Shin, Hang-Cheol;Kim, Man-Soo;Kim, In-Cheol
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.319-323
    • /
    • 2006
  • 본 논문에서는 동작 모델과 작업 목표에 따라 지능 로봇 시스템의 작업 순서를 결정하는 작업 계획기의 설계와 데모시스템에 대해 설명한다. 블랙보드 중심의 분산 제어 구조에서 하나의 독립적인 지식원으로 동작하는 작업 계획기는 작업 관리기의 요청이 있을 때마다 지식베이스로부터 동작 모델과 월드 상태 정보를 제공받아 작업 목표 달성을 위한 작업 계획을 생성한다. 그리고 이렇게 생성된 작업 계획은 오류로 인해 재 계획이 필요할 때까지 작업 관리기를 통해 실행된다. 본 연구의 작업 계획기는 효율적인 작업 계획 생성을 위해 지역 상태공간 탐색법의 하나인 EHC+ 탐색법과 계획그래프-기반의 휴우리스틱 계산법을 적용한다. 본 논문에서는 작업 계획기의 효율성과 블랙보드와의 연계성을 시험하기 위한 데모 시스템에 대해 자세히 설명한다. 이를 통해 지식베이스, 작업 관리기, 컴포넌트 서비스기 등 로봇 제어 구조내의 다른 지식원들과의 인터페이스를 위한 메시지 설계도 소개한다.

  • PDF

Target Altitude Extraction for Multibeam Surveillance Radar in Normal Environmental Condition (정상 환경 상태에서 다중 빔 탐색 레이다의 표적 고도 추출)

  • Chung, Myung-Soo;Park, Dong-Chul
    • The Journal of Korean Institute of Electromagnetic Engineering and Science
    • /
    • v.18 no.9
    • /
    • pp.1090-1097
    • /
    • 2007
  • The multibeam surveillance radar is a state-of art of 3D radar technology. It applies the stacked beam-on-received realized by a digital beamformer. In this paper, a design concept of beamformer and a method of target altitude extraction for multibeam surveillance radar in the normal environmental condition considering no multipath situations are proposed and investigated. The extraction algorithm based on antenna sine space coordinated system in a FFT digital beamformer is described. The proposed algorithm is simulated by 1 look-up table data and confirmed to have consistent results in accordance with a variety of target altitudes and a full radar frequency range.

An Optimal Sorting Algorithm for Auto IC Test Handler (IC 테스트 핸들러의 최적분류 알고리즘 개발)

  • 김종관;최동훈
    • Transactions of the Korean Society of Mechanical Engineers
    • /
    • v.18 no.10
    • /
    • pp.2606-2615
    • /
    • 1994
  • Sorting time is one of the most important issues for auto IC test handling systems. In actual system, because of too much path, reducing the computing time for finding a sorting path is the key way to enhancing the system performance. The exhaustive path search technique can not be used for real systems. This paper proposes heuristic sorting algorithm to find the minimal sorting time. The suggested algorithm is basically based on the best-first search technique and multi-level search technique. The results are close to the optimal solutions and computing time is greately reduced also. Therefore the proposed algorthm can be effectively used for real-time sorting process in auto IC test handling systems.

Handwritten Hangul Word Recognition from Small Vocabulary using Grapheme Combination Type (자모 결합 유형을 이용한 적은 어휘에서의 필기 한글 단어 인식)

  • Jin, Yu-Ho;Kim, Ho-Yeon;Kim, In-Jung;Kim, Jin-Hyeong
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.1
    • /
    • pp.52-63
    • /
    • 2001
  • 필기 단어 인식 방법에는 낱자별 분할 및 낱자 단위 인식을 통해 인식하는 방법과 단어 사전을 이용하여 단어와 영상을 직접 비교하는 방법이 있다. 이 중 후자는 인식 대상이 되는 단어들이 작은 수의 어휘로 제한되었을 대 매우 효과적이다. 본 논문에서는 입력 영상이 주어졌을 때 자모를 순차적으로 탐색하고 그 결과의 최적 조합을 찾아 인식하는 사전을 이용한 필기 한글 단어 인식 방법을 제안한다. 입력 영상은 사전의 각 단어와의 매칭을 통해 인식된다. 단어는 필기 순서로 정렬된 자모열로 표현하고 입력 영상은 획들의 집합으로 표현한다. 단어의 자모들은 입력 영상으로부터 추출된 획들의 집합으로부터 단계적으로 탐색된다. 각 단계에서는 전 단계까지의 매칭 상태와 탐색하려는 자모의 형태로부터 자모가 존재할 것이라고 기대되는 정합 기대 영역을 설정한 후 그 안에서 자모 탐색기를 이용해 자모를 찾는다. 자모 탐색기는 획들의 집합으로 이루어진 복수의 자모 후보와 그 점수를 출력한다. 각 단계마다 생성된 자모 후보들은 최적의 단어 매칭을 찾기 위한 탐색 공간을 이룬다. 본 연구에서는 단어 사전을 trie로 구성하고, 탐색 과정에서 dynamic programming을 이용하여 효과적으로 탐색을 수행하였다. 또한 인식 속도를 향상시키기 위해 산전 축소, 탐색 공간 축소 등 다양한 지식을 이용하였다. 제안하는 방법은 무제약으로 쓰여진 필기 단어도 인식 할 수 있을 뿐 아니라, 동적 사전을 이용하기 때문에 사전의 내용이 변하는 환경에서도 적용할 수 있다. 인식 실험에서는 39개의 단어로 이루어진 사전에 대하여 613개의 단어 영상에 대해 실험한 결과 98.54%의 높은 인식률을 보임으로써 제안하는 방법이 매우 효과적임을 확인하였다. 아니라 곰팡이 균주도 실제 praxis에 적합하게 개발시킬수 있다. 따라서 앞으로 발효육제품제조에 있어 starter culture가 갖는 의미는 매우 중요하며 특히 짧은 숙성기간을 거치는 발효소시지의 제조에 있어서는 필수불가결한 공정의 한 분야로 자리잡게 될 것이다.큰 차이 없었으나 이중포장과 진공포장은 상당히 효과적임을 알 수 있었다.로는 18%에 비하여 22%가 더 적합한 것으로 생각되었다.$0.15{\sim}0.35%$이었다.irc}C$에서 $13.49{\times}10^{-3}$이었다. 이 값들을 Arrhenius식에 대입하여 구한 활성화 에너지는 24.795 kJ/Kmol이었다. 이 값으로부터 결정한 살균 포장약주 명가의 상용 저장 수명은 $10^{\circ}C$에서 2년, $20^{\circ}C$에서 1년 4개월, $25^{\circ}C$에서 1년 2개월 이었다. 서울의 매월 평균 온도를 기준으로 계산할 때 본제품의 상용저장기간은 1년 8개월이었다.로 반죽이 호화되고 가열시간이 그 이상으로 증가할 때도 반죽의 호화가 약간은 진행되지만 $90^{\circ}C$ 이상의 가열온도에서는 가열시간 0.5분 이내에 반죽의 호화가 급속히 일어나고 가열 시간을 증가시켜도 더이상의 호화는 일어나지 않았다. 같은 조건에서는 waxy corn starch 반죽의 호화 속도가 corn starch보다 더 빠른 것으로 나타났다. 대표적으로 52% 수분함량에서 반응속도상수(k)와 가열온도(T)사이의 관계식은 corn starch의 경우 $logk=11.1140-4.1226{\times}10^3(1/T)

  • PDF

Evaluation of Rain Gauge Distribution Characteristics by Altitude using Optimization Technique (최적화 기법을 통한 강우관측소의 고도별 분포특성 검토)

  • Lee, Ji Ho;Kim, Jong Geun;Joo, Hong Jun;Jun, Hwan Don
    • Journal of Wetlands Research
    • /
    • v.19 no.1
    • /
    • pp.103-111
    • /
    • 2017
  • In this study, we estimate the NNI(Nearest Neighbor Index) which is considered altitude of rain gauge network as a method for evaluating appropriateness of spatial distribution and the current rain gauge network is evaluated. The altitude is divided by equal-area-ratio and optimal NNI within given basin condition is estimated using harmony search method for considering geographical conditions that vary from altitude to altitude. After calculating current state and optimal NNI for each altitude, the distribution of the rain gauge network is evaluated based on the difference between the two NNIs. As a result, it founds that the density of rain gauge networks is relatively thin as the altitude increases. Furthermore, it will be possible to construct an efficient rain gauge network if the characteristics of different altitudes are considered when a new rain gauge network is newly constructed.

A Study on Performance-based Evaluation Method for Rock Slopes : Deduction of Evaluation Factors (암반비탈면의 성능기반 평가기법 연구 : 평가항목 도출)

  • Lee, Jong-Gun;Suk, Jae-Wook;Kim, Hong-Kyoon;Kim, Yong-Soo;Moon, Joon-Shik
    • Tunnel and Underground Space
    • /
    • v.25 no.1
    • /
    • pp.86-96
    • /
    • 2015
  • In this study, the performance-based evaluation factors for rock slopes have been deducted using Delphi-method. Validity of the result was verified through factor analysis. Performance of rock slope is classified as soundness, stability and durability. Through the Delphi survey, 17 factors including discontinuity orientation are deducted for soundness, 4 factors and 3 factors are selected for stability and durability, respectively. Validation is conducted using Exploratory Factor Analysis (EFA) for 24 factors, and all factors are found to be valid. As a result of Exploratory Factor Analysis (EFA), 3-types of performance were subdivided into internal soundness, external soundness, risk, damage and durability of slopes and protection (reinforcement) facilities.