• Title/Summary/Keyword: 최적행동

Search Result 215, Processing Time 0.025 seconds

Effects of Environmental Factors on Performances and Behavioural Patterns of Growing Pigs (環境條件이 育成豚의 增體와 行動에 미치는 影響)

  • 김두환;김철욱;송영민;진상근
    • Journal of Animal Environmental Science
    • /
    • v.1 no.2
    • /
    • pp.145-153
    • /
    • 1995
  • This study was conducted to determine the effects of non-climatic environmental factors on performances and behavioural patterns of growing pigs. Two hundred and seventy growing pigs were confined and administered with three levels of spaces per pig(0.33, 0.44 and 0.66$m^2$) and three different numbers of pigs per pen(12, 15 and 18 pigs) from 30kg to 60kg body weight. This study was designed by using 3 $\times$ 3 factorial arrangement(three levels of spaces $\times$ three different numbers of pigs) and investigated the effects of main factors and the relationship between each factors. The result of this study were summarized as follows; 1. The 0.44$m^2$ of floor space per pig improved(p<0.01) the weight gain and the feed/gain during the growing phase. 2. The 15 pigs per pen showed the faster gain and improved feed/gain than the 12 or 18 pigs per pen during the growing phase(p<0.05). 3. The reduction of floor space of growing pigs caused the reduction of resting, non-aggressive social behaviour but eating, aggressive behaviour was increased(p<0.01). 4. Group size affected the behavioural patterns significantly(p<0.01) of growing pigs. The aggressive and eating behaviour increased but resting behaviour decreased by crowding in the growing pigs. 5. Therefore we concluded that growing pigs need 0.44$m^2$ per pig and 15 pigs per pen for the better raising condition.

  • PDF

경제정책(經濟政策)의 동태적(動態的) 모순(矛盾)과 신뢰성(信賴性)

  • Yu, Yun-Ha
    • KDI Journal of Economic Policy
    • /
    • v.11 no.2
    • /
    • pp.99-117
    • /
    • 1989
  • 합리적(合理的) 경제주체(經濟主體)는 예상되는 정책변화(政策變化)에 대처할 뿐만 아니라 정부정책(政府政策)을 일정한 방향으로 유도(誘導)하기도 한다. 이 경우 주어진 여건하(與件下)에서 매 순간 최선(最善)의 행위(行爲)를 택해 나가는 정책(政策)은 사회적(社會的) 최적(最適)을 이루지 못할 가능성(可能性)이 많다. 개별경제주체(個別經濟主體)가 정책입안자(政策立案者)의 행동방식(行動方式)을 미리 예견하고 자기에게 유리하도록 정책환경(政策環境)을 인위적으로 조성할 가능성이 있기 때문이다. 따라서 사회적(社會的) 최적(最適)의 달성(達成)을 위해서는 단기적(短期的)으로 최선(最善)이 못되고 또 동태적(動態的)으로 모순(矛盾)된 정책(政策)의 집행(執行) 요구되기도 한다. 그러나 동태적(動態的)으로 모순(矛盾)된 정책(政策)은 민간(民間)의 신뢰(信賴)를 얻지 못하며 따라서 실효(實效)를 거두지 못한다. 즉 정책(政策)의 최적성(最適性)과 신뢰성(信賴性) 사이에 대립(對立)이 발생(發生)한다. 본고(本稿)에서는 예견적(豫見的) 행위(行爲)를 하는 경제주체(經濟主體)와 정책입안자(政策立案者) 사이에 개재(介在)하기 쉬운 이같은 동태모순문제(動態矛盾問題) 그리고 그 부분적(部分的) 해결책으로 사전담보(事前擔保) 정책당국(政策當局)의 성가(聲價)메커니즘을 살펴보았다.

  • PDF

Application and Comparison of Genetic Algorithm and Harmony Search Algorithm for Optimal Cost Design of Water Distribution System (상수도 관망 최적설계에 대한 유전 알고리즘과 하모니써치 알고리즘의 적용 및 비교)

  • Hong, Ari;Lee, Ho Min;Choi, Young Hwan;Choi, Ji Ho;Kim, Joong Hoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.521-521
    • /
    • 2016
  • 상수도 관망은 수원에서 수요절점까지 물을 안정적으로 공급하는 것을 목표로 한다. 상수도 관망의 최적설계는 수리학적 제한조건 (절점의 수압, 관로의 유속)을 만족하는 범위에서 비용을 최소화하는 설계안을 얻는 것으로 Savic and Walters (1997)는 유전 알고리즘 (Genetic Algorithms, Holland 1975)을 적용한 상수도 관망 설계 프로그램인 GANET를 제안하였고, Maier et al. (1996)은 개미군집알고리즘 (Ant Colony Optimization Algorithm, Dorigo et al. 1996)을 상수도 관망 최적설계에 적용한 후 그 결과가 유전 알고리즘에 비해 우수함을 증명하는 등 상수도 관망 최적설계에 관한 연구가 활발히 진행되어 오고 있다. 유전알고리즘은 선택, 교차, 돌연변이의 반복계산 과정을 통하여 최적해를 찾는 최적화 기법이다. 이 과정에서 결정변수는 유전자 (Gene)의 집합으로 표현되며, 염색체 (Chromosome) 내에서 근접한 유전 인자들은 일종의 Building Block을 형성하게 된다. Building Block은 좋은 해를 갖는 유전 인자를 높은 확률로 보관하여 지역해에 빠질 가능성을 줄이는 반면, 유전형 (Genotype)이 표현형 (Phenotype)을 충분히 모방하여 표현하지 못한 경우 오히려 최적해의 탐색을 방해할 수 있다는 한계점을 갖는다. 유전 알고리즘을 상수도 관망 최적설계에 적용하였을 때에도 이 한계점은 여실히 드러난다. 관로의 관경을 결정변수로 설정한 후 유전형으로 표현하였을 때, 관망도 상에서 근접하지 않은 두 관로가 염색체 내에서 연속으로 나열된다면 두 관로 간의 연관성이 실제보다 크게 고려되기 때문이다. 한편, 하모니써치 (Harmony Search, Geem et al. 2001) 알고리즘은 즉흥 연주 (Improvisation)를 통해 최상의 화음을 만들어내는 현상으로부터 착안하여 만들어진 최적화기법으로 연산 기법은 무작위선택, 기억회상, 피치조정 등으로 구성되어 있으며, 결정변수에 해당하는 연주자가 독립적으로 행동하며 해를 탐색한다는 점에서 유전알고리즘과 큰 차이를 갖는다. 본 연구에서는 유전알고리즘의 Building Block에 의해 발생하는 오류를 개선하고자, 상수도 관망 최적설계 연구에 많이 사용되는 Hanoi 관망 (Fujiwara and Khang 1990) 관로의 정렬 순서를 여러 가지 기준으로 설정하여 관망데이터를 구축한 후 하모니써치와 유전 알고리즘을 적용하여 최적화를 수행하였고 그 결과를 비교하였다. 그 결과 유전 알고리즘과 달리 하모니써치 알고리즘의 경우, 관로의 나열 순서와 상관없이 우수한 최적해 탐색 결과를 보이는 것을 확인할 수 있었다.

  • PDF

Flexible Decision-Making for Autonomous Agent Through Computation of Urgency in Time-Critical Domains (실시간 환경에서 긴급한 정도의 계산을 통한 자율적인 에이전트의 유연한 의사결정)

  • Noh Sanguk
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.9
    • /
    • pp.1196-1203
    • /
    • 2004
  • Autonomous agents need considerable computational resources to perform rational decision-making. The complexity of decision-making becomes prohibitive when large number of agents are present and when decisions have to be made under time pressure. One of approaches in time-critical domains is to respond to an observed condition with a predefined action. Although such a system may be able to react very quickly to environmental conditions, predefined plans are of less value if a situation changes and re-planning is needed. In this paper we investigate strategies intended to tame the computational burden by using off-line computation in conjunction with on-line reasoning. We use performance profiles computed off-line and the notion of urgency (i.e., the value of time) computed on-line to choose the amount of information to be included during on-line deliberation. This method can adjust to various levels of real-time demands, but incurs some overhead associated with iterative deepening. We test our framework with experiments in a simulated anti-air defense domain. The experiments show that the off-line performance profiles and the on-line computation of urgency are effective in time-critical situations.

Multi-Agent Reinforcement Learning Model based on Fuzzy Inference (퍼지 추론 기반의 멀티에이전트 강화학습 모델)

  • Lee, Bong-Keun;Chung, Jae-Du;Ryu, Keun-Ho
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.10
    • /
    • pp.51-58
    • /
    • 2009
  • Reinforcement learning is a sub area of machine learning concerned with how an agent ought to take actions in an environment so as to maximize some notion of long-term reward. In the case of multi-agent, especially, which state space and action space gets very enormous in compared to single agent, so it needs to take most effective measure available select the action strategy for effective reinforcement learning. This paper proposes a multi-agent reinforcement learning model based on fuzzy inference system in order to improve learning collect speed and select an effective action in multi-agent. This paper verifies an effective action select strategy through evaluation tests based on Robocup Keepaway which is one of useful test-beds for multi-agent. Our proposed model can apply to evaluate efficiency of the various intelligent multi-agents and also can apply to strategy and tactics of robot soccer system.

A Naive Bayesian-based Model of the Opponent's Policy for Efficient Multiagent Reinforcement Learning (효율적인 멀티 에이전트 강화 학습을 위한 나이브 베이지만 기반 상대 정책 모델)

  • Kwon, Ki-Duk
    • Journal of Internet Computing and Services
    • /
    • v.9 no.6
    • /
    • pp.165-177
    • /
    • 2008
  • An important issue in Multiagent reinforcement learning is how an agent should learn its optimal policy in a dynamic environment where there exist other agents able to influence its own performance. Most previous works for Multiagent reinforcement learning tend to apply single-agent reinforcement learning techniques without any extensions or require some unrealistic assumptions even though they use explicit models of other agents. In this paper, a Naive Bayesian based policy model of the opponent agent is introduced and then the Multiagent reinforcement learning method using this model is explained. Unlike previous works, the proposed Multiagent reinforcement learning method utilizes the Naive Bayesian based policy model, not the Q function model of the opponent agent. Moreover, this learning method can improve learning efficiency by using a simpler one than other richer but time-consuming policy models such as Finite State Machines(FSM) and Markov chains. In this paper, the Cat and Mouse game is introduced as an adversarial Multiagent environment. And then effectiveness of the proposed Naive Bayesian based policy model is analyzed through experiments using this game as test-bed.

  • PDF

Group Behavior and Cooperative Strategies of Swarm Robot Based on Local Communication and Artificial Immune System (지역적 통신과 인공면역계에 기반한 군집 로봇의 협조 전략과 군 행동)

  • Sim, Kwee-Bo;Lee, Dong-Wook
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.16 no.1
    • /
    • pp.72-78
    • /
    • 2006
  • It is essential for robot to have the sensing and communication abilities in the swarm robot system. In general, as the number of robot goes on increasing, the limitation of communication capacity and information overflow occur in global communication system. Therefore a local communication is more effective than global one. In this paper, we propose the novel method for determining the optimal communication radius through the analyzing of the information propagation based on local communication. And we also propose a method of cooperative strategies and group behavior of swarm robot based on artificial immune system.

An Analysis of Information Propagation and Chaotic Phenomena in Local Communication Method for Cooperative Behavior of Collective Autonomous Mobile Robots (자율이동로봇군의 협조행동을 위한 지역적 통신 방식에 있어서 정보전파 해석 및 카오스 현상 분석)

  • Lee, Dong-Wook;Sim, Kwee-Bo
    • Journal of the Korean Institute of Telematics and Electronics S
    • /
    • v.36S no.6
    • /
    • pp.67-75
    • /
    • 1999
  • The sensing and communication abilities of a mobile robot are essential to cooperative behavior in distributed autonomous robotic systems. In general, as the number of robot goes on increasing, the limitation of communication capacity and information overflow occur in global communication capacity and information overflow occur in global communication system. Therefore a local communication is more effective than global one. In this paper, we analyze information propagation mechanism based on local communication. To find an optimal communication radius, we propose three methods with different conditions. Also, to avoid chaotic behavior which occurs when a robot obtains and loses information, we find stable condition of information propagation.

  • PDF

Neural-Fuzzy Controller Based on Reinforcement Learning (강화 학습에 기반한 뉴럴-퍼지 제어기)

  • 박영철;김대수;심귀보
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.05a
    • /
    • pp.245-248
    • /
    • 2000
  • In this paper we improve the performance of autonomous mobile robot by induction of reinforcement learning concept. Generally, the system used in this paper is divided into two part. Namely, one is neural-fuzzy and the other is dynamic recurrent neural networks. Neural-fuzzy determines the next action of robot. Also, the neural-fuzzy is determined to optimal action internal reinforcement from dynamic recurrent neural network. Dynamic recurrent neural network evaluated to determine action of neural-fuzzy by external reinforcement signal from environment, Besides, dynamic recurrent neural network weight determined to internal reinforcement signal value is evolved by genetic algorithms. The architecture of propose system is applied to the computer simulations on controlling autonomous mobile robot.

  • PDF

Noncooperative Behavior of the Offended in Provision of Self-Protective Measures (자기보호조치 제공에 있어서 피해자들의 비협조적인 행동)

  • Choi, Youn-Sang
    • Environmental and Resource Economics Review
    • /
    • v.9 no.5
    • /
    • pp.877-901
    • /
    • 2000
  • 이전 가능한 환경오염으로부터의 피해자가 오염으로 인해 발생하는 피해를 줄이기 위한 방안으로 자기보호조치(self-protective measure)를 제공할 수 있다. 이 때 피해자들이 서로 비협조적으로 행동할 경우 피해자들의 자기보호조치 제공은 환경오염으로 인해 발생하는 시장실패 이외에 피해자들이 자기보호조치를 적정량 이상으로 제공함으로써 추가적인 시장실패를 발생시키게 된다. 이러한 경우에 사회최적 상태에 도달할 수 있도록 하는 최선의 정책은 환경오염을 발생시킨 측과 자기보호조치를 과다하게 제공하는 피해자 모두에게 피구비안(Pigouvian) 세금을 부과하는 것이다. 만약 오염자가 방출되는 오염물의 양을 줄이기 위해 예방조치(preventive measure)를 취함에 있어서 그 죄가 피해자에게 주는 실질 효력이 불확실할 때 피해자의 반응은 자기보호조치의 예방조치에 대한 한계생산곡선의 모양에 좌우된다. 또한 자기보호조치의 제공과 예방조치의 효력에 대한 위험성간의 관계는 피해자의 생산함수 형태에 좌우된다.

  • PDF