• Title/Summary/Keyword: Q-Learning algorithm

Search Result 153, Processing Time 0.025 seconds

A Study on Ship Route Generation with Deep Q Network and Route Following Control

  • Min-Kyu Kim;Hyeong-Tak Lee
    • 한국항해항만학회지
    • /
    • 제47권2호
    • /
    • pp.75-84
    • /
    • 2023
  • Ships need to ensure safety during their navigation, which makes route determination highly important. It must be accompanied by a route following controller that can accurately follow the route. This study proposes a method for automatically generating the ship route based on deep reinforcement learning algorithm and following it using a route following controller. To generate a ship route, under keel clearance was applied to secure the ship's safety and navigation chart information was used to apply ship navigation related regulations. For the experiment, a target ship with a draft of 8.23 m was designated. The target route in this study was to depart from Busan port and arrive at the pilot boarding place of the Ulsan port. As a route following controller, a velocity type fuzzy P ID controller that could compensate for the limitation of a linear controller was applied. As a result of using the deep Q network, a route with a total distance of 62.22 km and 81 waypoints was generated. To simplify the route, the Douglas-Peucker algorithm was introduced to reduce the total distance to 55.67 m and the number of way points to 3. After that, an experiment was conducted to follow the path generated by the target ship. Experiment results revealed that the velocity type fuzzy P ID controller had less overshoot and fast settling time. In addition, it had the advantage of reducing the energy loss of the ship because the change in rudder angle was smooth. This study can be used as a basic study of route automatic generation. It suggests a method of combining ship route generation with the route following control.

강화학습을 이용한 줄고누게임의 인공엔진개발 (Artificial Engine Development through Reinforcement Learning on Jul-Gonu Game)

  • 신용우
    • 인터넷정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.93-99
    • /
    • 2009
  • 게임프로그램 제작이 단순히 3D 또는 온라인게임 등으로 분류하여 엔진과 게임프로그래밍을 하던 시기를 지나 이제는 게임프로그래밍의 종류를 세분화하여 인공지능 게임프로그래머의 역할이 게임을 좀 더 재미있게 할 수 있는 시점이라 하겠다. 본 논문에서는 강화학습 알고리즘을 이용하여 보상 값을 받아 줄고누 보드게임 말이 학습하게 하여 지능적으로 움직이게 하였다. 구현된 게임 말이 지능적으로 잘 움직이는지 확인하기위해, 보드게임을 제작하여 상대방 말과 승부를 하게 하였다. 실험결과 일정횟수 학습한 이후, 임의로 움직이는 말보다 성능이 월등히 향상됨을 알 수 있었다.

  • PDF

이동 장애물을 고려한 DQN 기반의 Mapless Navigation 및 학습 시간 단축 알고리즘 (Mapless Navigation Based on DQN Considering Moving Obstacles, and Training Time Reduction Algorithm)

  • 윤범진;유승열
    • 한국정보통신학회논문지
    • /
    • 제25권3호
    • /
    • pp.377-383
    • /
    • 2021
  • 최근 4차 산업혁명에 따라 공장, 물류창고, 서비스영역에서 유연한 물류이송을 위한 자율 이동형 모바일 로봇의 사용이 증가하고 있다. 대규모 공장에서는 Simultaneous Localization and Mapping(SLAM)을 수행하기 위하여 많은 수작업이 필요하기 때문에 개선된 모바일 로봇 자율 주행에 대한 필요성이 대두되고 있다. 이에 따라 본 논문에서는 고정 및 이동 장애물을 피해 최적의 경로로 주행하는 Mapless Navigation에 대한 알고리즘을 제안하고자 한다. Mapless Navigation을 위하여 Deep Q Network(DQN)을 통해 고정 및 이동 장애물을 회피하도록 학습하였고 두 종류의 장애물 회피에 대하여 각각 정확도 90%, 93%를 얻었다. 또한 DQN은 많은 학습 시간을 필요로 하는데 이를 단축하기 위한 목표의 크기 변화 알고리즘을 제안하고 이를 시뮬레이션을 통하여 단축된 학습시간과 장애물 회피 성능을 확인하였다.

New Approaches to Xerostomia with Salivary Flow Rate Based on Machine Learning Algorithm

  • Yeon-Hee Lee;Q-Schick Auh;Hee-Kyung Park
    • Journal of Korean Dental Science
    • /
    • 제16권1호
    • /
    • pp.47-62
    • /
    • 2023
  • Purpose: We aimed to investigate the objective cutoff values of unstimulated flow rates (UFR) and stimulated salivary flow rates (SFR) in patients with xerostomia and to present an optimal machine learning model with a classification and regression tree (CART) for all ages. Materials and Methods: A total of 829 patients with oral diseases were enrolled (591 females; mean age, 59.29±16.40 years; 8~95 years old), 199 patients with xerostomia and 630 patients without xerostomia. Salivary and clinical characteristics were collected and analyzed. Result: Patients with xerostomia had significantly lower levels of UFR (0.29±0.22 vs. 0.41±0.24 ml/min) and SFR (1.12±0.55 vs. 1.39±0.94 ml/min) (P<0.001), respectively, compared to those with non-xerostomia. The presence of xerostomia had a significantly negative correlation with UFR (r=-0.603, P=0.002) and SFR (r=-0.301, P=0.017). In the diagnosis of xerostomia based on the CART algorithm, the presence of stomatitis, candidiasis, halitosis, psychiatric disorder, and hyperlipidemia were significant predictors for xerostomia, and the cutoff ranges for xerostomia for UFR and SFR were 0.03~0.18 ml/min and 0.85~1.6 ml/min, respectively. Conclusion: Xerostomia was correlated with decreases in UFR and SFR, and their cutoff values varied depending on the patient's underlying oral and systemic conditions.

이동로봇을 위한 RFID Smart Floor (RFID Smart Floor for Mobile Robot)

  • 강수혁;김용호;문병준;김동한
    • 전자공학회논문지 IE
    • /
    • 제48권4호
    • /
    • pp.30-39
    • /
    • 2011
  • 본 논문에서는 Smart Floor라는 새로운 개념의 정보공간을 제안한다. Smart Floor는 이동로봇의 경로유도에 필요한 정보를 저장하고 있는 공간으로, 이동로봇은 외부의 도움 없이 목표위치에 도달할 수 있다. 이를 위하여 RFID 태그 포장을 통하여 Smart Floor를 구현하고, UHF(Ultra High Frequency) 대역의 수동 RFID 시스템을 장착한 이동로봇을 제작하였다. Smart Floor에 저장되는 정보는 Q학습을 통해 미리 시뮬레이션 된 값으로, 임의의 시작위치에서 목표위치까지 가는데 필요한 방향값과 Q값이다. 본 연구는 Smart Floor의 구성과 정보를 이용하는 이동로봇 어플리케이션 개발에 도움을 줄 것이다.

Estimation of BOD in wastewater treatment plant by using different ANN algorithms

  • BAKI, Osman Tugrul;ARAS, Egemen
    • Membrane and Water Treatment
    • /
    • 제9권6호
    • /
    • pp.455-462
    • /
    • 2018
  • The measurement and monitoring of the biochemical oxygen demand (BOD) play an important role in the planning and operation of wastewater treatment plants. The most basic method for determining biochemical oxygen demand is direct measurement. However, this method is both expensive and takes a long time. A five-day period is required to determine the biochemical oxygen demand. This study has been carried out in a wastewater treatment plant in Turkey (Hurma WWTP) in order to estimate the biochemical oxygen demand a shorter time and with a lower cost. Estimation was performed using artificial neural network (ANN) method. There are three different methods in the training of artificial neural networks, respectively, multi-layered (ML-ANN), teaching learning based algorithm (TLBO-ANN) and artificial bee colony algorithm (ABC-ANN). The input flow (Q), wastewater temperature (t), pH, chemical oxygen demand (COD), suspended sediment (SS), total phosphorus (tP), total nitrogen (tN), and electrical conductivity of wastewater (EC) are used as the input parameters to estimate the BOD. The root mean squared error (RMSE) and the mean absolute error (MAE) values were used in evaluating performance criteria for each model. As a result of the general evaluation, the ML-ANN method provided the best estimation results both training and test series with 0.8924 and 0.8442 determination coefficient, respectively.

마이크로그리드에서 강화학습 기반 에너지 사용량 예측 기법 (Prediction Technique of Energy Consumption based on Reinforcement Learning in Microgrids)

  • 선영규;이지영;김수현;김수환;이흥재;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.175-181
    • /
    • 2021
  • 본 논문은 단기 에너지 사용량 예측을 위해 인공지능 기반의 접근법에 대해 분석한다. 본 논문에서는 단기 에너지 사용량 예측 기술에 자주 활용되는 지도학습 알고리즘의 한계를 개선하기 위해 강화학습 알고리즘을 활용한다. 지도학습 알고리즘 기반의 접근법은 충분한 성능을 위해 에너지 사용량 데이터뿐만 아니라 contextual information이 필요하여 높은 복잡성을 가진다. 데이터와 학습모델의 복잡성을 개선하기 위해 다중 에이전트 기반의 심층 강화학습 알고리즘을 제안하여 에너지 사용량 데이터로만 에너지 사용량을 예측한다. 공개된 에너지 사용량 데이터를 통해 시뮬레이션을 진행하여 제안한 에너지 사용량 예측 기법의 성능을 확인한다. 제안한 기법은 이상점의 특징을 가지는 데이터를 제외하고 실제값과 유사한 값을 예측하는 것을 보여준다.

Reliability-aware service chaining mapping in NFV-enabled networks

  • Liu, Yicen;Lu, Yu;Qiao, Wenxin;Chen, Xingkai
    • ETRI Journal
    • /
    • 제41권2호
    • /
    • pp.207-223
    • /
    • 2019
  • Network function virtualization can significantly improve the flexibility and effectiveness of network appliances via a mapping process called service function chaining. However, the failure of any single virtualized network function causes the breakdown of the entire chain, which results in resource wastage, delays, and significant data loss. Redundancy can be used to protect network appliances; however, when failures occur, it may significantly degrade network efficiency. In addition, it is difficult to efficiently map the primary and backups to optimize the management cost and service reliability without violating the capacity, delay, and reliability constraints, which is referred to as the reliability-aware service chaining mapping problem. In this paper, a mixed integer linear programming formulation is provided to address this problem along with a novel online algorithm that adopts the joint protection redundancy model and novel backup selection scheme. The results show that the proposed algorithm can significantly improve the request acceptance ratio and reduce the consumption of physical resources compared to existing backup algorithms.

고객 질의 문서 자동 분류를 위한 학습 알고리즘 성능 평가 (Performance Evaluation on the Learning Algorithm for Automatic Classification of Q&A Documents)

  • 최정민;이병수
    • 정보처리학회논문지D
    • /
    • 제13D권1호
    • /
    • pp.133-138
    • /
    • 2006
  • 최근 인터넷의 보급으로 전자상거래가 대중들에게 나타났고 현재 기업들의 경영환경 변화를 주도하고 있다. 전자상거래에서는 기업이 고객과의 유지 및 관계 구축을 위하여 고객이 원하는 것이 무엇인가를 파악하고 그것을 고객에게 제안하는 여러 가지 고객 채널을 가지고 있는데, 그 중 게시판과 전자메일은 고객의 질의를 직접적으로 들을 수 있는 인바운드(Inbound) 정보로서 매우 중요한 채널로 다루어지고 있다. 그러나 현재 운영되는 전자상거래의 게시판과 전자메일은 체계적인 관리와 처리과정 없이 질의와 답변이 이루어지고 있는 실정이다. 따라서 본 연구에서는 이러한 문제점의 해결을 위해 인공지능 분야의 문서 분류에서 널리 사용되고 있는 기계학습 알고리즘 중 대표적인 나이브 베이지안(Naive Bayesian), TFIDF, 신경망, k-NN 알고리즘을 도입하여 전자상거래에서 존재하는 여러 가지 고객 질의의 카테고리를 자동으로 분류할 수 있도록 함으로써 관리자가 정확한 답변을 신속하게 처리할 수 있도록 하였다. 그리고 도입한 알고리즘의 고객 질의 문서 자동 분류 성능 실험을 통해 어떤 알고리즘이 우수한 분류 성능을 나타내는지 확인하였으며 실험 결과 나이브 베지이지안 알고리즘이 95%이상의 높은 분류 성능을 나타내는 것을 확인하였다.

심층강화학습 기반 분산형 전력 시스템에서의 수요와 공급 예측을 통한 전력 거래시스템 (Power Trading System through the Prediction of Demand and Supply in Distributed Power System Based on Deep Reinforcement Learning)

  • 이승우;선준호;김수현;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.163-171
    • /
    • 2021
  • 본 논문은 분산형 전력 시스템에서 심층강화학습 기반의 전력 생산 환경 및 수요와 공급을 예측하며 자원 할당 알고리즘을 적용해 전력거래 시스템 연구의 최적화된 결과를 보여준다. 전력 거래시스템에 있어서 기존의 중앙집중식 전력 시스템에서 분산형 전력 시스템으로의 패러다임 변화에 맞추어 전력거래에 있어서 공동의 이익을 추구하며 장기적인 거래의 효율을 증가시키는 전력 거래시스템의 구축을 목표로 한다. 심층강화학습의 현실적인 에너지 모델과 환경을 만들고 학습을 시키기 위해 날씨와 매달의 패턴을 분석하여 데이터를 생성하며 시뮬레이션을 진행하는 데 있어서 가우시안 잡음을 추가해 에너지 시장 모델을 구축하였다. 모의실험 결과 제안된 전력 거래시스템은 서로 협조적이며 공동의 이익을 추구하며 장기적으로 이익을 증가시킨 것을 확인하였다.