Model-free adaptive control design for nonlinear discrete-time processes with reinforcement learning techniques

强化学习 控制理论(社会学) 控制器(灌溉) 自适应控制 人工神经网络 非线性系统 计算机科学 离散时间和连续时间 理论(学习稳定性) 李雅普诺夫函数 有界函数 函数逼近 功能(生物学) 控制工程 控制(管理) 数学 工程类 人工智能 机器学习 数学分析 统计 物理 量子力学 进化生物学 农学 生物
作者
Dong Liu,Guang‐Hong Yang
出处
期刊:International Journal of Systems Science [Informa]
卷期号:49 (11): 2298-2308 被引量:20
标识
DOI:10.1080/00207721.2018.1498557
摘要

This paper deals with the model-free adaptive control (MFAC) based on the reinforcement learning (RL) strategy for a family of discrete-time nonlinear processes. The controller is constructed based on the approximation ability of neural network architecture, a new actor-critic algorithm for neural network control problem is developed to estimate the strategic utility function and the performance index function. More specifically, the novel RL-based MFAC scheme is reasonable to design the controller without need to estimate y(k+1) information. Furthermore, based on Lyapunov stability analysis method, the closed-loop systems can be ensured uniformly ultimately bounded. Simulations are shown to validate the theoretical results.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Lz发布了新的文献求助10
刚刚
lll发布了新的文献求助10
刚刚
刚刚
痴情志浩完成签到,获得积分10
1秒前
曾经白凝发布了新的文献求助10
1秒前
随遇而安完成签到 ,获得积分10
1秒前
xueyang关注了科研通微信公众号
1秒前
莫羽倾尘发布了新的文献求助10
2秒前
可爱的函函应助小蜜蜂采纳,获得10
2秒前
哇咔咔发布了新的文献求助10
2秒前
2秒前
ll完成签到,获得积分10
2秒前
澳bobo发布了新的文献求助10
3秒前
慕青应助李亚男采纳,获得10
3秒前
烟花应助404采纳,获得10
3秒前
量子星尘发布了新的文献求助10
4秒前
4秒前
Heyley发布了新的文献求助10
4秒前
小蘑菇应助zzz采纳,获得10
5秒前
XianshengJin应助靓丽的善斓采纳,获得10
5秒前
飘逸的山彤完成签到,获得积分10
6秒前
珂珂发布了新的文献求助10
6秒前
6秒前
6秒前
6秒前
lzy完成签到,获得积分10
7秒前
9秒前
9秒前
9秒前
10秒前
ZXH发布了新的文献求助10
10秒前
11秒前
11秒前
lzy发布了新的文献求助10
11秒前
芋泥丸丸完成签到,获得积分10
12秒前
科研通AI6.3应助机智谷蕊采纳,获得10
13秒前
13秒前
飞翔的鸣发布了新的文献求助10
13秒前
哈哈哈发布了新的文献求助10
13秒前
14秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 3000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
Principles of town planning : translating concepts to applications 500
Short-Wavelength Infrared Windows for Biomedical Applications 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6061356
求助须知:如何正确求助?哪些是违规求助? 7893767
关于积分的说明 16306426
捐赠科研通 5205122
什么是DOI,文献DOI怎么找? 2784744
邀请新用户注册赠送积分活动 1767341
关于科研通互助平台的介绍 1647373