Fault-tolerant adaptive tracking control of Euler-Lagrange systems – An echo state network approach driven by reinforcement learning

强化学习 计算机科学 控制理论(社会学) 稳健性(进化) 人工神经网络 回声状态网络 非线性系统 控制工程 人工智能 循环神经网络 控制(管理) 工程类 物理 基因 量子力学 化学 生物化学
作者
Qing Chen,Yaochu Jin,Yongduan Song
出处
期刊:Neurocomputing [Elsevier BV]
卷期号:484: 109-116 被引量:18
标识
DOI:10.1016/j.neucom.2021.10.083
摘要

Reinforcement learning (RL) has enjoyed considerable success in application to nonlinear systems. However, very few RL-based works that explicitly address the control problem of MIMO nonlinear systems with subject to actuator failures. In this work, we develop a fault-tolerant adaptive tracking control method fused with an echo state network (ESN) driven by reinforcement learning for Euler-Lagrange systems subject to actuation faults. The proposed control includes an associative search network (ASN), a control gain network (CGN), and an adaptive critic network (ACN), with ASN to estimate the unknown items of the control system, CGN to deal with the time-varying and unknown control gains matrix, and ACN to generate the reinforcement signal, all together ensuring stable tracking and accommodate modeling uncertainties and actuation failures. Different from traditional reinforcement learning controllers that utilizes radial basis function neural networks (RBFNN) or fuzzy systems, the proposed one adopts an echo state network, a paradigm of recurrent neural networks, to implement the ASN, ACN and CGN, resulting in enhanced learning capabilities and stronger robustness against external uncertainties and disturbances, thus better control performance.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
kk完成签到,获得积分10
刚刚
刚刚
ZQY发布了新的文献求助10
1秒前
LDG发布了新的文献求助10
1秒前
yf发布了新的文献求助10
2秒前
1223完成签到,获得积分20
2秒前
2秒前
2秒前
liberty发布了新的文献求助10
3秒前
帅气的杰瑞完成签到,获得积分10
3秒前
3秒前
Rita完成签到 ,获得积分10
4秒前
丘奇发布了新的文献求助10
4秒前
balabala完成签到,获得积分10
4秒前
4秒前
Owen应助无糖气泡水采纳,获得10
4秒前
4秒前
同尘完成签到 ,获得积分10
4秒前
吾系渣渣辉完成签到 ,获得积分10
5秒前
neverever完成签到,获得积分10
5秒前
阿尔卡利斯完成签到,获得积分10
5秒前
6秒前
儒雅完成签到,获得积分10
6秒前
竹子完成签到,获得积分10
6秒前
量子星尘发布了新的文献求助10
7秒前
7秒前
7秒前
1223发布了新的文献求助10
7秒前
MinSheng完成签到,获得积分10
8秒前
8秒前
8秒前
芝芝椰奶冻完成签到,获得积分10
8秒前
科目三应助Motanka采纳,获得10
9秒前
微客发布了新的文献求助10
10秒前
Sisyphus发布了新的文献求助10
10秒前
苹果夜梦完成签到 ,获得积分10
10秒前
10秒前
ll完成签到,获得积分20
10秒前
毅雅发布了新的文献求助10
11秒前
11秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Zeolites: From Fundamentals to Emerging Applications 1500
Architectural Corrosion and Critical Infrastructure 1000
Early Devonian echinoderms from Victoria (Rhombifera, Blastoidea and Ophiocistioidea) 1000
Hidden Generalizations Phonological Opacity in Optimality Theory 1000
By R. Scott Kretchmar - Practical Philosophy of Sport and Physical Activity - 2nd (second) Edition: 2nd (second) Edition 666
Energy-Size Reduction Relationships In Comminution 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4940451
求助须知:如何正确求助?哪些是违规求助? 4206580
关于积分的说明 13074753
捐赠科研通 3985154
什么是DOI,文献DOI怎么找? 2182031
邀请新用户注册赠送积分活动 1197696
关于科研通互助平台的介绍 1110012