Data-Driven Performance-Prescribed Reinforcement Learning Control of an Unmanned Surface Vehicle

强化学习 计算机科学 跟踪误差 跟踪(教育) 转化(遗传学) 约束(计算机辅助设计) 人工神经网络 方案(数学) 最优控制 人工智能 控制器(灌溉) 控制(管理) 控制工程 控制理论(社会学) 数学优化 工程类 数学 化学 基因 数学分析 农学 生物 机械工程 生物化学 教育学 心理学
作者
Ning Wang,Ying Gao,Xuefeng Zhang
出处
期刊:IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
卷期号:32 (12): 5456-5467 被引量:146
标识
DOI:10.1109/tnnls.2021.3056444
摘要

An unmanned surface vehicle (USV) under complicated marine environments can hardly be modeled well such that model-based optimal control approaches become infeasible. In this article, a self-learning-based model-free solution only using input–output signals of the USV is innovatively provided. To this end, a data-driven performance-prescribed reinforcement learning control (DPRLC) scheme is created to pursue control optimality and prescribed tracking accuracy simultaneously. By devising state transformation with prescribed performance, constrained tracking errors are substantially converted into constraint-free stabilization of tracking errors with unknown dynamics. Reinforcement learning paradigm using neural network-based actor–critic learning framework is further deployed to directly optimize controller synthesis deduced from the Bellman error formulation such that transformed tracking errors evolve a data-driven optimal controller. Theoretical analysis eventually ensures that the entire DPRLC scheme can guarantee prescribed tracking accuracy, subject to optimal cost. Both simulations and virtual-reality experiments demonstrate the remarkable effectiveness and superiority of the proposed DPRLC scheme.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
自来也完成签到,获得积分10
14秒前
薏仁完成签到 ,获得积分10
24秒前
亮总完成签到 ,获得积分10
33秒前
坟里唱情歌完成签到 ,获得积分10
34秒前
新新完成签到 ,获得积分10
36秒前
圆圆完成签到 ,获得积分10
39秒前
Hiram完成签到,获得积分10
40秒前
海鹏完成签到 ,获得积分10
49秒前
研友_ZA2B68完成签到,获得积分10
1分钟前
赵勇完成签到 ,获得积分10
1分钟前
打打应助丸子的饼王采纳,获得10
1分钟前
飞云完成签到 ,获得积分10
1分钟前
丹青完成签到 ,获得积分10
1分钟前
丸子的饼王完成签到,获得积分10
1分钟前
海豚完成签到 ,获得积分10
1分钟前
蓝绝完成签到 ,获得积分10
1分钟前
名侦探柯基完成签到 ,获得积分10
1分钟前
陈荣完成签到 ,获得积分10
1分钟前
小乙猪完成签到 ,获得积分0
1分钟前
guoxingliu完成签到,获得积分10
1分钟前
黑粉头头完成签到,获得积分10
2分钟前
tang完成签到,获得积分10
2分钟前
sydhwo完成签到 ,获得积分10
2分钟前
2分钟前
完美的海完成签到 ,获得积分0
2分钟前
求助完成签到,获得积分0
2分钟前
丘比特应助Freya采纳,获得10
2分钟前
不安毛豆发布了新的文献求助10
2分钟前
完美世界应助不安毛豆采纳,获得10
2分钟前
2分钟前
Joy完成签到 ,获得积分10
2分钟前
congcong完成签到 ,获得积分10
2分钟前
Freya发布了新的文献求助10
2分钟前
YuLu完成签到 ,获得积分10
2分钟前
小白白白完成签到 ,获得积分10
2分钟前
阔达一刀完成签到 ,获得积分10
2分钟前
ccm应助Freya采纳,获得10
2分钟前
651完成签到 ,获得积分10
3分钟前
时尚的梦曼完成签到,获得积分10
3分钟前
怡心亭完成签到 ,获得积分10
3分钟前
高分求助中
The Oxford Handbook of Social Cognition (Second Edition, 2024) 1050
Kinetics of the Esterification Between 2-[(4-hydroxybutoxy)carbonyl] Benzoic Acid with 1,4-Butanediol: Tetrabutyl Orthotitanate as Catalyst 1000
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
Handbook of Qualitative Cross-Cultural Research Methods 600
Chen Hansheng: China’s Last Romantic Revolutionary 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3139630
求助须知:如何正确求助?哪些是违规求助? 2790514
关于积分的说明 7795460
捐赠科研通 2446980
什么是DOI,文献DOI怎么找? 1301526
科研通“疑难数据库(出版商)”最低求助积分说明 626259
版权声明 601176