Data-Driven Performance-Prescribed Reinforcement Learning Control of an Unmanned Surface Vehicle

强化学习 计算机科学 跟踪误差 跟踪(教育) 转化(遗传学) 约束(计算机辅助设计) 人工神经网络 方案(数学) 最优控制 人工智能 控制器(灌溉) 控制(管理) 控制工程 控制理论(社会学) 数学优化 工程类 数学 化学 基因 数学分析 农学 生物 机械工程 生物化学 教育学 心理学
作者
Ning Wang,Ying Gao,Xuefeng Zhang
出处
期刊:IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
卷期号:32 (12): 5456-5467 被引量:260
标识
DOI:10.1109/tnnls.2021.3056444
摘要

An unmanned surface vehicle (USV) under complicated marine environments can hardly be modeled well such that model-based optimal control approaches become infeasible. In this article, a self-learning-based model-free solution only using input-output signals of the USV is innovatively provided. To this end, a data-driven performance-prescribed reinforcement learning control (DPRLC) scheme is created to pursue control optimality and prescribed tracking accuracy simultaneously. By devising state transformation with prescribed performance, constrained tracking errors are substantially converted into constraint-free stabilization of tracking errors with unknown dynamics. Reinforcement learning paradigm using neural network-based actor-critic learning framework is further deployed to directly optimize controller synthesis deduced from the Bellman error formulation such that transformed tracking errors evolve a data-driven optimal controller. Theoretical analysis eventually ensures that the entire DPRLC scheme can guarantee prescribed tracking accuracy, subject to optimal cost. Both simulations and virtual-reality experiments demonstrate the remarkable effectiveness and superiority of the proposed DPRLC scheme.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
刚刚
刚刚
highlights完成签到,获得积分10
刚刚
1秒前
lucky完成签到 ,获得积分10
1秒前
岁晚发布了新的文献求助10
1秒前
震动的沛山完成签到,获得积分10
1秒前
1秒前
2秒前
4秒前
4秒前
4秒前
所所应助cdk采纳,获得10
4秒前
vvvvyl发布了新的文献求助10
4秒前
4秒前
EEee发布了新的文献求助10
5秒前
缥缈可乐完成签到,获得积分10
5秒前
QVQ发布了新的文献求助10
5秒前
5秒前
6秒前
6秒前
6秒前
fu发布了新的文献求助10
6秒前
任性冬卉发布了新的文献求助10
6秒前
7秒前
完美世界应助ABC的风格采纳,获得10
8秒前
8秒前
vvvvyl发布了新的文献求助10
9秒前
Lucas应助小居居采纳,获得10
9秒前
lc339发布了新的文献求助10
9秒前
7788完成签到,获得积分20
9秒前
历冰雪发布了新的文献求助10
10秒前
10秒前
无语的嚓茶关注了科研通微信公众号
10秒前
迷人的鞅完成签到,获得积分20
10秒前
科目三应助lizl采纳,获得10
10秒前
细腻丹萱发布了新的文献求助10
10秒前
独孤磕盐完成签到,获得积分10
11秒前
高分求助中
卤化钙钛矿人工突触的研究 1000
Engineering for calcareous sediments : proceedings of the International Conference on Calcareous Sediments, Perth 15-18 March 1988 / edited by R.J. Jewell, D.C. Andrews 1000
Wolffs Headache and Other Head Pain 9th Edition 1000
Continuing Syntax 1000
Signals, Systems, and Signal Processing 510
Cardiac structure and function of elite volleyball players across different playing positions 500
CLSI H26-A2 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6241900
求助须知:如何正确求助?哪些是违规求助? 8065856
关于积分的说明 16834525
捐赠科研通 5320000
什么是DOI,文献DOI怎么找? 2832898
邀请新用户注册赠送积分活动 1810438
关于科研通互助平台的介绍 1666837