发布文献求助

Reinforcement learning-based finite-time tracking control of an unknown unmanned surface vehicle with input constraints

强化学习计算机科学稳健性（进化）趋同（经济学）控制理论（社会学）弹道人工神经网络标识符方案（数学）跟踪（教育）最优控制人工智能控制（管理）数学优化数学心理学数学分析教育学生物化学化学物理天文经济基因程序设计语言经济增长

作者

Ning Wang,Ying Gao,Yang Chen,Xuefeng Zhang

出处

期刊：Neurocomputing [Elsevier BV]
日期：2021-10-28 卷期号：484: 26-37 被引量：47

标识

DOI：10.1016/j.neucom.2021.04.133

摘要

In this paper, subject to completely unknown system dynamics and input constraints, a reinforcement learning-based finite-time trajectory tracking control (RLFTC) scheme is innovatively created for an unmanned surface vehicle (USV) by combining actor-critic reinforcement learning (RL) mechanism with finite-time control technique. Unlike previous RL-based tracking which requires infinite-time convergence thereby rather sensitive to complex unknowns, an actor-critic finite-time control structure is created by employing adaptive neural network identifiers to recursively update actor and critic, such that learning-based robustness can be sufficiently enhanced. Moreover, deduced from the Bellman error formulation, the proposed RLFTC is directly optimized in a finite-time manner. Theoretical analysis eventually shows that the proposed RLFTC scheme can ensure semi-global practical finite-time stability (SGPFS) for a closed-loop USV system and tracking errors converge to an arbitrarily small neighborhood of the origin in a finite time, subject to optimal cost. Both mathematical simulation and virtual-reality experiments demonstrate remarkable effectiveness and superiority of the proposed RLFTC scheme.

求助该文献

最长约 10秒，即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

更新

2025年影响因子查询已上线 (2025-6-18)

更新

PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: cassie发布了新的文献求助10

刚刚; Lucas的应助被mf采纳，获得10

1秒前; MD99发布了新的文献求助10

3秒前; wangyuchen发布了新的文献求助10

5秒前; 在水一方上传了应助文件

6秒前; 在水一方上传了应助文件

7秒前; CipherSage上传了应助文件

7秒前; 杨馨蕊完成签到，获得积分10

8秒前; sb完成签到，获得积分10

8秒前; 搜集达人上传了应助文件

9秒前; 王sir完成签到，获得积分10

9秒前; Khaos_0929发布了新的文献求助10

11秒前; 陈平安完成签到，获得积分10

12秒前; 地表飞猪上传了应助文件

12秒前; 乐乐上传了应助文件

13秒前; 你想读博吗发布了新的文献求助10

14秒前; nanyuan123发布了新的文献求助30

15秒前; 半糖完成签到，获得积分10

15秒前; SYLH的应助被ShihanZhong采纳，获得10

15秒前; 111完成签到，获得积分10

16秒前; 风铃鸟关闭了风铃鸟的文献求助

18秒前; lrl发布了新的文献求助10

18秒前; 夏梦园发布了新的文献求助10

18秒前; 了0完成签到，获得积分10

20秒前; 锥子完成签到，获得积分10

21秒前; 脑洞疼的应助被清新的苑博采纳，获得10

21秒前; Khaos_0929完成签到，获得积分10

22秒前; jjamazing上传了应助文件

22秒前; 端庄千青完成签到，获得积分10

23秒前; 别管我了上传了应助文件

23秒前; mf发布了新的文献求助10

23秒前; 科目三上传了应助文件

24秒前; 南淮关闭了南淮的文献求助

25秒前; 凉的白开完成签到，获得积分10

25秒前; joey2024完成签到，获得积分20

25秒前; 可耐的寒松完成签到，获得积分10

27秒前; 花痴的易真完成签到，获得积分10

27秒前; zwy完成签到，获得积分10

28秒前; 孙文杰完成签到，获得积分10

28秒前; 端庄千青发布了新的文献求助10

29秒前

高分求助中: The Mother of All Tableaux Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 2400; Ophthalmic Equipment Market by Devices(surgical: vitreorentinal,IOLs,OVDs,contact lens,RGP lens,backflush,diagnostic&monitoring:OCT,actorefractor,keratometer,tonometer,ophthalmoscpe,OVD), End User,Buying Criteria-Global Forecast to2029 2000; Optimal Transport: A Comprehensive Introduction to Modeling, Analysis, Simulation, Applications 800; Official Methods of Analysis of AOAC INTERNATIONAL 600; ACSM’s Guidelines for Exercise Testing and Prescription, 12th edition 588; T/CIET 1202-2025 可吸收再生氧化纤维素止血材料 500; Interpretation of Mass Spectra, Fourth Edition 500

热门求助领域（近24小时）

热门帖子: 关注科研通微信公众号，转发送积分 3950988; 求助须知：如何正确求助？哪些是违规求助？ 3496397; 关于积分的说明 11081817; 捐赠科研通 3226886; 什么是DOI，文献DOI怎么找？ 1784005; 邀请新用户注册赠送积分活动 868114; 科研通“疑难数据库（出版商）”最低求助积分说明 800997

今日热心研友

热心市民小红花

哇哇哇哇我

昏睡的蟠桃

注：热心度 = 本日应助数 + 本日被采纳获取积分÷10

Copyright © 2020-2025 AbleSci.COM, 科研通, All Right Reserved

科研通是非营利科研互助平台，不忘初心，为科研助力

本站互助的所有文件仅供个人学习研究用，禁止任何人把求助的所得文献进行盈利或传播

皖ICP备2024041134号-1

皖公网安备34019202002308

科研通【文献互助QQ群】：如果您有特殊求助，或发布求助超过24小时未得到应助，可加群求助，群号：941272744【点击一键加群】

科研通【志愿服务QQ群】：如果您热爱文献互助，有热心愿意为更多人服务，请加入小伙伴群，点击申请加入

关注微信服务号

科研通