Model-Reference Reinforcement Learning for Collision-Free Tracking Control of Autonomous Surface Vehicles

强化学习 避碰 控制器(灌溉) 碰撞 计算机科学 控制理论(社会学) 避障 跟踪(教育) 理论(学习稳定性) 控制工程 障碍物 工程类 人工智能 控制(管理) 移动机器人 机器人 机器学习 心理学 教育学 计算机安全 法学 政治学 农学 生物
作者
Qingrui Zhang,Wei Pan,Vasso Reppa
出处
期刊:IEEE Transactions on Intelligent Transportation Systems [Institute of Electrical and Electronics Engineers]
卷期号:23 (7): 8770-8781 被引量:43
标识
DOI:10.1109/tits.2021.3086033
摘要

This paper presents a novel model-reference reinforcement learning algorithm for the intelligent tracking control of uncertain autonomous surface vehicles with collision avoidance. The proposed control algorithm combines a conventional control method with reinforcement learning to enhance control accuracy and intelligence. In the proposed control design, a nominal system is considered for the design of a baseline tracking controller using a conventional control approach. The nominal system also defines the desired behaviour of uncertain autonomous surface vehicles in an obstacle-free environment. Thanks to reinforcement learning, the overall tracking controller is capable of compensating for model uncertainties and achieving collision avoidance at the same time in environments with obstacles. In comparison to traditional deep reinforcement learning methods, our proposed learning-based control can provide stability guarantees and better sample efficiency. We demonstrate the performance of the new algorithm using an example of autonomous surface vehicles.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
1秒前
CodeCraft应助lingzhi采纳,获得10
1秒前
芯梓12完成签到 ,获得积分10
4秒前
dai完成签到,获得积分10
4秒前
精明的听寒完成签到,获得积分10
4秒前
善学以致用应助yuanyuan采纳,获得10
4秒前
百事可乐完成签到,获得积分10
5秒前
li完成签到 ,获得积分10
5秒前
Ling发布了新的文献求助10
5秒前
5秒前
6秒前
8秒前
10秒前
蝉鸣完成签到 ,获得积分10
10秒前
danli发布了新的文献求助10
10秒前
桐桐应助wuxunxun2015采纳,获得10
11秒前
11秒前
小竹完成签到 ,获得积分10
11秒前
喵咪西西发布了新的文献求助10
11秒前
啦啦啦啦呼完成签到,获得积分10
12秒前
12秒前
16秒前
ding应助morry5007采纳,获得10
17秒前
17秒前
19秒前
19秒前
20秒前
嘛呱完成签到,获得积分10
21秒前
21秒前
lingzhi发布了新的文献求助10
22秒前
zjw完成签到 ,获得积分10
22秒前
22秒前
ATBG55完成签到 ,获得积分10
24秒前
小不点发布了新的文献求助10
24秒前
24秒前
英俊的铭应助付清采纳,获得10
24秒前
少艾发布了新的文献求助10
26秒前
27秒前
量子星尘发布了新的文献求助10
28秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Agriculture and Food Systems Third Edition 2000
Clinical Microbiology Procedures Handbook, Multi-Volume, 5th Edition 临床微生物学程序手册,多卷,第5版 2000
King Tyrant 720
Principles of Plasma Discharges and Materials Processing, 3rd Edition 400
The Synthesis of Simplified Analogues of Crambescin B Carboxylic Acid and Their Inhibitory Activity of Voltage-Gated Sodium Channels: New Aspects of Structure–Activity Relationships 400
El poder y la palabra: prensa y poder político en las dictaduras : el régimen de Franco ante la prensa y el periodismo 400
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5598772
求助须知:如何正确求助?哪些是违规求助? 4684180
关于积分的说明 14834106
捐赠科研通 4664702
什么是DOI,文献DOI怎么找? 2537384
邀请新用户注册赠送积分活动 1504909
关于科研通互助平台的介绍 1470606