亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

SRL-TR2: A Safe Reinforcement Learning Based TRajectory TRacker Framework

强化学习 弹道 杠杆(统计) 计算机科学 学习迁移 人工智能 轨迹优化 控制器(灌溉) 机器学习 物理 天文 农学 生物
作者
Chengyu Wang,Luhan Wang,Zhaoming Lu,Xinghe Chu,Zhengrui Shi,Jiayin Deng,Tianyang Su,Guochu Shou,Xiangming Wen
出处
期刊:IEEE Transactions on Intelligent Transportation Systems [Institute of Electrical and Electronics Engineers]
卷期号:24 (6): 5765-5780 被引量:4
标识
DOI:10.1109/tits.2023.3250720
摘要

This paper aims to solve the trajectory tracking control problem for an autonomous vehicle based on reinforcement learning methods. Existing reinforcement learning approaches have found limited successful applications on safety-critical tasks in the real world mainly due to two challenges: 1) sim-to-real transfer; 2) closed-loop stability and safety concern. In this paper, we propose an actor-critic-style framework SRL-TR2, in which the RL-based TRajectory TRackers are trained under the safety constraints and then deployed to a full-size vehicle as the lateral controller. To improve the generalization ability, we adopt a light-weight adapter State and Action Space Alignment (SASA) to establish mapping relations between the simulation and reality. To address the safety concern, we leverage an expert strategy to take over the control when the safety constraints are not satisfied. Hence, we conduct safe explorations during the training process and improve the stability of the policy. The experiments show that our agents can achieve one-shot transfer across simulation scenarios and unseen realistic scenarios, finishing the field tests with average running time less than 10 ms/step and average lateral error less than 0.1 m under the speed ranging from 12 km/h to 18 km/h. A video of the field tests is available at https://youtu.be/pjWcN_fV24g .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Eager完成签到,获得积分10
1秒前
1秒前
隐形曼青应助端庄的越彬采纳,获得10
5秒前
7秒前
无限的盼秋完成签到,获得积分10
17秒前
YANGLan完成签到,获得积分10
18秒前
阿尼亚发布了新的文献求助10
19秒前
21秒前
22秒前
快乐的C发布了新的文献求助10
24秒前
fpbovo发布了新的文献求助10
28秒前
周晴完成签到 ,获得积分10
29秒前
楠楠2001完成签到 ,获得积分10
30秒前
32秒前
lazysheep完成签到,获得积分10
42秒前
fox2shj完成签到,获得积分10
42秒前
47秒前
48秒前
阿恺发布了新的文献求助10
52秒前
思源应助DarrenVan采纳,获得10
58秒前
希望天下0贩的0应助阿恺采纳,获得10
1分钟前
霸气的亿先完成签到 ,获得积分10
1分钟前
阿尼亚发布了新的文献求助10
1分钟前
。。。完成签到 ,获得积分10
1分钟前
1分钟前
俊逸尔风完成签到 ,获得积分10
1分钟前
缓慢的凝云完成签到,获得积分10
1分钟前
研友_8y2o0L发布了新的文献求助10
1分钟前
机智的小羊尾完成签到 ,获得积分10
1分钟前
研友_8y2o0L完成签到,获得积分10
1分钟前
Owen应助伴霞采纳,获得10
1分钟前
科目三应助科研通管家采纳,获得10
1分钟前
1分钟前
桐桐应助研友_LMBPXn采纳,获得30
1分钟前
gy完成签到,获得积分10
1分钟前
1分钟前
九日橙完成签到 ,获得积分10
1分钟前
勤奋的灯完成签到 ,获得积分10
1分钟前
清风浮云完成签到,获得积分10
1分钟前
1分钟前
高分求助中
Kinetics of the Esterification Between 2-[(4-hydroxybutoxy)carbonyl] Benzoic Acid with 1,4-Butanediol: Tetrabutyl Orthotitanate as Catalyst 1000
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
Rechtsphilosophie 1000
Handbook of Qualitative Cross-Cultural Research Methods 600
Chen Hansheng: China’s Last Romantic Revolutionary 500
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 500
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3139490
求助须知:如何正确求助?哪些是违规求助? 2790349
关于积分的说明 7795082
捐赠科研通 2446818
什么是DOI,文献DOI怎么找? 1301448
科研通“疑难数据库(出版商)”最低求助积分说明 626238
版权声明 601146