清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

A Selective Federated Reinforcement Learning Strategy for Autonomous Driving

强化学习 计算机科学 架空(工程) 适应性 重新使用 上传 声誉 质量(理念) 人工智能 分布式计算 工程类 生态学 社会科学 哲学 认识论 社会学 废物管理 生物 操作系统
作者
Yuchuan Fu,Changle Li,F. Richard Yu,Tom H. Luan,Yao Zhang
出处
期刊:IEEE Transactions on Intelligent Transportation Systems [Institute of Electrical and Electronics Engineers]
卷期号:: 1-14 被引量:39
标识
DOI:10.1109/tits.2022.3219644
摘要

Currently, the complex traffic environment challenges the fast and accurate response of a connected autonomous vehicle (CAV). More importantly, it is difficult for different CAVs to collaborate and share knowledge. To remedy that, this paper proposes a selective federated reinforcement learning (SFRL) strategy to achieve online knowledge aggregation strategy to improve the accuracy and environmental adaptability of the autonomous driving model. First, we propose a federated reinforcement learning framework that allows participants to use the knowledge of other CAVs to make corresponding actions, thereby realizing online knowledge transfer and aggregation. Second, we use reinforcement learning to train local driving models of CAVs to cope with collision avoidance tasks. Third, considering the efficiency of federated learning (FL) and the additional communication overhead it brings, we propose a CAVs selection strategy before uploading local models. When selecting CAVs, we consider the reputation of CAVs, the quality of local models, and time overhead, so as to select as many high-quality users as possible while considering resources and time constraints. With above strategic processes, our framework can aggregate and reuse the knowledge learned by CAVs traveling in different environments to assist in driving decisions. Extensive simulation results validate that our proposal can improve model accuracy and learning efficiency while reducing communication overhead.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
耍酷如柏发布了新的文献求助10
8秒前
cc完成签到,获得积分10
11秒前
zyp应助科研通管家采纳,获得10
15秒前
科研通AI2S应助科研通管家采纳,获得10
15秒前
16秒前
赘婿应助耍酷如柏采纳,获得10
27秒前
善学以致用应助梦里贪乐采纳,获得10
38秒前
科目三应助Omni采纳,获得10
40秒前
滕皓轩完成签到 ,获得积分10
43秒前
耍酷如柏完成签到,获得积分10
45秒前
桐桐应助xandyzoe采纳,获得10
1分钟前
1分钟前
1分钟前
dr0422完成签到 ,获得积分10
1分钟前
xandyzoe发布了新的文献求助10
1分钟前
Omni发布了新的文献求助10
1分钟前
2分钟前
梦里贪乐发布了新的文献求助10
2分钟前
zyp应助科研通管家采纳,获得20
2分钟前
青出于蓝蔡完成签到,获得积分10
2分钟前
xandyzoe完成签到,获得积分10
2分钟前
Lucas应助Omni采纳,获得10
3分钟前
Wei发布了新的文献求助10
3分钟前
3分钟前
3分钟前
Yesaniar发布了新的文献求助10
3分钟前
Haho发布了新的文献求助10
3分钟前
3分钟前
Wei发布了新的文献求助10
4分钟前
4分钟前
Omni发布了新的文献求助10
4分钟前
牛安荷完成签到 ,获得积分10
4分钟前
dm完成签到 ,获得积分10
4分钟前
4分钟前
lyao发布了新的文献求助10
4分钟前
连安阳完成签到,获得积分10
5分钟前
lyao完成签到,获得积分10
5分钟前
5分钟前
AEL发布了新的文献求助10
5分钟前
高分求助中
Continuum Thermodynamics and Material Modelling 4000
Production Logging: Theoretical and Interpretive Elements 2700
Ensartinib (Ensacove) for Non-Small Cell Lung Cancer 1000
Les Mantodea de Guyane Insecta, Polyneoptera 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
El viaje de una vida: Memorias de María Lecea 800
Luis Lacasa - Sobre esto y aquello 700
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3516380
求助须知:如何正确求助?哪些是违规求助? 3098637
关于积分的说明 9240225
捐赠科研通 2793747
什么是DOI,文献DOI怎么找? 1533239
邀请新用户注册赠送积分活动 712622
科研通“疑难数据库(出版商)”最低求助积分说明 707387