清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Integrating big data analytics in autonomous driving: An unsupervised hierarchical reinforcement learning approach

强化学习 大数据 无监督学习 计算机科学 分析 数据分析 数据科学 人工智能 机器学习 数据挖掘
作者
Zhiqi Mao,Liu Yang,Xiaobo Qu
出处
期刊:Transportation Research Part C-emerging Technologies [Elsevier]
卷期号:162: 104606-104606 被引量:5
标识
DOI:10.1016/j.trc.2024.104606
摘要

In the realm of autonomous vehicular systems, there has been a notable increase in end-to-end algorithms designed for complete self-navigation. Researchers are increasingly applying hierarchical reinforcement learning to autonomous driving tasks to address the rising challenges. This study proposes a novel hierarchical reinforcement learning approach that facilitates the training of sub-networks without the need for manual reward design. First, unsupervised reinforcement learning is used to train skills without predefined rewards. These skills are subsequently integrated as sub-policies in the hierarchical reinforcement learning framework to train the meta-controller, which synthesizes these skills to autonomously execute driving tasks in complex scenarios. This training strategy encapsulates the accumulated knowledge into skills, enhancing the transferability and efficiency of learning for similar tasks compared to traditional reinforcement learning methods. Additionally, compared with general hierarchical reinforcement learning, this method does not need to design rewards for each sub-policy, allowing for an indefinite expansion of diverse sub-strategies, which may potentially yield superior performance in a range of tasks.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
muriel完成签到,获得积分10
6秒前
畅快沁完成签到,获得积分10
19秒前
25秒前
31秒前
31秒前
twk发布了新的文献求助10
35秒前
twk完成签到,获得积分10
43秒前
小西完成签到 ,获得积分10
57秒前
疯狂的易真关注了科研通微信公众号
58秒前
铲一口美羊羊完成签到 ,获得积分10
59秒前
万崽秋秋糖完成签到 ,获得积分10
1分钟前
1分钟前
Crystal完成签到 ,获得积分10
2分钟前
艺霖大王完成签到 ,获得积分10
3分钟前
xiazhq完成签到,获得积分10
3分钟前
土豪的土豆完成签到 ,获得积分10
3分钟前
桐桐应助YUNJIE采纳,获得10
3分钟前
汉堡包应助miujin采纳,获得10
4分钟前
DrN完成签到 ,获得积分10
4分钟前
自然涵易完成签到,获得积分10
4分钟前
YuLu完成签到 ,获得积分10
4分钟前
圆规完成签到,获得积分10
4分钟前
wlh完成签到,获得积分10
4分钟前
5分钟前
6分钟前
逐影发布了新的文献求助10
6分钟前
haralee完成签到 ,获得积分10
6分钟前
7分钟前
Alan发布了新的文献求助10
7分钟前
科研通AI5应助diqiu采纳,获得10
7分钟前
7分钟前
7分钟前
情怀应助summer采纳,获得10
8分钟前
方白秋完成签到,获得积分10
9分钟前
郭郭摊手文章急救完成签到,获得积分20
9分钟前
留下记忆完成签到 ,获得积分10
9分钟前
1437594843完成签到 ,获得积分10
9分钟前
Carol_Wang完成签到,获得积分10
9分钟前
斯文的难破完成签到 ,获得积分10
9分钟前
joe完成签到 ,获得积分0
10分钟前
高分求助中
Continuum Thermodynamics and Material Modelling 4000
Production Logging: Theoretical and Interpretive Elements 2700
Les Mantodea de Guyane Insecta, Polyneoptera 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
El viaje de una vida: Memorias de María Lecea 800
Theory of Block Polymer Self-Assembly 750
Luis Lacasa - Sobre esto y aquello 700
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3510739
求助须知:如何正确求助?哪些是违规求助? 3093572
关于积分的说明 9217389
捐赠科研通 2787802
什么是DOI,文献DOI怎么找? 1529946
邀请新用户注册赠送积分活动 710626
科研通“疑难数据库(出版商)”最低求助积分说明 706268