已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Improved Reinforcement Learning through Imitation Learning Pretraining Towards Image-based Autonomous Driving

强化学习 计算机科学 杠杆(统计) 稳健性(进化) 人工智能 制动器 任务(项目管理) 工程类 汽车工程 生物化学 化学 系统工程 基因
作者
Tianqi Wang,Dong Eui Chang
标识
DOI:10.23919/iccas47443.2019.8971737
摘要

We present a training pipeline for the autonomous driving task given the current camera image and vehicle speed as the input to produce the throttle, brake, and steering control output. The simulator Airsim's [1] convenient weather and lighting API provides a sufficient diversity during training which can be very helpful to increase the trained policy's robustness. In order to not limit the possible policy's performance, we use a continuous and deterministic control policy setting. We utilize ResNet-34 [2] as our actor and critic networks with some slight changes in the fully connected layers. Considering human's mastery of this task and the high-complexity nature of this task, we first use imitation learning to mimic the given human policy and then leverage the trained policy and its weights to the reinforcement learning phase for which we use DDPG [3]. This combination shows a considerable performance boost comparing to both pure imitation learning and pure DDPG for the autonomous driving task.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
mm发布了新的文献求助10
刚刚
MrTStar完成签到 ,获得积分10
刚刚
1秒前
希望天下0贩的0应助一一采纳,获得10
2秒前
wonder123发布了新的文献求助10
4秒前
奇奇云发布了新的文献求助10
4秒前
4秒前
4秒前
怕黑乐完成签到,获得积分20
5秒前
9秒前
纯真忆安发布了新的文献求助10
9秒前
怕黑乐发布了新的文献求助10
11秒前
12秒前
12秒前
12秒前
脑洞疼应助科研通管家采纳,获得30
12秒前
科研通AI6应助科研通管家采纳,获得10
12秒前
12秒前
8R60d8应助科研通管家采纳,获得10
12秒前
12秒前
8R60d8应助科研通管家采纳,获得10
12秒前
科研通AI6应助科研通管家采纳,获得10
12秒前
酷波er应助科研通管家采纳,获得10
12秒前
糖糖发布了新的文献求助10
12秒前
Aaron567应助科研通管家采纳,获得20
12秒前
乐乐应助科研通管家采纳,获得10
12秒前
Jasper应助科研通管家采纳,获得10
12秒前
科研通AI6应助科研通管家采纳,获得10
13秒前
8R60d8应助科研通管家采纳,获得10
13秒前
科研通AI2S应助科研通管家采纳,获得10
13秒前
萨尼铁塔发布了新的文献求助10
13秒前
还没睡发布了新的文献求助10
13秒前
归尘发布了新的文献求助10
14秒前
乐乐应助风趣的凡采纳,获得10
14秒前
青羽发布了新的文献求助50
14秒前
上善若水发布了新的文献求助30
18秒前
Zero完成签到,获得积分10
23秒前
科研通AI6应助Savannah采纳,获得10
24秒前
可爱的函函应助段dwh采纳,获得10
25秒前
jimmyhui完成签到 ,获得积分10
25秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Forensic and Legal Medicine Third Edition 5000
Introduction to strong mixing conditions volume 1-3 5000
Aerospace Engineering Education During the First Century of Flight 3000
Agyptische Geschichte der 21.30. Dynastie 3000
Les Mantodea de guyane 2000
Electron Energy Loss Spectroscopy 1500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5779070
求助须知:如何正确求助?哪些是违规求助? 5645586
关于积分的说明 15451137
捐赠科研通 4910574
什么是DOI,文献DOI怎么找? 2642735
邀请新用户注册赠送积分活动 1590426
关于科研通互助平台的介绍 1544793