已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

VLM-AD: End-to-End Autonomous Driving through Vision-Language Model Supervision

端到端原则 计算机科学 最终用户 计算机视觉 人工智能 万维网
作者
Yi Xu,Yuxin Hu,Zaiwei Zhang,Gregory P. Meyer,Siva Karthik Mustikovela,Siddhartha S Srinivasa,Eric M. Wolff,Xin Huang
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2412.14446
摘要

Human drivers rely on commonsense reasoning to navigate diverse and dynamic real-world scenarios. Existing end-to-end (E2E) autonomous driving (AD) models are typically optimized to mimic driving patterns observed in data, without capturing the underlying reasoning processes. This limitation constrains their ability to handle challenging driving scenarios. To close this gap, we propose VLM-AD, a method that leverages vision-language models (VLMs) as teachers to enhance training by providing additional supervision that incorporates unstructured reasoning information and structured action labels. Such supervision enhances the model's ability to learn richer feature representations that capture the rationale behind driving patterns. Importantly, our method does not require a VLM during inference, making it practical for real-time deployment. When integrated with state-of-the-art methods, VLM-AD achieves significant improvements in planning accuracy and reduced collision rates on the nuScenes dataset.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
tong童完成签到 ,获得积分10
刚刚
meow完成签到 ,获得积分10
1秒前
liugm发布了新的文献求助10
2秒前
wsh发布了新的文献求助10
3秒前
乐乐应助liwai采纳,获得10
4秒前
蒋22完成签到 ,获得积分10
5秒前
蘇q完成签到 ,获得积分10
6秒前
Shao_Jq完成签到 ,获得积分10
8秒前
吃茶去完成签到 ,获得积分10
8秒前
9秒前
雅典的宠儿完成签到 ,获得积分10
9秒前
10秒前
10秒前
此时此刻完成签到 ,获得积分10
10秒前
呆呆完成签到 ,获得积分10
13秒前
小脑斧完成签到 ,获得积分20
15秒前
zhouzhou发布了新的文献求助10
15秒前
FISH发布了新的文献求助10
15秒前
故槿完成签到 ,获得积分10
15秒前
徐per爱豆完成签到 ,获得积分10
16秒前
木质卷饼完成签到 ,获得积分10
16秒前
大黄完成签到 ,获得积分10
16秒前
att完成签到 ,获得积分10
17秒前
AXLL完成签到,获得积分10
20秒前
XYZ完成签到,获得积分10
21秒前
25秒前
小白完成签到 ,获得积分10
26秒前
顾良发布了新的文献求助10
27秒前
Schroenius完成签到 ,获得积分10
27秒前
牧笛完成签到,获得积分10
27秒前
淡然葶完成签到 ,获得积分10
30秒前
liwai发布了新的文献求助10
30秒前
ChY完成签到,获得积分20
30秒前
RWcreator完成签到 ,获得积分10
31秒前
ryanfeng完成签到,获得积分0
35秒前
lin完成签到,获得积分10
36秒前
38秒前
Lauren完成签到,获得积分10
40秒前
搜集达人应助FISH采纳,获得10
40秒前
油盐不进的四季豆完成签到 ,获得积分10
42秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 2000
Metallurgy at high pressures and high temperatures 2000
The SAGE Dictionary of Qualitative Inquiry 610
Signals, Systems, and Signal Processing 610
An Introduction to Medicinal Chemistry 第六版习题答案 600
应急管理理论与实践 530
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6339535
求助须知:如何正确求助?哪些是违规求助? 8154802
关于积分的说明 17134571
捐赠科研通 5394986
什么是DOI,文献DOI怎么找? 2858730
邀请新用户注册赠送积分活动 1836518
关于科研通互助平台的介绍 1686715