已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

ETPNav: Evolving Topological Planning for Vision-Language Navigation in Continuous Environments

计算机科学 避障 人工智能 规划师 障碍物 人机交互 移动机器人导航 启发式 计算机视觉 运动规划 实时计算 移动机器人 机器人 机器人控制 政治学 法学
作者
Dong An,Hanqing Wang,Wenguan Wang,Zun Wang,Yan Huang,Keji He,Liang Wang
出处
期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence [Institute of Electrical and Electronics Engineers]
卷期号:: 1-16 被引量:19
标识
DOI:10.1109/tpami.2024.3386695
摘要

Vision-language navigation is a task that requires an agent to follow instructions to navigate in environments. It becomes increasingly crucial in the field of embodied AI, with potential applications in autonomous navigation, search and rescue, and human-robot interaction. In this paper, we propose to address a more practical yet challenging counterpart setting - vision-language navigation in continuous environments (VLN-CE). To develop a robust VLN-CE agent, we propose a new navigation framework, ETPNav, which focuses on two critical skills: 1) the capability to abstract environments and generate long-range navigation plans, and 2) the ability of obstacle-avoiding control in continuous environments. ETPNav performs online topological mapping of environments by self-organizing predicted waypoints along a traversed path, without prior environmental experience. It privileges the agent to break down the navigation procedure into high-level planning and low-level control. Concurrently, ETPNav utilizes a transformer-based cross-modal planner to generate navigation plans based on topological maps and instructions. The plan is then performed through an obstacle-avoiding controller that leverages a trial-and-error heuristic to prevent navigation from getting stuck in obstacles. Experimental results demonstrate the effectiveness of the proposed method. ETPNav yields more than 10% and 20% improvements over prior state-of-the-art on R2R-CE and RxR-CE datasets, respectively. Our code is available at https://github.com/MarSaKi/ETPNav .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
糯米椰完成签到,获得积分10
刚刚
时光如梭发布了新的文献求助10
3秒前
现代凡发布了新的文献求助30
4秒前
De_Frank123发布了新的文献求助10
4秒前
lalala完成签到,获得积分10
6秒前
7秒前
8秒前
NMZN发布了新的文献求助10
11秒前
Cassiel发布了新的文献求助30
11秒前
迟大猫应助卢西奥采纳,获得10
12秒前
时光如梭发布了新的文献求助10
13秒前
15秒前
Dr.c发布了新的文献求助10
15秒前
彼其于岸完成签到,获得积分10
16秒前
天天快乐应助阔达碧空采纳,获得10
17秒前
李爱国应助菜菜子采纳,获得10
17秒前
17秒前
18秒前
19秒前
April完成签到,获得积分20
19秒前
20秒前
深情安青应助落后易绿采纳,获得10
20秒前
科研通AI5应助牛马人采纳,获得10
21秒前
你猜发布了新的文献求助10
23秒前
24秒前
xhy发布了新的文献求助10
24秒前
天天快乐应助Dr.c采纳,获得10
24秒前
科研通AI5应助细心弱采纳,获得30
24秒前
维生素完成签到,获得积分10
26秒前
汤姆发布了新的文献求助10
27秒前
xyhz2019完成签到,获得积分10
28秒前
大模型应助sun采纳,获得10
29秒前
29秒前
30秒前
31秒前
31秒前
32秒前
温偏烫发布了新的文献求助20
33秒前
时光如梭发布了新的文献求助10
34秒前
34秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
1.3μm GaAs基InAs量子点材料生长及器件应用 1000
Ensartinib (Ensacove) for Non-Small Cell Lung Cancer 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
Bacterial collagenases and their clinical applications 800
El viaje de una vida: Memorias de María Lecea 800
Luis Lacasa - Sobre esto y aquello 700
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3526247
求助须知:如何正确求助?哪些是违规求助? 3106663
关于积分的说明 9281184
捐赠科研通 2804184
什么是DOI,文献DOI怎么找? 1539352
邀请新用户注册赠送积分活动 716529
科研通“疑难数据库(出版商)”最低求助积分说明 709495