Autonomous Navigation of UAVs in Large-Scale Complex Environments: A Deep Reinforcement Learning Approach

部分可观测马尔可夫决策过程 强化学习 马尔可夫决策过程 计算机科学 比例(比率) 过程(计算) 人工智能 国家(计算机科学) 遥控水下航行器 马尔可夫过程 实时计算 移动机器人 机器学习 马尔可夫链 机器人 马尔可夫模型 算法 物理 数学 操作系统 统计 量子力学
作者
Chao Wang,Jian Wang,Yuan Shen,Xudong Zhang
出处
期刊:IEEE Transactions on Vehicular Technology [Institute of Electrical and Electronics Engineers]
卷期号:68 (3): 2124-2136 被引量:293
标识
DOI:10.1109/tvt.2018.2890773
摘要

In this paper, we propose a deep reinforcement learning (DRL)-based method that allows unmanned aerial vehicles (UAVs) to execute navigation tasks in large-scale complex environments. This technique is important for many applications such as goods delivery and remote surveillance. The problem is formulated as a partially observable Markov decision process (POMDP) and solved by a novel online DRL algorithm designed based on two strictly proved policy gradient theorems within the actor-critic framework. In contrast to conventional simultaneous localization and mapping-based or sensing and avoidance-based approaches, our method directly maps UAVs' raw sensory measurements into control signals for navigation. Experiment results demonstrate that our method can enable UAVs to autonomously perform navigation in a virtual large-scale complex environment and can be generalized to more complex, larger-scale, and three-dimensional environments. Besides, the proposed online DRL algorithm addressing POMDPs outperforms the state-of-the-art.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
3秒前
3秒前
4秒前
5秒前
河里蹿发布了新的文献求助10
5秒前
小菡菡完成签到,获得积分10
5秒前
Sunnig盈发布了新的文献求助10
6秒前
mmccc1完成签到,获得积分10
6秒前
6秒前
7秒前
CJPerformance发布了新的文献求助10
9秒前
9秒前
乾巧发布了新的文献求助10
10秒前
虚幻安容完成签到 ,获得积分10
10秒前
完美世界应助明理不乐采纳,获得10
11秒前
林献发布了新的文献求助10
13秒前
唐博凡完成签到,获得积分10
14秒前
不倦发布了新的文献求助10
14秒前
14秒前
15秒前
NexusExplorer应助lmhytr采纳,获得10
16秒前
CJPerformance完成签到,获得积分10
17秒前
Akim应助可爱的汽车采纳,获得10
17秒前
18秒前
Josh发布了新的文献求助10
19秒前
21秒前
无情秋天完成签到 ,获得积分10
22秒前
22秒前
英吉利25发布了新的文献求助10
23秒前
麦苗果果发布了新的文献求助10
23秒前
李健的小迷弟应助乾巧采纳,获得10
23秒前
笑点低硬币完成签到,获得积分10
24秒前
24秒前
Yzy完成签到,获得积分20
24秒前
26秒前
明理不乐发布了新的文献求助10
27秒前
27秒前
wq发布了新的文献求助10
28秒前
思源应助jdccc采纳,获得30
28秒前
高分求助中
Signals, Systems, and Signal Processing 610
Annie Ernaux: De la perte au corps glorieux 600
Petrology and Plate Tectonics,2025 500
Circular Polar Constellations Providing Continuous Single or Multiple Coverage Above a Specified Latitude 400
Burger's Medicinal Chemistry and Drug Discovery 400
Probability and Stochastic Processes 333
New directions for experimental lessons in science teaching: Myth, Mystery, Necessity? by Emily K. da Silva Cunha Souto (Author), Flávia Lins Silva (Author) 333
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6742762
求助须知:如何正确求助?哪些是违规求助? 8473912
关于积分的说明 18075779
捐赠科研通 6012453
什么是DOI,文献DOI怎么找? 3003900
邀请新用户注册赠送积分活动 1980422
关于科研通互助平台的介绍 1945325