A UAV Path Planning Method in Three-Dimensional Urban Airspace based on Safe Reinforcement Learning

强化学习 计算机科学 运动规划 路径(计算) 功能(生物学) 数学优化 模拟 实时计算 人工智能 数学 计算机网络 进化生物学 生物 机器人
作者
Yan Li,Xuejun Zhang,Yuanjun Zhu,Ziang Gao
标识
DOI:10.1109/dasc58513.2023.10311219
摘要

Under the demand of urban terminal "Last Mile Delivery" scenario, finding a safe and efficient UAV path planning method is a crucial issue of current research. Nowadays, reinforcement learning is widely used in UAV path planning, but it is difficult to ensure the safety of the learning or execution phases due to the lack of hard constraints. Aiming at the constraints above, this paper studies how to combine safety properties with RL algorithm to find a safe path and proposes a safe reinforcement learning method called Shield-DDPG for UAV path planning. In the method, a protection mechanism Shield is mainly introduced to prevent the algorithm from outputting unsafe actions. Further, the state space, action space, and reward function are specifically improved for efficiency and safety. Then we compare the Shield-DDPG algorithm with the DDPG and RRT algorithm in some different scenarios, and the results show that the proposed algorithm has a better performance. With the proposed path planning method, UAV can learn well to efficiently and safely reach the destination via calling the trained policy. This research is of great importance to UAV operations and practical applications in complex urban airspace.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
初色完成签到,获得积分10
1秒前
szmsnail完成签到,获得积分10
1秒前
小程同学完成签到,获得积分10
2秒前
hhh发布了新的文献求助10
4秒前
7秒前
磁控达人发布了新的文献求助10
9秒前
xiao牛发布了新的文献求助10
11秒前
斯文败类应助dream采纳,获得10
11秒前
冷傲机器猫完成签到,获得积分10
13秒前
16秒前
科研通AI2S应助VvV采纳,获得10
20秒前
Owen应助轩轩好厉害采纳,获得10
20秒前
莲藕发布了新的文献求助10
21秒前
21秒前
21秒前
吕吕完成签到 ,获得积分10
22秒前
土豆国王发布了新的文献求助30
24秒前
25秒前
1111111发布了新的文献求助10
27秒前
自然松完成签到 ,获得积分10
28秒前
爱意都在发布了新的文献求助10
31秒前
彳亍发布了新的文献求助10
31秒前
Yifan2024应助救驾来迟采纳,获得10
34秒前
34秒前
bkagyin应助zhangsudi采纳,获得30
35秒前
山之宗完成签到,获得积分0
38秒前
xxx发布了新的文献求助10
39秒前
41秒前
CodeCraft应助lochi采纳,获得10
45秒前
寒冷的水桃完成签到 ,获得积分20
46秒前
luni360完成签到,获得积分10
46秒前
胖Q完成签到 ,获得积分20
46秒前
47秒前
47秒前
kirin发布了新的文献求助10
47秒前
桃桃发布了新的文献求助10
48秒前
思源应助逃亡的小狗采纳,获得10
48秒前
格格巫完成签到 ,获得积分10
49秒前
zhangsudi发布了新的文献求助30
50秒前
51秒前
高分求助中
Востребованный временем 2500
The Three Stars Each: The Astrolabes and Related Texts 1000
Les Mantodea de Guyane 800
Mantids of the euro-mediterranean area 700
Plate Tectonics 500
Igneous rocks and processes: a practical guide(第二版) 500
Mantodea of the World: Species Catalog 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3407477
求助须知:如何正确求助?哪些是违规求助? 3012021
关于积分的说明 8852179
捐赠科研通 2699156
什么是DOI,文献DOI怎么找? 1479876
科研通“疑难数据库(出版商)”最低求助积分说明 684054
邀请新用户注册赠送积分活动 678339