已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Determining Optimal Conflict Avoidance Manoeuvres At High Densities With Reinforcement Learning

强化学习 计算机科学 无人机 职位(财务) 冲突解决 代表(政治) 人工智能 弹道 控制理论(社会学) 数学优化 数学 控制(管理) 经济 生物 法学 物理 政治 天文 遗传学 政治学 财务
作者
Marta Ribeiro,Joost Ellerbroek,Jacco Hoekstra
摘要

The use of drones for applications such as package delivery, in an urban setting, would result in traffic densities that are orders of magnitude higher than any observed in manned aviation. Current geometric resolution models have proven to be very efficient at relatively moderate densities. However, at higher densities, performance is hindered by the unpredictable emergent behaviour from neighbouring aircraft. In this paper, we use a hybrid solution between existing geometric resolution approaches and reinforcement learning (RL), directed at improving conflict resolution performance at high densities. We resort to a Deep Deterministic Policy Gradient (DDPG) model to improve the behaviour of the Modified Voltage Potential (MVP) geometric conflict resolution method. By default, the MVP method generates avoidance manoeuvres of a geometrically-defined type, using a fixed look-ahead time. In the current study, we instead aim to use RL to determine the values for these variables, based on intruder position and traffic density. The analysis in this paper specifically addresses the difficulty of training algorithms in a cooperative multi-agent case to converge to optimal values. We prove that finding the right representation of state/rewards in a nonstationary environment is non-trivial and highly influences the learning process. Finally, we show that a variation of resolution manoeuvres can improve the safety of several scenarios at high traffic densities.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
pipichang发布了新的文献求助10
2秒前
卧镁铀钳完成签到 ,获得积分10
3秒前
5秒前
6秒前
Annabelle完成签到,获得积分10
8秒前
10秒前
whisper发布了新的文献求助10
10秒前
文子完成签到 ,获得积分10
11秒前
H_不甜也是糖完成签到 ,获得积分10
11秒前
感动笑完成签到,获得积分10
13秒前
15秒前
早茶可口完成签到,获得积分10
18秒前
whisper完成签到,获得积分10
19秒前
沧笙踏歌应助感动笑采纳,获得10
19秒前
脑洞疼应助霸气的金鱼采纳,获得10
19秒前
kk发布了新的文献求助10
20秒前
栀夏完成签到,获得积分10
23秒前
23秒前
文玉梅完成签到,获得积分10
23秒前
25秒前
霸气的金鱼完成签到,获得积分10
25秒前
26秒前
PAD驳回了Lucas应助
28秒前
linkman发布了新的文献求助10
29秒前
30秒前
31秒前
31秒前
慕青应助科研进化中采纳,获得10
35秒前
35秒前
张大英关注了科研通微信公众号
36秒前
含蓄问安发布了新的文献求助10
36秒前
36秒前
胡萝卜发布了新的文献求助10
38秒前
pipichang完成签到,获得积分10
38秒前
有点鸭梨呀完成签到 ,获得积分10
39秒前
39秒前
40秒前
nnl完成签到,获得积分20
40秒前
袁咏琳冲冲冲完成签到,获得积分10
40秒前
WilliamJarvis完成签到 ,获得积分10
42秒前
高分求助中
Ophthalmic Equipment Market by Devices(surgical: vitreorentinal,IOLs,OVDs,contact lens,RGP lens,backflush,diagnostic&monitoring:OCT,actorefractor,keratometer,tonometer,ophthalmoscpe,OVD), End User,Buying Criteria-Global Forecast to2029 2000
A new approach to the extrapolation of accelerated life test data 1000
Cognitive Neuroscience: The Biology of the Mind 1000
Technical Brochure TB 814: LPIT applications in HV gas insulated switchgear 1000
Immigrant Incorporation in East Asian Democracies 500
Nucleophilic substitution in azasydnone-modified dinitroanisoles 500
不知道标题是什么 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3965509
求助须知:如何正确求助?哪些是违规求助? 3510811
关于积分的说明 11155154
捐赠科研通 3245323
什么是DOI,文献DOI怎么找? 1792783
邀请新用户注册赠送积分活动 874096
科研通“疑难数据库(出版商)”最低求助积分说明 804176