发布文献求助

Safety-Aware Pursuit-Evasion Games in Unknown Environments Using Gaussian Processes and Finite-Time Convergent Reinforcement Learning

追求者追逃强化学习计算机科学微分博弈适应（眼睛）数学优化逃避（道德）高斯分布高斯过程人工智能控制理论（社会学）数学控制（管理）光学物理生物量子力学免疫学免疫系统

作者

Nikolaos-Marios T. Kokolakis,Kyriakos G. Vamvoudakis

出处

期刊：IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
日期：2022-10-10 卷期号：35 (3): 3130-3143 被引量：14

链接

标识

DOI：10.1109/tnnls.2022.3203977

摘要

This article develops a safe pursuit-evasion game for enabling finite-time capture, optimal performance as well as adaptation to an unknown cluttered environment. The pursuit-evasion game is formulated as a zero-sum differential game wherein the pursuer seeks to minimize its relative distance to the target while the evader attempts to maximize it. A critic-only reinforcement learning (RL)-based algorithm is then proposed for learning online and in finite time the pursuit-evasion policies and thus enabling finite-time capture of the evader. Safety is ensured by means of barrier functions associated with the obstacles, which are integrated into the running cost. Using Gaussian processes (GPs), a learning-based mechanism is devised for safely learning the unknown environment. Simulation results illustrate the efficacy of the proposed approach.

求助该文献

最长约 10秒，即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: Lee发布了新的文献求助10

刚刚; 鱼柒完成签到，获得积分10

1秒前; 桐桐上传了应助文件

1秒前; SYLH的应助被满意的契采纳，获得10

1秒前; xx完成签到，获得积分10

1秒前; 泡泡鱼完成签到，获得积分10

1秒前; CipherSage上传了应助文件

2秒前; 爆米花的应助被默默月光采纳，获得10

2秒前; 绝不延毕完成签到，获得积分10

2秒前; 领导范儿的应助被邵恒采纳，获得10

3秒前; 朴素的书琴完成签到，获得积分20

3秒前; 超级李包包完成签到，获得积分10

3秒前; MeiLing完成签到，获得积分10

3秒前; xx发布了新的文献求助30

4秒前; 赘婿上传了应助文件

4秒前; 111完成签到，获得积分10

4秒前; Agernon的应助被柔弱的麦片采纳，获得10

5秒前; 山月鹿发布了新的文献求助10

6秒前; 调皮的勒完成签到，获得积分10

6秒前; cmq完成签到，获得积分10

6秒前; jzhou88完成签到，获得积分10

6秒前; dogsday完成签到，获得积分10

7秒前; CHyaa完成签到，获得积分10

7秒前; 学术小白发布了新的文献求助10

8秒前; xml发布了新的文献求助10

8秒前; 星辰大海的应助被雷半双采纳，获得10

8秒前; 无心的沉鱼发布了新的文献求助30

9秒前; lgold完成签到，获得积分10

9秒前; ldk完成签到，获得积分10

9秒前; 烟花上传了应助文件

9秒前; 缓慢如南上传了应助文件

9秒前; 甜美的瑾瑜完成签到，获得积分10

9秒前; 爱卿5271完成签到，获得积分10

10秒前; 田様上传了应助文件

11秒前; 在水一方的应助被wund采纳，获得10

12秒前; 某只橘猫君完成签到，获得积分10

12秒前; 年轻水风完成签到，获得积分20

12秒前; 一味地丶逞强完成签到，获得积分10

12秒前; 游艺完成签到，获得积分10

13秒前; 岂识浊醪妙理完成签到，获得积分10

13秒前

高分求助中: Continuum Thermodynamics and Material Modelling 3000; Production Logging: Theoretical and Interpretive Elements 2700; Mechanistic Modeling of Gas-Liquid Two-Phase Flow in Pipes 2500; Structural Load Modelling and Combination for Performance and Safety Evaluation 800; Conference Record, IAS Annual Meeting 1977 610; Virulence Mechanisms of Plant-Pathogenic Bacteria 500; 白土三平研究 500

热门求助领域（近24小时）

热门帖子: 关注科研通微信公众号，转发送积分 3556269; 求助须知：如何正确求助？哪些是违规求助？ 3131813; 关于积分的说明 9393417; 捐赠科研通 2831860; 什么是DOI，文献DOI怎么找？ 1556519; 邀请新用户注册赠送积分活动 726691; 科研通“疑难数据库（出版商）”最低求助积分说明 716012

今日热心研友

注：热心度 = 本日应助数 + 本日被采纳获取积分÷10

Copyright © 2020-2025 AbleSci.COM, 科研通, All Right Reserved

科研通是非营利科研互助平台，不忘初心，为科研助力

本站互助的所有文件仅供个人学习研究用，禁止任何人把求助的所得文献进行盈利或传播

皖ICP备2024041134号-1

皖公网安备34019202002308

科研通【文献互助QQ群】：如果您有特殊求助，或发布求助超过24小时未得到应助，可加群求助，群号：941272744【点击一键加群】

科研通【志愿服务QQ群】：如果您热爱文献互助，有热心愿意为更多人服务，请加入小伙伴群，点击申请加入

关注微信服务号

科研通