Reinforcement Learning Control of Hypersonic Vehicles and Performance Evaluations

强化学习 钢筋 高超音速 计算机科学 控制(管理) 航空学 航空航天工程 高超音速飞行 工程类 人工智能 结构工程
作者
Brent Wallace,Jennie Si
出处
期刊:Journal of Guidance Control and Dynamics [American Institute of Aeronautics and Astronautics]
卷期号:: 1-14
标识
DOI:10.2514/1.g008225
摘要

This work presents a new framework for model-based continuous-time reinforcement learning (CT-RL) control of hypersonic vehicles (HSVs). The predominant classes of CT-RL methods for general nonlinear systems in adaptive dynamic programming (ADP) and deep RL tend to either present substantial theoretical results but lack practical synthesis capability (ADP) or show empirical promise without offering theoretical guarantees (deep RL). Meanwhile, RL control frameworks developed directly for HSVs tend to require a simplified model and complicated control structure, and they lack the substantial numerical evaluations essential for real-world flight implementation. To directly address these challenges, we propose a new decentralized excitable integral reinforcement learning framework within which the reference input-based exploration improves persistence of excitation. Together with new insights on prescaling and established decentralized control structure for HSVs, we demonstrate the resulting controller for significant performance improvement over classical Linear Quadratic Regulator (LQR) and feedback linearization methods. Additionally, we provide convergence, optimality, and closed-loop stability guarantees of the proposed method. We demonstrate these performance guarantees over a set of substantial and systematic numerical evaluations on an unstable, nonminimum phase HSV model subject to varying modeling errors and initial conditions.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
1秒前
彭于晏应助冷语采纳,获得10
1秒前
三日发布了新的文献求助10
1秒前
哈哈发布了新的文献求助10
1秒前
领导范儿应助曾经高跟鞋采纳,获得10
2秒前
2秒前
核桃应助可可采纳,获得10
2秒前
gszyxyrxj完成签到,获得积分20
2秒前
双楠发布了新的文献求助10
2秒前
冰奈铁完成签到,获得积分20
2秒前
迷人的又夏完成签到,获得积分10
4秒前
4秒前
pluto应助王一帆采纳,获得10
4秒前
zzx发布了新的文献求助10
5秒前
橘子汽水和蛋糕完成签到,获得积分10
5秒前
欣慰的剑鬼完成签到,获得积分10
5秒前
冰奈铁发布了新的文献求助30
5秒前
使劲儿看文献完成签到,获得积分10
7秒前
科研小虫发布了新的文献求助10
7秒前
大模型应助背后梦安采纳,获得10
7秒前
8秒前
8秒前
胖墩完成签到,获得积分10
8秒前
8秒前
勤奋的小伙完成签到,获得积分10
8秒前
9秒前
9秒前
Lucas应助威武的迎彤采纳,获得10
9秒前
叁拾肆完成签到,获得积分10
9秒前
chen关注了科研通微信公众号
9秒前
乐乐应助小不遛w采纳,获得10
10秒前
10秒前
哈哈哈完成签到,获得积分10
11秒前
量子星尘发布了新的文献求助10
11秒前
11秒前
yutou发布了新的文献求助10
11秒前
11秒前
12秒前
米里迷路发布了新的文献求助10
13秒前
高分求助中
The Mother of All Tableaux Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 2400
Ophthalmic Equipment Market by Devices(surgical: vitreorentinal,IOLs,OVDs,contact lens,RGP lens,backflush,diagnostic&monitoring:OCT,actorefractor,keratometer,tonometer,ophthalmoscpe,OVD), End User,Buying Criteria-Global Forecast to2029 2000
Optimal Transport: A Comprehensive Introduction to Modeling, Analysis, Simulation, Applications 800
Official Methods of Analysis of AOAC INTERNATIONAL 600
ACSM’s Guidelines for Exercise Testing and Prescription, 12th edition 588
T/CIET 1202-2025 可吸收再生氧化纤维素止血材料 500
Interpretation of Mass Spectra, Fourth Edition 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3954999
求助须知:如何正确求助?哪些是违规求助? 3501277
关于积分的说明 11102247
捐赠科研通 3231584
什么是DOI,文献DOI怎么找? 1786477
邀请新用户注册赠送积分活动 870090
科研通“疑难数据库(出版商)”最低求助积分说明 801798