亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Output feedback Q-learning for discrete-time finite-horizon zero-sum games with application to the H∞ control

背景(考古学) 地平线 国家(计算机科学) 功能(生物学) 零和博弈 零(语言学) 计算机科学 最优控制 应用数学 数学 算法 数学优化 纳什均衡 生物 进化生物学 哲学 古生物学 语言学 几何学
作者
Mingxiang Liu,Qianqian Cai,Dandan Li,Wei Meng,Minyue Fu
出处
期刊:Neurocomputing [Elsevier]
卷期号:529: 48-55 被引量:3
标识
DOI:10.1016/j.neucom.2023.01.050
摘要

In this paper, we present a Q-learning framework for solving finite-horizon zero-sum game problems involving the H∞ control of linear system without knowing the dynamics. Research in the past mainly focused on solving problems in infinite horizon with completely measurable state. However, in the practical engineering, the system state is not always directly accessible, and it is difficult to solve the time-varying Riccati equation associated with the finite-horizon setting directly either. The main contribution of the proposed model-free algorithm is to determine the optimal output feedback policies without measurement state in finite-horizon setting. To achieve this goal, we first describe the Q-function caused by finite-horizon problems in the context of state feedback, then we parameterize the Q-functions as input–output vectors functions. Finally, the numerical examples on aircraft dynamics demonstrate the algorithm's efficiency.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
露露完成签到,获得积分10
1分钟前
houha233发布了新的文献求助10
1分钟前
1分钟前
宁异勿同完成签到,获得积分10
1分钟前
1分钟前
科研通AI2S应助踏实的芸遥采纳,获得30
2分钟前
2分钟前
2分钟前
poki完成签到 ,获得积分10
2分钟前
zz发布了新的文献求助10
2分钟前
3分钟前
3分钟前
houha233完成签到,获得积分10
3分钟前
4分钟前
xuhanghang发布了新的文献求助10
4分钟前
空曲完成签到 ,获得积分10
6分钟前
7分钟前
大模型应助zz采纳,获得10
7分钟前
木森ab发布了新的文献求助10
7分钟前
JamesPei应助木森ab采纳,获得10
7分钟前
木森ab完成签到,获得积分20
7分钟前
朱朱完成签到,获得积分10
8分钟前
大个应助朱朱采纳,获得10
8分钟前
April完成签到 ,获得积分10
9分钟前
古炮完成签到 ,获得积分10
11分钟前
香蕉觅云应助Zephyr采纳,获得30
12分钟前
13分钟前
hhhhhhhhhh完成签到 ,获得积分10
13分钟前
小巧的柏柳完成签到 ,获得积分10
14分钟前
Setlla完成签到 ,获得积分10
14分钟前
Aries完成签到 ,获得积分10
14分钟前
研友_VZG7GZ应助lik采纳,获得10
14分钟前
Zephyr发布了新的文献求助30
14分钟前
15分钟前
15分钟前
小巫发布了新的文献求助10
15分钟前
15分钟前
zz发布了新的文献求助10
15分钟前
zz完成签到,获得积分10
15分钟前
重生之我怎么变院士了完成签到 ,获得积分10
15分钟前
高分求助中
The Oxford Handbook of Social Cognition (Second Edition, 2024) 1050
Kinetics of the Esterification Between 2-[(4-hydroxybutoxy)carbonyl] Benzoic Acid with 1,4-Butanediol: Tetrabutyl Orthotitanate as Catalyst 1000
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
Rechtsphilosophie 1000
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
Handbook of Qualitative Cross-Cultural Research Methods 600
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3139600
求助须知:如何正确求助?哪些是违规求助? 2790479
关于积分的说明 7795340
捐赠科研通 2446926
什么是DOI,文献DOI怎么找? 1301511
科研通“疑难数据库(出版商)”最低求助积分说明 626259
版权声明 601176