Output feedback Q-learning for discrete-time finite-horizon zero-sum games with application to the H∞ control

背景(考古学) 地平线 国家(计算机科学) 功能(生物学) 零和博弈 零(语言学) 计算机科学 最优控制 应用数学 数学 算法 数学优化 纳什均衡 生物 进化生物学 哲学 古生物学 语言学 几何学
作者
Mingxiang Liu,Qianqian Cai,Dandan Li,Wei Meng,Minyue Fu
出处
期刊:Neurocomputing [Elsevier]
卷期号:529: 48-55 被引量:3
标识
DOI:10.1016/j.neucom.2023.01.050
摘要

In this paper, we present a Q-learning framework for solving finite-horizon zero-sum game problems involving the H∞ control of linear system without knowing the dynamics. Research in the past mainly focused on solving problems in infinite horizon with completely measurable state. However, in the practical engineering, the system state is not always directly accessible, and it is difficult to solve the time-varying Riccati equation associated with the finite-horizon setting directly either. The main contribution of the proposed model-free algorithm is to determine the optimal output feedback policies without measurement state in finite-horizon setting. To achieve this goal, we first describe the Q-function caused by finite-horizon problems in the context of state feedback, then we parameterize the Q-functions as input–output vectors functions. Finally, the numerical examples on aircraft dynamics demonstrate the algorithm's efficiency.

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
zz完成签到,获得积分10
3秒前
孙刚完成签到 ,获得积分10
4秒前
Wguan完成签到,获得积分10
7秒前
10秒前
11秒前
11秒前
11秒前
11秒前
11秒前
11秒前
11秒前
11秒前
11秒前
11秒前
SciGPT应助科研通管家采纳,获得30
12秒前
terry完成签到 ,获得积分10
16秒前
舒心的雍发布了新的文献求助10
18秒前
孙非完成签到,获得积分10
19秒前
Jasper应助2022H采纳,获得10
28秒前
30秒前
谭朵朵发布了新的文献求助10
35秒前
DangJL完成签到,获得积分10
38秒前
42秒前
唯博完成签到 ,获得积分10
42秒前
包子凯越完成签到,获得积分10
45秒前
46秒前
hui完成签到 ,获得积分10
47秒前
情怀应助谭朵朵采纳,获得10
49秒前
AAAAA发布了新的文献求助10
50秒前
Summer完成签到 ,获得积分10
55秒前
Jackcaosky完成签到 ,获得积分10
57秒前
57秒前
59秒前
小陈发布了新的文献求助10
1分钟前
谭朵朵完成签到,获得积分10
1分钟前
qqq发布了新的文献求助10
1分钟前
1分钟前
2022H发布了新的文献求助10
1分钟前
程昱完成签到 ,获得积分10
1分钟前
锦葵科的棉花完成签到,获得积分10
1分钟前
高分求助中
Yangtze Reminiscences. Some Notes And Recollections Of Service With The China Navigation Company Ltd., 1925-1939 800
Common Foundations of American and East Asian Modernisation: From Alexander Hamilton to Junichero Koizumi 600
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
T/SNFSOC 0002—2025 独居石精矿碱法冶炼工艺技术标准 300
The Impact of Lease Accounting Standards on Lending and Investment Decisions 250
The Linearization Handbook for MILP Optimization: Modeling Tricks and Patterns for Practitioners (MILP Optimization Handbooks) 200
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5852038
求助须知:如何正确求助?哪些是违规求助? 6275378
关于积分的说明 15627594
捐赠科研通 4967959
什么是DOI,文献DOI怎么找? 2678844
邀请新用户注册赠送积分活动 1623076
关于科研通互助平台的介绍 1579499