清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Adaptive Optimal Control of Linear Discrete-Time Networked Control Systems with Two-Channel Stochastic Dropouts

代数Riccati方程 强化学习 离散时间和连续时间 随机逼近 数学 参数化复杂度 随机控制 数学优化 趋同(经济学) 网络数据包 贝尔曼方程 最优控制 控制理论(社会学) 马尔可夫决策过程 计算机科学 马尔可夫过程 Riccati方程 控制(管理) 算法 微分方程 数学分析 统计 人工智能 计算机网络 计算机安全 钥匙(锁) 经济增长 经济
作者
Yi Jiang,Weinan Gao,Ci Chen,Tianyou Chai,Frank L. Lewis
出处
期刊:Siam Journal on Control and Optimization [Society for Industrial and Applied Mathematics]
卷期号:61 (5): 3183-3208 被引量:4
标识
DOI:10.1137/21m1438797
摘要

.This paper investigates the adaptive optimal control problem and proposes fundamentally novel non-model-based approaches for linear discrete-time networked control systems (NCSs) with both sensor and actuator two-channel stochastic dropouts by using directly the data transmitted via communication networks. First, we formulate a modified algebraic Riccati equation parameterized by the system dynamics and the network-induced packet dropouts probabilities, whose solvability is related to a critical arrival probability. To deal with this problem, two model-based reinforcement learning algorithms, policy iteration (PI) and value iteration (VI), are designed with their convergence proofs. To enable the application for NCSs with unknown system dynamics, two novel online PI and VI algorithms are designed. These algorithms develop a new theoretical framework to solve the Bellman function with stochastic dropouts by using directly the data transmitted via networks. Furthermore, a bilevel learning algorithm is proposed to approximate the critical arrival probability. Last but not least, an extension of the developed online VI algorithm is presented for stochastic systems with both unmeasurable noises and stochastic dropouts.Keywordsreinforcement learningadaptive optimal controlmodified algebraic Riccati equationcommunication networksMSC codes65K0565P9968W2570L99
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
26秒前
1分钟前
1分钟前
江三村完成签到 ,获得积分10
1分钟前
2分钟前
2分钟前
zjuszk完成签到 ,获得积分10
2分钟前
firewood完成签到 ,获得积分10
3分钟前
yi完成签到,获得积分10
3分钟前
枫叶完成签到 ,获得积分10
4分钟前
打打应助搜嘎采纳,获得10
4分钟前
lili发布了新的文献求助10
4分钟前
宇文非笑完成签到 ,获得积分10
5分钟前
lili完成签到,获得积分0
5分钟前
jyy应助科研通管家采纳,获得100
5分钟前
无花果应助33采纳,获得10
5分钟前
6分钟前
搜嘎发布了新的文献求助10
6分钟前
6分钟前
李月完成签到 ,获得积分10
6分钟前
6分钟前
6分钟前
chen发布了新的文献求助30
6分钟前
chen完成签到,获得积分20
6分钟前
33完成签到,获得积分10
6分钟前
7分钟前
SciGPT应助子月之路采纳,获得10
7分钟前
7分钟前
lqy发布了新的文献求助10
7分钟前
7分钟前
lqy完成签到,获得积分20
7分钟前
搜集达人应助lqy采纳,获得10
7分钟前
Ava应助铲屎的采纳,获得10
9分钟前
Eric800824完成签到 ,获得积分10
9分钟前
9分钟前
9分钟前
moufei发布了新的文献求助10
11分钟前
11分钟前
子月之路发布了新的文献求助10
11分钟前
高分求助中
Impact of Mitophagy-Related Genes on the Diagnosis and Development of Esophageal Squamous Cell Carcinoma via Single-Cell RNA-seq Analysis and Machine Learning Algorithms 2000
How to Create Beauty: De Lairesse on the Theory and Practice of Making Art 1000
Gerard de Lairesse : an artist between stage and studio 670
大平正芳: 「戦後保守」とは何か 550
2019第三届中国LNG储运技术交流大会论文集 500
Contributo alla conoscenza del bifenile e dei suoi derivati. Nota XV. Passaggio dal sistema bifenilico a quello fluorenico 500
Multiscale Thermo-Hydro-Mechanics of Frozen Soil: Numerical Frameworks and Constitutive Models 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 2997818
求助须知:如何正确求助?哪些是违规求助? 2658323
关于积分的说明 7196063
捐赠科研通 2293661
什么是DOI,文献DOI怎么找? 1216250
科研通“疑难数据库(出版商)”最低求助积分说明 593513
版权声明 592877