Iterative Q-Learning for Model-Free Optimal Control With Adjustable Convergence Rate

趋同(经济学) 放松(心理学) 迭代学习控制 收敛速度 非线性系统 计算机科学 方案(数学) 功能(生物学) 控制理论(社会学) 数学优化 应用数学 数学 控制(管理) 人工智能 数学分析 钥匙(锁) 物理 社会心理学 经济 生物 进化生物学 量子力学 经济增长 计算机安全 心理学
作者
Ding Wang,Yuan Wang,Mingming Zhao,Junfei Qiao
出处
期刊:IEEE Transactions on Circuits and Systems Ii-express Briefs [Institute of Electrical and Electronics Engineers]
卷期号:71 (4): 2224-2228 被引量:1
标识
DOI:10.1109/tcsii.2023.3339577
摘要

In this paper, a novel accelerated Q-learning algorithm is developed to address optimal control problems for discrete-time nonlinear systems. First, the accelerated Q-learning scheme is proposed by introducing the relaxation factor. Note that the relaxation factor leads to the adjustability of the convergence rate. Second, the convergence of the Q-function is analyzed with different relaxation factors. Third, the adjustable Q-learning scheme is developed with guaranteed convergence, which can adaptively change the value of the relaxation factor. Finally, the simulation results demonstrate the effectiveness of this proposed algorithm.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
kekemu完成签到 ,获得积分10
刚刚
刚刚
一只猪发布了新的文献求助10
1秒前
畅小狮发布了新的文献求助10
1秒前
Owen应助周末万岁采纳,获得30
2秒前
华仔应助大气早晨采纳,获得10
2秒前
2秒前
MooN发布了新的文献求助10
3秒前
3秒前
如意的新蕾完成签到 ,获得积分10
3秒前
Ava应助阿耒采纳,获得10
3秒前
李闻闻发布了新的文献求助10
4秒前
小孟完成签到,获得积分10
6秒前
7秒前
7秒前
7秒前
喜欢小怿完成签到,获得积分10
8秒前
9秒前
自由盼夏完成签到 ,获得积分10
9秒前
12秒前
顾矜应助洁净思枫采纳,获得30
13秒前
深情安青应助大气早晨采纳,获得10
14秒前
dr_ani完成签到,获得积分20
14秒前
充电宝应助木薯采纳,获得10
19秒前
干净的琦应助乌拉拉采纳,获得20
21秒前
含糊的骁完成签到,获得积分20
21秒前
22秒前
cxmy完成签到,获得积分10
23秒前
英姑应助dr_ani采纳,获得10
23秒前
鸟兽兽应助cmuzf采纳,获得10
23秒前
爆米花应助科研通管家采纳,获得10
24秒前
arniu2008应助科研通管家采纳,获得60
24秒前
24秒前
酷波er应助科研通管家采纳,获得10
24秒前
大模型应助科研通管家采纳,获得10
24秒前
情怀应助科研通管家采纳,获得10
24秒前
小巧的乌应助科研通管家采纳,获得10
24秒前
香蕉觅云应助科研通管家采纳,获得10
24秒前
Alex给Alex的求助进行了留言
24秒前
小巧的乌应助科研通管家采纳,获得10
24秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
AnnualResearch andConsultation Report of Panorama survey and Investment strategy onChinaIndustry 1000
Continuing Syntax 1000
Signals, Systems, and Signal Processing 610
简明药物化学习题答案 500
Quasi-Interpolation 400
脑电大模型与情感脑机接口研究--郑伟龙 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6275362
求助须知:如何正确求助?哪些是违规求助? 8095189
关于积分的说明 16922332
捐赠科研通 5345271
什么是DOI,文献DOI怎么找? 2841927
邀请新用户注册赠送积分活动 1819147
关于科研通互助平台的介绍 1676404