Model-free optimal vibration control of a nonlinear system based on deep reinforcement learning

强化学习 非线性系统 控制理论(社会学) 钢筋 振动 计算机科学 振动控制 控制(管理) 控制工程 人工智能 工程类 结构工程 声学 物理 量子力学
作者
Jiyuan Jiang,Jie Tang,Kun Zhao,Meng Li,Yinghui Li,Dengqing Cao
出处
期刊:International Journal of Structural Stability and Dynamics [World Scientific]
被引量:1
标识
DOI:10.1142/s0219455425500798
摘要

Optimal control of nonlinear vibration requires precise knowledge of the system and the solution to Hamilton–Jacobi–Bellman (HJB) equation. However, in practical engineering applications, acquiring precise system parameters poses challenges, and the analytical solutions for the HJB equation are difficult to obtain. In this paper, two reinforcement learning algorithms, Twin Delayed Deep Deterministic Policy Gradient (TD3) algorithm and Soft Actor-Critic (SAC) algorithm, are employed to train neural network-based optimal controllers for the van der Pol vibration system in the presence of unknown system parameters. To validate their performance, the controllers undergo testing in a series of experiments, including assessments of free vibration, frequency sweep excitation, and Gaussian noise excitation. The results indicate that both the TD3-trained and SAC-trained neural network-based controller are capable of proficiently suppress the vibration of the van der Pol oscillator. Additionally, these two model-free controllers can approximate the optimal control law which solved based on the dynamic model of the nonlinear system.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
lixinyue完成签到 ,获得积分10
刚刚
鸢尾松茶完成签到 ,获得积分10
7秒前
钱塘小虾米完成签到,获得积分10
21秒前
疯丫头完成签到,获得积分10
21秒前
wBw完成签到,获得积分10
22秒前
杨永佳666完成签到 ,获得积分10
29秒前
自来也完成签到,获得积分10
34秒前
Getlogger完成签到,获得积分10
34秒前
房天川完成签到 ,获得积分10
45秒前
柳败完成签到 ,获得积分10
45秒前
JasonWu完成签到 ,获得积分10
46秒前
onevip完成签到,获得积分10
47秒前
ccl完成签到,获得积分10
51秒前
不想长大完成签到 ,获得积分10
53秒前
超体完成签到 ,获得积分10
54秒前
save完成签到,获得积分10
57秒前
蛋妮完成签到 ,获得积分10
57秒前
mzrrong完成签到 ,获得积分10
1分钟前
Dr彭0923完成签到,获得积分10
1分钟前
开心夏旋完成签到 ,获得积分10
1分钟前
Sigma完成签到 ,获得积分10
1分钟前
Wang完成签到 ,获得积分10
1分钟前
roundtree完成签到 ,获得积分0
1分钟前
南桑完成签到 ,获得积分10
1分钟前
zhangsan完成签到,获得积分10
1分钟前
1分钟前
仓促过客发布了新的文献求助10
1分钟前
安静严青完成签到 ,获得积分10
2分钟前
qpp完成签到,获得积分10
2分钟前
wei完成签到 ,获得积分0
2分钟前
超级灰狼完成签到 ,获得积分10
2分钟前
Marvin完成签到 ,获得积分10
2分钟前
不过尔尔完成签到 ,获得积分10
2分钟前
西柚子完成签到 ,获得积分10
2分钟前
天真的莺完成签到,获得积分10
2分钟前
嗯嗯嗯哦哦哦完成签到 ,获得积分10
2分钟前
十七完成签到 ,获得积分10
2分钟前
Mendle完成签到 ,获得积分10
2分钟前
诸觅双完成签到 ,获得积分10
2分钟前
含糊的茹妖完成签到 ,获得积分10
2分钟前
高分求助中
Sustainability in Tides Chemistry 2000
Bayesian Models of Cognition:Reverse Engineering the Mind 888
Essentials of thematic analysis 700
A Dissection Guide & Atlas to the Rabbit 600
Very-high-order BVD Schemes Using β-variable THINC Method 568
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 500
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3126186
求助须知:如何正确求助?哪些是违规求助? 2776364
关于积分的说明 7729906
捐赠科研通 2431820
什么是DOI,文献DOI怎么找? 1292299
科研通“疑难数据库(出版商)”最低求助积分说明 622696
版权声明 600430