亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Model-Free Attitude Control of Spacecraft Based on PID-Guide TD3 Algorithm

控制理论(社会学) 航天器 PID控制器 计算机科学 控制器(灌溉) 超调(微波通信) 强化学习 理论(学习稳定性) 控制工程 控制(管理) 工程类 温度控制 人工智能 电信 农学 机器学习 生物 航空航天工程
作者
Zhibin Zhang,Xinhong Li,Jiping An,Wanxin Man,Guohui Zhang
出处
期刊:International Journal of Aerospace Engineering [Hindawi Limited]
卷期号:2020: 1-13 被引量:23
标识
DOI:10.1155/2020/8874619
摘要

This paper is devoted to model-free attitude control of rigid spacecraft in the presence of control torque saturation and external disturbances. Specifically, a model-free deep reinforcement learning (DRL) controller is proposed, which can learn continuously according to the feedback of the environment and realize the high-precision attitude control of spacecraft without repeatedly adjusting the controller parameters. Considering the continuity of state space and action space, the Twin Delayed Deep Deterministic Policy Gradient (TD3) algorithm based on actor-critic architecture is adopted. Compared with the Deep Deterministic Policy Gradient (DDPG) algorithm, TD3 has better performance. TD3 obtains the optimal policy by interacting with the environment without using any prior knowledge, so the learning process is time-consuming. Aiming at this problem, the PID-Guide TD3 algorithm is proposed, which can speed up the training speed and improve the convergence precision of the TD3 algorithm. Aiming at the problem that reinforcement learning (RL) is difficult to deploy in the actual environment, the pretraining/fine-tuning method is proposed for deployment, which can not only save training time and computing resources but also achieve good results quickly. The experimental results show that DRL controller can realize high-precision attitude stabilization and attitude tracking control, with fast response speed and small overshoot. The proposed PID-Guide TD3 algorithm has faster training speed and higher stability than the TD3 algorithm.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
5秒前
所所应助科研通管家采纳,获得10
11秒前
领导范儿应助小马采纳,获得10
27秒前
32秒前
小马发布了新的文献求助10
38秒前
44秒前
47秒前
48秒前
maxli发布了新的文献求助10
49秒前
1234发布了新的文献求助10
51秒前
梦伴发布了新的文献求助10
54秒前
大胆的碧菡完成签到,获得积分10
58秒前
科研通AI6.1应助梦伴采纳,获得10
1分钟前
无语的月光完成签到 ,获得积分10
1分钟前
科研通AI6.2应助小马采纳,获得10
1分钟前
章鱼完成签到,获得积分10
1分钟前
1分钟前
华仔应助maxli采纳,获得10
1分钟前
小马发布了新的文献求助10
1分钟前
梦玲完成签到 ,获得积分10
1分钟前
飞飞完成签到,获得积分10
1分钟前
1分钟前
1分钟前
由道罡完成签到 ,获得积分10
1分钟前
超级的乌冬面完成签到,获得积分10
1分钟前
1分钟前
梦伴发布了新的文献求助10
1分钟前
JamesPei应助健壮的幻波采纳,获得10
2分钟前
maxli发布了新的文献求助10
2分钟前
健壮的幻波完成签到,获得积分10
2分钟前
科目三应助科研通管家采纳,获得10
2分钟前
2分钟前
852应助科研通管家采纳,获得30
2分钟前
华仔应助邪恶摇粒绒采纳,获得10
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Kinesiophobia : a new view of chronic pain behavior 5000
Molecular Biology of Cancer: Mechanisms, Targets, and Therapeutics 3000
First commercial application of ELCRES™ HTV150A film in Nichicon capacitors for AC-DC inverters: SABIC at PCIM Europe 1000
Feldspar inclusion dating of ceramics and burnt stones 1000
Digital and Social Media Marketing 600
Zeolites: From Fundamentals to Emerging Applications 600
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5988194
求助须知:如何正确求助?哪些是违规求助? 7412597
关于积分的说明 16049339
捐赠科研通 5129042
什么是DOI,文献DOI怎么找? 2751885
邀请新用户注册赠送积分活动 1723485
关于科研通互助平台的介绍 1627203