Deep Reinforcement Learning-Based Control of Stewart Platform With Parametric Simulation in ROS and Gazebo

斯图尔特站台 强化学习 Python(编程语言) 计算机科学 参数统计 异步通信 机器人 机器人学 PID控制器 运动学 控制器(灌溉) 控制工程 模拟 人工智能 工程类 温度控制 计算机网络 农学 统计 物理 数学 经典力学 生物 操作系统
作者
Hadi Yadavari,Vahid Tavakol Aghaei,Serhat İkizoğlu
出处
期刊:Journal of Mechanisms and Robotics [ASME International]
卷期号:15 (3) 被引量:7
标识
DOI:10.1115/1.4056971
摘要

Abstract The Stewart platform is an entirely parallel robot with mechanical differences from typical serial robotic manipulators, which has a wide application area ranging from flight and driving simulators to structural test platforms. This work concentrates on learning to control a complex model of the Stewart platform using state-of-the-art deep reinforcement learning (DRL) algorithms. In this regard, to enhance the reliability of the learning performance and to have a test bed capable of mimicking the behavior of the system completely, a precisely designed simulation environment is presented. Therefore, we first design a parametric representation for the kinematics of the Stewart platform in Gazebo and robot operating system (ROS) and integrate it with a Python class to conveniently generate the structures in simulation description format (SDF). Then, to control the system, we benefit from three DRL algorithms: the asynchronous advantage actor–critic (A3C), the deep deterministic policy gradient (DDPG), and the proximal policy optimization (PPO) to learn the control gains of a proportional integral derivative (PID) controller for a given reaching task. We chose to apply these algorithms due to the Stewart platform’s continuous action and state spaces, making them well-suited for our problem, where exact controller tuning is a crucial task. The simulation results show that the DRL algorithms can successfully learn the controller gains, resulting in satisfactory control performance.

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
悟川完成签到 ,获得积分10
1秒前
1秒前
无谓发布了新的文献求助10
1秒前
zzz发布了新的文献求助10
4秒前
月湖发布了新的文献求助10
4秒前
5秒前
6秒前
粥粥叭叭发布了新的文献求助10
6秒前
羊较瘦3发布了新的文献求助10
7秒前
岁月轮回发布了新的文献求助10
7秒前
8秒前
sdniuidifod发布了新的文献求助10
9秒前
缺文献发布了新的文献求助10
10秒前
11秒前
一叶扁舟发布了新的文献求助10
11秒前
杳鸢应助kento采纳,获得50
12秒前
13秒前
花花发布了新的文献求助10
15秒前
16秒前
17秒前
任白993应助奋斗的雅柔采纳,获得10
17秒前
张兴完成签到,获得积分20
17秒前
慕青应助科研通管家采纳,获得10
18秒前
科研通AI2S应助科研通管家采纳,获得10
19秒前
19秒前
19秒前
Ava应助科研通管家采纳,获得10
19秒前
爆米花应助科研通管家采纳,获得10
19秒前
19秒前
19秒前
任白993应助无谓采纳,获得10
19秒前
任白993应助无谓采纳,获得10
20秒前
张兴发布了新的文献求助10
20秒前
慕青应助羊较瘦3采纳,获得10
21秒前
太叔开山发布了新的文献求助10
22秒前
22秒前
22秒前
23秒前
高分求助中
Востребованный временем 2500
The Three Stars Each: The Astrolabes and Related Texts 1500
Very-high-order BVD Schemes Using β-variable THINC Method 990
Les Mantodea de Guyane 800
Mantids of the euro-mediterranean area 700
Field Guide to Insects of South Africa 660
Mantodea of the World: Species Catalog 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3396729
求助须知:如何正确求助?哪些是违规求助? 3006319
关于积分的说明 8820394
捐赠科研通 2693370
什么是DOI,文献DOI怎么找? 1475314
科研通“疑难数据库(出版商)”最低求助积分说明 682394
邀请新用户注册赠送积分活动 675680