亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Deep Reinforcement Learning With a Stage Incentive Mechanism of Dense Reward for Robotic Trajectory Planning

强化学习 激励 计算机科学 弹道 趋同(经济学) 过程(计算) 功能(生物学) 人工智能 理论(学习稳定性) 控制理论(社会学) 数学优化 机器学习 数学 控制(管理) 经济 微观经济学 生物 进化生物学 操作系统 经济增长 物理 天文
作者
Gang Peng,Jin Yang,Xinde Lia,Mohammad Omar Khyam
出处
期刊:IEEE transactions on systems, man, and cybernetics [Institute of Electrical and Electronics Engineers]
卷期号:53 (6): 3566-3573 被引量:2
标识
DOI:10.1109/tsmc.2022.3228901
摘要

To improve the efficiency of deep reinforcement learning (DRL)-based methods for robot manipulator trajectory planning in random working environments, we present three dense reward functions. These rewards differ from the traditional sparse reward. First, a posture reward function is proposed to speed up the learning process with a more reasonable trajectory by modeling the distance and direction constraints, which can reduce the blindness of exploration. Second, a stride reward function is proposed to improve the stability of the learning process by modeling the distance and movement distance of joint constraints. Finally, in order to further improve learning efficiency, we are inspired by the cognitive process of human behavior and propose a stage incentive mechanism, including a hard-stage incentive reward function and a soft-stage incentive reward function. Extensive experiments show that the soft-stage incentive reward function is able to improve the convergence rate, get higher mean reward and lower standard deviation after convergence.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
充电宝应助月军采纳,获得10
9秒前
未完完成签到 ,获得积分10
12秒前
寻道图强应助科研通管家采纳,获得50
17秒前
寻道图强应助科研通管家采纳,获得100
17秒前
47秒前
1分钟前
yi完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
1分钟前
1分钟前
1分钟前
SciGPT应助无聊的老六采纳,获得10
1分钟前
陶醉紫青发布了新的文献求助10
1分钟前
feng发布了新的文献求助10
1分钟前
酷波er应助陶醉紫青采纳,获得10
1分钟前
ZD完成签到 ,获得积分10
1分钟前
勺子爱西瓜完成签到,获得积分10
2分钟前
2分钟前
SciGPT应助Aaaapear采纳,获得10
2分钟前
Jasper应助吴筮采纳,获得10
2分钟前
三叔完成签到,获得积分0
3分钟前
3分钟前
3分钟前
3分钟前
3分钟前
Aaaapear发布了新的文献求助10
3分钟前
stretchability完成签到 ,获得积分10
3分钟前
4分钟前
ding完成签到,获得积分10
4分钟前
田様应助月出西山上采纳,获得10
4分钟前
华仔应助科研通管家采纳,获得10
4分钟前
4分钟前
月军发布了新的文献求助10
4分钟前
Aaaapear完成签到,获得积分10
4分钟前
月军完成签到,获得积分10
4分钟前
yaoyaoyao完成签到 ,获得积分10
4分钟前
不吃香菜的爆炸小飞鱼完成签到 ,获得积分20
5分钟前
5分钟前
5分钟前
高分求助中
Impact of Mitophagy-Related Genes on the Diagnosis and Development of Esophageal Squamous Cell Carcinoma via Single-Cell RNA-seq Analysis and Machine Learning Algorithms 2000
Evolution 1500
How to Create Beauty: De Lairesse on the Theory and Practice of Making Art 1000
Gerard de Lairesse : an artist between stage and studio 670
Decision Theory 600
CLSI EP47 Evaluation of Reagent Carryover Effects on Test Results, 1st Edition 550
Multiscale Thermo-Hydro-Mechanics of Frozen Soil: Numerical Frameworks and Constitutive Models 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 2989896
求助须知:如何正确求助?哪些是违规求助? 2650511
关于积分的说明 7162877
捐赠科研通 2284921
什么是DOI,文献DOI怎么找? 1211297
版权声明 592507
科研通“疑难数据库(出版商)”最低求助积分说明 591505