已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Two Improved Algorithms Based on DQN

计算机科学 算法
作者
Zhi Zhang,Shilong Xu,Yingying Xia,Jing Wang,Shao Yong Dring,Xian Cen
标识
DOI:10.1109/icspcc59353.2023.10400213
摘要

DQN (Deep Q-Network) is a deep reinforcement learning algorithm, proposed by DeepMind researchers in 2013, which is a value function-based reinforcement learning method designed to solve reinforcement learning problems with high-dimensional state spaces and discrete action spaces. So far, many research teams have made improvements to the DQN algorithm, in this paper, on the basis of four existing improved algorithms, two groups of them are selected for integration, which we call NDP_DQN and NDP51_DQN, respectively. We have conducted experiments with the DQN as a baseline and the two improved algorithms as a comparison on Atari 2600, an important experimental platform in the field of Deep Reinforcement Learning, and the experiments show that both algorithms exhibit higher performance over the original DQN algorithm on an arcade game in the Atari 2600.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
yzbbb发布了新的文献求助50
1秒前
1秒前
3秒前
0717发布了新的文献求助10
3秒前
4秒前
爱听歌寄风完成签到 ,获得积分10
5秒前
5秒前
明理芷烟发布了新的文献求助10
7秒前
竺七发布了新的文献求助10
7秒前
7秒前
7秒前
丘比特应助娇气的火车采纳,获得10
8秒前
绝不延毕完成签到 ,获得积分10
9秒前
12秒前
明理芷烟发布了新的文献求助10
13秒前
ComeOn发布了新的文献求助10
13秒前
脑洞疼应助zjy采纳,获得10
13秒前
15秒前
15秒前
茄子肉末先生完成签到 ,获得积分10
16秒前
明理芷烟发布了新的文献求助10
16秒前
韦老虎发布了新的文献求助30
17秒前
vxvsd完成签到 ,获得积分10
17秒前
慕青应助cici采纳,获得10
17秒前
huba发布了新的文献求助30
18秒前
18秒前
科研通AI6.4应助一多采纳,获得30
18秒前
科研通AI6.1应助joanna0932采纳,获得10
19秒前
Lynth_iota发布了新的文献求助10
21秒前
FiFi发布了新的文献求助10
21秒前
22秒前
竺七发布了新的文献求助10
23秒前
2515424504关注了科研通微信公众号
23秒前
木槿发布了新的文献求助10
23秒前
25秒前
28秒前
28秒前
Siv发布了新的文献求助10
29秒前
萧怡发布了新的文献求助10
31秒前
Ava应助竺七采纳,获得10
33秒前
高分求助中
卤化钙钛矿人工突触的研究 2000
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
Software that combines deep learning,3D reconstruction and CFD to analyze the state of carotid arteries from ultrasound imaging 500
Bounds for Statistical Estimation in Semiparametric Models 500
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
Ideology and Meaning-Making under the Putin Regime 450
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6494441
求助须知:如何正确求助?哪些是违规求助? 8291568
关于积分的说明 17693527
捐赠科研通 5587415
什么是DOI,文献DOI怎么找? 2916151
邀请新用户注册赠送积分活动 1893149
关于科研通互助平台的介绍 1751873