🔥【活动通知】:科研通第二届『应助活动周』重磅启航,3月24-30日求助秒级响应🚀,千元现金等你拿。这个春天,让互助之光璀璨绽放!查看详情
已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Implementing the Deep Q-Network

计算机科学 人工智能
作者
Melrose Roderick,James MacGlashan,Stefanie Tellex
出处
期刊:Cornell University - arXiv 被引量:51
标识
DOI:10.48550/arxiv.1711.07478
摘要

The Deep Q-Network proposed by Mnih et al. [2015] has become a benchmark and building point for much deep reinforcement learning research. However, replicating results for complex systems is often challenging since original scientific publications are not always able to describe in detail every important parameter setting and software engineering solution. In this paper, we present results from our work reproducing the results of the DQN paper. We highlight key areas in the implementation that were not covered in great detail in the original paper to make it easier for researchers to replicate these results, including termination conditions and gradient descent algorithms. Finally, we discuss methods for improving the computational performance and provide our own implementation that is designed to work with a range of domains, and not just the original Arcade Learning Environment [Bellemare et al., 2013].

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
w1x2123完成签到,获得积分10
刚刚
3秒前
5秒前
NattyPoe完成签到,获得积分10
6秒前
wanci应助风俞采纳,获得10
7秒前
8秒前
dj发布了新的文献求助10
9秒前
9秒前
lalalala发布了新的文献求助10
12秒前
果汁橡皮糖完成签到,获得积分10
16秒前
天天快乐应助俊逸吐司采纳,获得10
18秒前
无花果应助英俊的大远采纳,获得10
18秒前
天天快乐应助英俊的大远采纳,获得10
18秒前
赘婿应助英俊的大远采纳,获得10
18秒前
汉堡包应助英俊的大远采纳,获得10
18秒前
所所应助英俊的大远采纳,获得10
18秒前
19秒前
Moislad完成签到,获得积分20
20秒前
111完成签到 ,获得积分10
20秒前
棉籽完成签到 ,获得积分10
21秒前
LHF发布了新的文献求助10
24秒前
汉堡包应助英俊的大远采纳,获得10
26秒前
26秒前
爆米花应助英俊的大远采纳,获得10
26秒前
上官若男应助英俊的大远采纳,获得10
26秒前
26秒前
CipherSage应助英俊的大远采纳,获得10
26秒前
李健应助英俊的大远采纳,获得10
26秒前
传奇3应助英俊的大远采纳,获得10
26秒前
英姑应助英俊的大远采纳,获得10
26秒前
Jasper应助英俊的大远采纳,获得10
26秒前
28秒前
周青春偶像完成签到 ,获得积分10
29秒前
细心芙完成签到 ,获得积分20
32秒前
朴实向卉发布了新的文献求助10
34秒前
细心芙关注了科研通微信公众号
36秒前
杨无敌完成签到 ,获得积分10
40秒前
爆米花应助sanages采纳,获得10
41秒前
科研通AI2S应助DYZ采纳,获得10
41秒前
41秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Conference Record, IAS Annual Meeting 1977 1150
Structural Load Modelling and Combination for Performance and Safety Evaluation 1000
Neuromuscular and Electrodiagnostic Medicine Board Review 800
Teaching language in context (3rd edition) by Derewianka, Beverly; Jones, Pauline 610
EEG in clinical practice 2nd edition 1994 600
Barth, Derrida and the Language of Theology 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3603877
求助须知:如何正确求助?哪些是违规求助? 3172002
关于积分的说明 9572701
捐赠科研通 2878080
什么是DOI,文献DOI怎么找? 1580708
邀请新用户注册赠送积分活动 743204
科研通“疑难数据库(出版商)”最低求助积分说明 725852