Playing Atari with Deep Reinforcement Learning

强化学习 计算机科学 人工智能 卷积神经网络 深度学习 功能(生物学) 贝尔曼方程 价值(数学) 建筑 增强学习 控制(管理) 像素 钢筋 机器学习 数学 工程类 数学优化 生物 进化生物学 艺术 视觉艺术 结构工程
作者
Volodymyr Mnih,Koray Kavukcuoglu,David Silver,Alex Graves,Ioannis Antonoglou,Daan Wierstra,Martin Riedmiller
出处
期刊:Cornell University - arXiv 被引量:2568
链接
摘要

We present the first deep learning model to successfully learn control policies directly from high-dimensional sensory input using reinforcement learning. The model is a convolutional neural network, trained with a variant of Q-learning, whose input is raw pixels and whose output is a value function estimating future rewards. We apply our method to seven Atari 2600 games from the Arcade Learning Environment, with no adjustment of the architecture or learning algorithm. We find that it outperforms all previous approaches on six of the games and surpasses a human expert on three of them.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小树发布了新的文献求助10
1秒前
2秒前
卑微学术人完成签到 ,获得积分10
3秒前
dd发布了新的文献求助10
3秒前
852应助KIQING采纳,获得10
3秒前
章鱼完成签到,获得积分10
3秒前
student完成签到 ,获得积分10
3秒前
皮蛋solo粥完成签到,获得积分10
3秒前
俏皮的戎完成签到,获得积分10
3秒前
此时留念发布了新的文献求助10
4秒前
liuliuliu完成签到 ,获得积分10
4秒前
4秒前
潘潘发布了新的文献求助10
4秒前
sjyu1985完成签到 ,获得积分10
4秒前
拼搏剑心完成签到 ,获得积分10
6秒前
6秒前
6秒前
huy完成签到,获得积分10
7秒前
烟花应助lin采纳,获得10
7秒前
妖精完成签到 ,获得积分10
7秒前
自信尔冬完成签到,获得积分10
7秒前
丰知然完成签到,获得积分0
7秒前
搜集达人应助kkk采纳,获得10
8秒前
超级甜的酸菜完成签到,获得积分10
10秒前
10秒前
11秒前
幽默柚子发布了新的文献求助30
11秒前
小怪兽大王完成签到,获得积分20
12秒前
13秒前
金色荧光发布了新的文献求助10
13秒前
15秒前
Mae完成签到 ,获得积分10
15秒前
稳重傲儿完成签到,获得积分10
16秒前
阿宁发布了新的文献求助10
16秒前
16秒前
领导范儿应助大气沛容采纳,获得10
17秒前
17秒前
我的1ST完成签到,获得积分10
17秒前
nns完成签到,获得积分10
19秒前
Eva发布了新的文献求助10
19秒前
高分求助中
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger Heßler, Claudia, Rud 1000
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 1000
Natural History of Mantodea 螳螂的自然史 1000
A Photographic Guide to Mantis of China 常见螳螂野外识别手册 800
Barge Mooring (Oilfield Seamanship Series Volume 6) 600
Spatial Political Economy: Uneven Development and the Production of Nature in Chile 400
山海经图录 李云中版 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3327435
求助须知:如何正确求助?哪些是违规求助? 2957773
关于积分的说明 8587067
捐赠科研通 2635861
什么是DOI,文献DOI怎么找? 1442616
科研通“疑难数据库(出版商)”最低求助积分说明 668315
邀请新用户注册赠送积分活动 655396