标题 |
Nonstationary Reinforcement Learning: The Blessing of (More) Optimism
非平稳强化学习:(更)乐观的祝福
相关领域
后悔
强化学习
马尔可夫决策过程
计算机科学
杠杆(统计)
时差学习
上下界
库存控制
背景(考古学)
数学优化
机器学习
人工智能
马尔可夫过程
数学
运筹学
统计
数学分析
古生物学
生物
|
网址 | |
DOI | |
其它 |
期刊:Management Science 作者:Wang Chi Cheung; David Simchi‐Levi; Ruihao Zhu 出版日期:2023-10-01 |
求助人 | |
下载 | 该求助完结已超 24 小时,文件已从服务器自动删除,无法下载。 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|