Performance Bounds for Policy-Based Reinforcement Learning Methods in Zero-Sum Markov Games with Linear Function Approximation

已完结

文献求助详情

标题	Performance Bounds for Policy-Based Reinforcement Learning Methods in Zero-Sum Markov Games with Linear Function Approximation 线性函数逼近零和马尔可夫博弈中基于策略的强化学习方法的性能界相关领域马尔可夫决策过程强化学习计算机科学数学优化增强学习马尔可夫链功能（生物学）马尔可夫过程函数逼近零（语言学）算法近似算法路径（计算）数学人工智能机器学习人工神经网络生物统计进化生物学哲学语言学程序设计语言
网址	https://doi.org/10.1109/cdc49753.2023.10384061
DOI	10.1109/cdc49753.2023.10384061 doi
其它	期刊：作者：Anna Winnicki; R. Srikant 出版日期：2023-12-13
求助人	苗笑卉在 2025-01-21 17:47:02 发布自荷兰，悬赏 10 积分
下载	求助已完成，仅限求助人下载。
	温馨提示：该文献已被科研通学术中心收录，前往查看科研通『学术中心』是文献索引库，收集文献的基本信息（如标题、摘要、期刊、作者、被引量等），不提供下载功能。如需下载文献全文，请通过文献求助获取。

上个求助

下个求助

该求助已完结，感谢关注

如需该文献，请重新发布求助，前往发布

学术共进，科研互通

请遵守相关知识产权规定，勿将文件分享给他人，仅可用于个人研究学习

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

更新

2024年影响因子查询已上线 (2024-6-20)

更新

大幅提高文件上传限制，最高150M (2024-4-1)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: Bright24发布了新的文献求助10

刚刚; 慕青上传了应助文件

1秒前; 秦琨发布了新的文献求助10

1秒前; 小二郎的应助被hjh采纳，获得10

1秒前; Paralloria发布了新的文献求助10

2秒前; 加油呀完成签到，获得积分10

5秒前; 顾矜上传了应助文件

5秒前; 小鱼儿发布了新的文献求助10

8秒前; Bright24完成签到，获得积分10

9秒前; 从前完成签到，获得积分20

9秒前; 善学以致用上传了应助文件

10秒前; LI发布了新的文献求助10

11秒前; cuiyi发布了新的文献求助10

12秒前; Jasper的应助被秦琨采纳，获得10

12秒前; Paralloria完成签到，获得积分10

12秒前; 啊湫超爱学习发布了新的文献求助10

13秒前; 从前发布了新的文献求助10

14秒前; 从容芮上传了应助文件

15秒前; 科研通AI2S上传了应助文件

15秒前; bkagyin的应助被科研通管家采纳，获得10

16秒前; 英姑的应助被科研通管家采纳，获得10

16秒前; 善学以致用的应助被科研通管家采纳，获得10

16秒前; curtisness的应助被科研通管家采纳，获得10

16秒前; 可爱的函函的应助被科研通管家采纳，获得10

16秒前; Orange的应助被科研通管家采纳，获得10

16秒前; ding的应助被tkdzjr12345采纳，获得10

19秒前; 一笑奈何完成签到，获得积分10

19秒前; 烟花的应助被lion_wei采纳，获得10

20秒前; 着急的中心关闭了着急的中心的文献求助

20秒前; BaekHyun完成签到，获得积分10

22秒前; 霍夫斯泰德完成签到，获得积分10

22秒前; 从容芮上传了应助文件

22秒前; 顾矜上传了应助文件

23秒前; 铁柱xh完成签到，获得积分10

25秒前; ding上传了应助文件

25秒前; 标致梦秋发布了新的文献求助10

28秒前; hw关闭了hw的文献求助

28秒前; tkdzjr12345发布了新的文献求助10

29秒前; 烟花上传了应助文件

29秒前; 小鱼儿完成签到，获得积分10

30秒前