标题 |
Performance Bounds for Policy-Based Reinforcement Learning Methods in Zero-Sum Markov Games with Linear Function Approximation
线性函数逼近零和马尔可夫博弈中基于策略的强化学习方法的性能界
相关领域
马尔可夫决策过程
强化学习
计算机科学
数学优化
增强学习
马尔可夫链
功能(生物学)
马尔可夫过程
函数逼近
零(语言学)
算法
近似算法
路径(计算)
数学
人工智能
机器学习
人工神经网络
生物
统计
进化生物学
哲学
语言学
程序设计语言
|
网址 | |
DOI | |
其它 |
期刊: 作者:Anna Winnicki; R. Srikant 出版日期:2023-12-13 |
求助人 | |
下载 | 求助已完成,仅限求助人下载。 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|