Non‐zero‐sum games of discrete‐time Markov jump systems with unknown dynamics: An off‐policy reinforcement learning method

已完结

文献求助详情

标题	Non‐zero‐sum games of discrete‐time Markov jump systems with unknown dynamics: An off‐policy reinforcement learning method 具有未知动态的离散时间Markov跳跃系统的非零和博弈：一种非策略强化学习方法相关领域强化学习零和博弈趋同（经济学）零（语言学）纳什均衡计算机科学马尔可夫决策过程数学优化离散时间和连续时间马尔可夫链代数Riccati方程集合（抽象数据类型）跳跃代数数极限（数学）数学马尔可夫过程 Riccati方程人工智能微分方程数学分析语言学哲学统计物理量子力学机器学习程序设计语言经济经济增长
网址	https://doi.org/10.1002/rnc.7021
DOI	10.1002/rnc.7021 doi
其它	期刊：International Journal of Robust and Nonlinear Control 作者：Xuewen Zhang; Hao Shen; Feng Li; Jing Wang 出版日期：2023-09-28
求助人	00 在 2024-11-23 21:16:57 发布自山东，悬赏 10 积分
下载	该求助完结已超 24 小时，文件已从服务器自动删除，无法下载。
	温馨提示：该文献已被科研通学术中心收录，前往查看科研通『学术中心』是文献索引库，收集文献的基本信息（如标题、摘要、期刊、作者、被引量等），不提供下载功能。如需下载文献全文，请通过文献求助获取。

上个求助

该求助已完结，感谢关注

如需该文献，请重新发布求助，前往发布

在科研通，轻松享有文献下载的自由

请遵守相关知识产权规定，勿将文件分享给他人，仅可用于个人研究学习

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

活动

『应助活动周』正在进行中 🔥 (2025-3-20)

更新

『中科院2025期刊分区』已更新 (2025-3-23)

更新

『即时热点』模块已上线 (2025-2-28)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 深情安青的应助被帅气雪糕采纳，获得10

刚刚; 雪山飞龙发布了新的文献求助10

刚刚; 哈比人linling发布了新的文献求助10

1秒前; 荣耀完成签到，获得积分20

1秒前; 欣喜谷槐完成签到，获得积分10

1秒前; 一一完成签到，获得积分10

1秒前; shanage上传了应助文件

2秒前; Ava的应助被CY采纳，获得10

2秒前; xjcy上传了应助文件

2秒前; guaishou完成签到，获得积分10

3秒前; Lm发布了新的文献求助10

3秒前; Hola发布了新的文献求助10

3秒前; loopy发布了新的文献求助30

3秒前; haohao发布了新的文献求助10

4秒前; 六子完成签到，获得积分10

4秒前; 1+1发布了新的文献求助10

5秒前; pyrene完成签到，获得积分10

6秒前; 所所上传了应助文件

6秒前; 迷路鞋子完成签到，获得积分10

7秒前; yixiaolou完成签到，获得积分10

7秒前; 今天看文献了吗发布了新的文献求助10

7秒前; Yiwaa完成签到，获得积分10

8秒前; 慕青的应助被BeeC001采纳，获得10

8秒前; Leon上传了应助文件

8秒前; CL完成签到，获得积分10

8秒前; xjcy上传了应助文件

8秒前; SVEA关闭了SVEA的文献求助

9秒前; ㊣㊣完成签到，获得积分10

9秒前; 思源上传了应助文件

9秒前; LLH完成签到，获得积分10

10秒前; 在水一方的应助被庐山烟雨采纳，获得10

10秒前; 马东发布了新的文献求助100

11秒前; 科研小民工的应助被Ksharp10采纳，获得200

11秒前; 悦耳的蜗牛完成签到，获得积分10

11秒前; 970465242@qq.com发布了新的文献求助10

11秒前; 希望天下0贩的0上传了应助文件

12秒前; Lsy完成签到，获得积分20

12秒前; 奋斗灵波完成签到，获得积分10

13秒前; Doin完成签到，获得积分10

14秒前; 空心白菜圆圆发布了新的文献求助10

16秒前