标题 |
Non‐zero‐sum games of discrete‐time Markov jump systems with unknown dynamics: An off‐policy reinforcement learning method
具有未知动态的离散时间Markov跳跃系统的非零和博弈:一种非策略强化学习方法
相关领域
强化学习
零和博弈
趋同(经济学)
零(语言学)
纳什均衡
计算机科学
马尔可夫决策过程
数学优化
离散时间和连续时间
马尔可夫链
代数Riccati方程
集合(抽象数据类型)
跳跃
代数数
极限(数学)
数学
马尔可夫过程
Riccati方程
人工智能
微分方程
数学分析
语言学
哲学
统计
物理
量子力学
机器学习
程序设计语言
经济
经济增长
|
网址 | |
DOI | |
其它 |
期刊:International Journal of Robust and Nonlinear Control 作者:Xuewen Zhang; Hao Shen; Feng Li; Jing Wang 出版日期:2023-09-28 |
求助人 | |
下载 | 该求助完结已超 24 小时,文件已从服务器自动删除,无法下载。 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|