强化学习
零(语言学)
代数Riccati方程
代数数
马尔可夫链
马尔可夫决策过程
极限(数学)
计算机科学
零和博弈
增强学习
数学优化
数学
Riccati方程
应用数学
马尔可夫过程
微分方程
人工智能
机器学习
数学分析
纳什均衡
统计
哲学
语言学
作者
Xilin Xin,Yidong Tu,Vladimir Stojanović,Hai Wang,Kaibo Shi,Shuping He,Tianhong Pan
标识
DOI:10.1016/j.amc.2021.126537
科研通智能强力驱动
Strongly Powered by AbleSci AI