标题 |
![]() 基于时滞感知模型的连续控制强化学习
相关领域
强化学习
计算机科学
马尔可夫决策过程
过程(计算)
人工智能
增强学习
控制(管理)
马尔可夫过程
国家(计算机科学)
马尔可夫链
动作(物理)
机器学习
算法
数学
物理
操作系统
统计
量子力学
|
网址 | |
DOI | |
其它 |
期刊:Neurocomputing 作者:Baiming Chen; Min Xu; Lipeng Zhang; Ding Zhao 出版日期:2021-08-01 |
求助人 | |
下载 | 求助已完成,仅限求助人下载。 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|