标题 |
Transfer Reinforcement Learning for Mixed Observability Markov Decision Processes with Time-Varying Interval-Valued Parameters and Its Application in Pandemic Control
时变区间值参数混合可观性马尔可夫决策过程的转移强化学习及其在流行病控制中的应用
相关领域
可观测性
马尔可夫决策过程
强化学习
区间(图论)
计算机科学
控制(管理)
数学优化
大流行
马尔可夫链
马尔可夫过程
部分可观测马尔可夫决策过程
传输(计算)
数学
人工智能
2019年冠状病毒病(COVID-19)
机器学习
应用数学
统计
组合数学
病理
并行计算
传染病(医学专业)
医学
疾病
|
网址 | |
DOI | |
求助人 | |
下载 | 求助已完成,仅限求助人下载。 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|