标题 |
A goal-conditioned policy search method with multi-timescale value function tuning
一种多时间尺度值函数调优的目标条件策略搜索方法
相关领域
强化学习
贝尔曼方程
计算机科学
一般化
功能(生物学)
数学优化
价值(数学)
人工智能
约束(计算机辅助设计)
机器人
代表(政治)
机器学习
数学
进化生物学
生物
数学分析
几何学
政治
政治学
法学
|
网址 | |
DOI | |
其它 |
期刊:Robotic Intelligence and Automation 作者:Zhihong Jiang; Jiachen Hu; Yan Zhao; Xiao Huang; Hui Li 出版日期:2024-06-08 |
求助人 | |
下载 | |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|