标题 |
![]() 通过整合人类演示和偏好来学习奖励函数
相关领域
计算机科学
偏爱
偏好学习
人工智能
质量(理念)
强化学习
机器人
空格(标点符号)
功能(生物学)
过程(计算)
机器学习
机器人学
人机交互
数学
操作系统
哲学
认识论
统计
生物
进化生物学
|
网址 | |
DOI | |
其它 |
期刊: 作者:Malayandi Palan; Gleb Shevchuk; Nicholas C. Landolfi; Dorsa Sadigh 出版日期:2019-06-22 |
求助人 | |
下载 | |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|