Learning Reward Functions by Integrating Human Demonstrations and Preferences

已关闭

文献求助详情

标题	Learning Reward Functions by Integrating Human Demonstrations and Preferences 通过整合人类演示和偏好来学习奖励函数相关领域计算机科学偏爱偏好学习人工智能质量（理念）强化学习机器人空格（标点符号）功能（生物学）过程（计算）机器学习机器人学人机交互数学操作系统哲学认识论统计生物进化生物学
网址	https://doi.org/10.15607/rss.2019.xv.023 AI链接 arxiv.org arxiv.orgdoi.org
DOI	10.15607/rss.2019.xv.023 doi
其它	期刊：作者：Malayandi Palan; Gleb Shevchuk; Nicholas C. Landolfi; Dorsa Sadigh 出版日期：2019-06-22
求助人	小小怪在 2025-04-03 17:22:41 发布自湖南，悬赏 10 积分
下载
	温馨提示：该文献已被科研通学术中心收录，前往查看科研通『学术中心』是文献索引库，收集文献的基本信息（如标题、摘要、期刊、作者、被引量等），不提供下载功能。如需下载文献全文，请通过文献求助获取。

上个求助

下个求助

求助 / 应助时间线

17小时前，求助关闭

小小怪 Lv1 求助人关闭了本次求助。

说明不需要了【积分已退回】
17小时前

科研通AI2.0 机器人未找到该文献，机器人已退出，请等待人工下载

17:22:43 未找到该文献，机器人已退出，请等待人工下载

17:22:42 科研通AI机器人（英国伦敦）收到请求，开始寻找文献

17:22:42 已向机器人发送请求
17小时前

小小怪 Lv1 求助人发起了本次求助

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

活动

『应助活动周』获奖名单已公布 🔥 (2025-4-2)

更新

『中科院2025期刊分区』已更新 (2025-3-23)

更新

『即时热点』模块已上线 (2025-2-28)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 完美世界的应助被hushow采纳，获得10

1秒前; tangyuhua发布了新的文献求助10

1秒前; 淡定的天空完成签到，获得积分10

2秒前; 缪甲烷发布了新的文献求助10

4秒前; 好久不见完成签到，获得积分10

5秒前; sf关注了科研通微信公众号

7秒前; 迅速的巧曼完成签到，获得积分10

8秒前; 小白先生完成签到，获得积分10

9秒前; 在吃饭的时候吃饭完成签到，获得积分10

9秒前; Jasper上传了应助文件

11秒前; may完成签到，获得积分20

12秒前; 桐桐的应助被嘉禾瑶采纳，获得10

15秒前; 俭朴新之完成签到，获得积分10

15秒前; 科研小民工的应助被nature采纳，获得30

16秒前; may发布了新的文献求助10

17秒前; 万能图书馆的应助被星汉采纳，获得10

17秒前; 若眠完成签到，获得积分10

19秒前; 8R60d8的应助被yolo采纳，获得10

19秒前; 8R60d8上传了应助文件

20秒前; 李健上传了应助文件

23秒前; 科目三的应助被may采纳，获得10

23秒前; 默默地读文献上传了应助文件

24秒前; tangyuhua完成签到，获得积分10

24秒前; 亵渎完成签到，获得积分10

25秒前; 汉堡包的应助被如烈火如止水采纳，获得10

25秒前; 桐桐上传了应助文件

26秒前; 小杨爱吃羊完成签到，获得积分10

27秒前; 小星星发布了新的文献求助10

27秒前; 刻苦的寒凝发布了新的文献求助10

27秒前; 完美世界的应助被seven采纳，获得10

28秒前; 随机游动完成签到，获得积分10

28秒前; Everglow完成签到，获得积分10

29秒前; 汉堡包上传了应助文件

32秒前; 苗条的傲丝完成签到，获得积分10

32秒前; Siriya发布了新的文献求助10

32秒前; 嘉禾瑶发布了新的文献求助10

33秒前; 超级大猩猩完成签到，获得积分10

33秒前; guantlv完成签到，获得积分10

34秒前; 李健的粉丝团团长的应助被张嘎嘎采纳，获得10

35秒前; anhuiwsy完成签到，获得积分10

36秒前