标题 |
OptionGAN: Learning Joint Reward-Policy Options Using Generative Adversarial Inverse Reinforcement Learning
OptionGAN:使用生成对抗性反向强化学习学习联合奖励策略选项
相关领域
强化学习
杠杆(统计)
计算机科学
对抗制
人工智能
生成语法
机器学习
功能(生物学)
集合(抽象数据类型)
进化生物学
生物
程序设计语言
|
网址 | |
DOI | |
其它 |
期刊:Proceedings of the AAAI Conference on Artificial Intelligence 作者:Peter Henderson; Wei-Di Chang; Pierre‐Luc Bacon; David Meger; Joëlle Pineau; et al 出版日期:2018-04-29 |
求助人 | |
下载 | 暂无链接,等待应助者上传 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|