标题 |
WildBench: Benchmarking LLMs with Challenging Tasks from Real Users in the Wild
WildBench:用来自野外真实用户的具有挑战性的任务对法学硕士进行基准测试
相关领域
标杆管理
计算机科学
业务
营销
|
网址 | |
DOI | |
其它 |
期刊:arXiv (Cornell University) 作者:Bill Yuchen Lin; Yuntian Deng; Khyathi Raghavi Chandu; Faeze Brahman; Abhilasha Ravichander; et al 出版日期:2024-06-07 |
求助人 | |
下载 | 暂无链接,等待应助者上传 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|