标题 |
![]() 相关领域
再培训
推论
计算机科学
GSM演进的增强数据速率
资源配置
人工智能
资源(消歧)
机器学习
计算机网络
经济
国际贸易
|
网址 | |
DOI | |
其它 |
摘要: 借助边缘智能,AI 模型越来越多地被推向边缘,为无处不在的用户提供服务。然而,由于模型、数据和任务的漂移,部署在边缘的 AI 模型在推理服务阶段的准确性会下降。模型重新训练通过使用新到达的数据定期重新训练模型来处理此类偏差。在资源有限的边缘服务器上为同一模型共置模型再训练和模型推理服务时,平衡模型再训练和推理的资源分配是一个根本性的挑战,旨在最大限度地提高长期推理的准确性。由于基础数学公式是时间耦合、非凸和 NP 困难,因此这个问题特别困难。为了应对这些挑战,我们引入了一种名为 ORRIC 的轻量级且可解释的在线近似算法,旨在优化资源分配,以自适应地平衡模型训练和推理的准确性。ORRIC 的竞争比率优于传统的仅推理范式,尤其是当数据漂移持续足够长的时间时。这突出了共置模型再训练和推理的优势和适用场景。值得注意的是,ORRIC 可以转换为针对不同资源环境的几种启发式算法。在真实场景中进行的实验验证了 ORRIC 的有效性。 |
求助人 | |
下载 | 暂无链接,等待应助者上传 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|