GradNorm: Gradient Normalization for Adaptive Loss Balancing in Deep Multitask Networks

计算机科学 多任务学习 过度拟合 超参数 人工智能 超参数优化 机器学习 规范化(社会学) 人工神经网络 任务(项目管理) 深度学习 支持向量机 人类学 社会学 经济 管理
作者
Chen Zhao,Vijay Badrinarayanan,Chen‐Yu Lee,Andrew Rabinovich
出处
期刊:International Conference on Machine Learning 卷期号:: 794-803 被引量:347
摘要

Deep multitask networks, in which one neural network produces multiple predictive outputs, can offer better speed and performance than their single-task counterparts but are challenging to train properly. We present a gradient normalization (GradNorm) algorithm that automatically balances training in deep multitask models by dynamically tuning gradient magnitudes. We show that for various network architectures, for both regression and classification tasks, and on both synthetic and real datasets, GradNorm improves accuracy and reduces overfitting across multiple tasks when compared to single-task networks, static baselines, and other adaptive multitask loss balancing techniques. GradNorm also matches or surpasses the performance of exhaustive grid search methods, despite only involving a single asymmetry hyperparameter $\alpha$. Thus, what was once a tedious search process that incurred exponentially more compute for each task added can now be accomplished within a few training runs, irrespective of the number of tasks. Ultimately, we will demonstrate that gradient manipulation affords us great control over the training dynamics of multitask networks and may be one of the keys to unlocking the potential of multitask learning.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
慕青应助candice624采纳,获得10
刚刚
英俊从雪发布了新的文献求助10
1秒前
2秒前
W123完成签到,获得积分10
2秒前
青青草发布了新的文献求助10
2秒前
周周完成签到 ,获得积分10
3秒前
逐日者2015完成签到,获得积分10
3秒前
完美世界应助二牛采纳,获得10
4秒前
善良梦竹完成签到,获得积分10
5秒前
希望天下0贩的0应助LV采纳,获得10
5秒前
大白发布了新的文献求助10
5秒前
慕青应助陌路孤星采纳,获得10
7秒前
7秒前
泽霖完成签到,获得积分0
7秒前
9秒前
奋斗的迎彤完成签到 ,获得积分20
9秒前
星空_完成签到 ,获得积分10
9秒前
10秒前
Linux2000Pro完成签到,获得积分0
11秒前
12秒前
13秒前
耳冉完成签到 ,获得积分10
13秒前
13秒前
慕青应助斯文的依白采纳,获得10
14秒前
LvYuJ发布了新的文献求助10
15秒前
无花果应助DDD采纳,获得10
15秒前
15秒前
lh961129完成签到,获得积分10
16秒前
小西发布了新的文献求助10
16秒前
aaa发布了新的文献求助10
17秒前
18秒前
18秒前
受伤灵薇完成签到,获得积分10
18秒前
May发布了新的文献求助10
19秒前
20秒前
满意溪流完成签到 ,获得积分10
21秒前
搜集达人应助lulala采纳,获得10
21秒前
情怀应助zhou采纳,获得20
21秒前
22秒前
22秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 2000
Various Faces of Animal Metaphor in English and Polish 800
The SAGE Dictionary of Qualitative Inquiry 610
Signals, Systems, and Signal Processing 610
An Introduction to Medicinal Chemistry 第六版习题答案 600
On the Dragon Seas, a sailor's adventures in the far east 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6345878
求助须知:如何正确求助?哪些是违规求助? 8160550
关于积分的说明 17162733
捐赠科研通 5402002
什么是DOI,文献DOI怎么找? 2861016
邀请新用户注册赠送积分活动 1838832
关于科研通互助平台的介绍 1688179