Visualizing the Loss Landscape of Neural Nets

规范化(社会学) 计算机科学 可视化 人工神经网络 一般化 曲率 信息丢失 网络体系结构 人工智能 数学 几何学 人类学 计算机安全 数学分析 社会学
作者
Hao Li,Zheng Xu,Gavin Taylor,Christoph Studer,Tom Goldstein
出处
期刊:Neural Information Processing Systems 卷期号:31: 6391-6401 被引量:544
标识
DOI:10.3929/ethz-b-000461393
摘要

Neural network training relies on our ability to find good minimizers of highly non-convex loss functions. It is well known that certain network architecture designs (e.g., skip connections) produce loss functions that train easier, and well-chosen training parameters (batch size, learning rate, optimizer) produce minimizers that generalize better. However, the reasons for these differences, and their effect on the underlying loss landscape, is not well understood. In this paper, we explore the structure of neural loss functions, and the effect of loss landscapes on generalization, using a range of visualization methods. First, we introduce a simple filter normalization method that helps us visualize loss function curvature, and make meaningful side-by-side comparisons between loss functions. Then, using a variety of visualizations, we explore how network architecture affects the loss landscape, and how training parameters affect the shape of minimizers.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
yy完成签到,获得积分10
刚刚
楠楠DAYTOY完成签到,获得积分10
1秒前
风中的小鸽子完成签到 ,获得积分10
1秒前
2秒前
2秒前
lucky完成签到,获得积分10
3秒前
不是哥们发布了新的文献求助10
4秒前
郑浩完成签到,获得积分10
6秒前
老福贵儿完成签到,获得积分0
8秒前
甜甜圈发布了新的文献求助30
9秒前
梓zz完成签到,获得积分20
11秒前
阿浩完成签到,获得积分10
12秒前
wangwudeafa完成签到 ,获得积分10
13秒前
ZR14124完成签到,获得积分10
16秒前
czt完成签到,获得积分10
17秒前
阿达完成签到 ,获得积分10
18秒前
Seven完成签到 ,获得积分10
18秒前
小事完成签到 ,获得积分0
19秒前
nqterysc完成签到,获得积分10
20秒前
怕孤单的易形完成签到,获得积分10
20秒前
莴苣完成签到,获得积分10
20秒前
CHAUSU完成签到,获得积分10
22秒前
wch完成签到,获得积分10
22秒前
23秒前
figure完成签到 ,获得积分10
25秒前
27秒前
Sophia发布了新的文献求助10
27秒前
CHUNQ完成签到,获得积分10
27秒前
大力的灵雁举报郑旭辉求助涉嫌违规
28秒前
研友Bn完成签到 ,获得积分10
28秒前
王陈龙完成签到,获得积分10
29秒前
沙克几十块完成签到,获得积分10
32秒前
32秒前
陈少华发布了新的文献求助10
32秒前
Balance Man完成签到 ,获得积分10
32秒前
burningzmz发布了新的文献求助10
33秒前
小木子完成签到,获得积分10
33秒前
34秒前
wu完成签到,获得积分10
34秒前
互助应助悦耳的乐松采纳,获得10
35秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Modern Epidemiology, Fourth Edition 5000
Handbook of pharmaceutical excipients, Ninth edition 5000
Digital Twins of Advanced Materials Processing 2000
Weaponeering, Fourth Edition – Two Volume SET 2000
Polymorphism and polytypism in crystals 1000
Social Cognition: Understanding People and Events 800
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6028728
求助须知:如何正确求助?哪些是违规求助? 7694817
关于积分的说明 16187599
捐赠科研通 5175907
什么是DOI,文献DOI怎么找? 2769817
邀请新用户注册赠送积分活动 1753209
关于科研通互助平台的介绍 1638993