Visualizing the Loss Landscape of Neural Nets

规范化(社会学) 计算机科学 可视化 人工神经网络 一般化 曲率 信息丢失 网络体系结构 人工智能 数学 几何学 人类学 计算机安全 数学分析 社会学
作者
Hao Li,Zheng Xu,Gavin Taylor,Christoph Studer,Tom Goldstein
出处
期刊:Neural Information Processing Systems 卷期号:31: 6391-6401 被引量:544
标识
DOI:10.3929/ethz-b-000461393
摘要

Neural network training relies on our ability to find good minimizers of highly non-convex loss functions. It is well known that certain network architecture designs (e.g., skip connections) produce loss functions that train easier, and well-chosen training parameters (batch size, learning rate, optimizer) produce minimizers that generalize better. However, the reasons for these differences, and their effect on the underlying loss landscape, is not well understood. In this paper, we explore the structure of neural loss functions, and the effect of loss landscapes on generalization, using a range of visualization methods. First, we introduce a simple filter normalization method that helps us visualize loss function curvature, and make meaningful side-by-side comparisons between loss functions. Then, using a variety of visualizations, we explore how network architecture affects the loss landscape, and how training parameters affect the shape of minimizers.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
科研通AI6.2应助君衡采纳,获得10
1秒前
粗心的听芹完成签到,获得积分20
1秒前
大模型应助Leo采纳,获得10
1秒前
1秒前
谦让的鱼发布了新的文献求助10
2秒前
2秒前
xuxuxu完成签到,获得积分10
2秒前
Ariel发布了新的文献求助10
2秒前
奋斗秋尽发布了新的文献求助10
2秒前
小鱼要变咸完成签到,获得积分10
2秒前
温暖的台灯完成签到,获得积分10
3秒前
3秒前
3秒前
0867发布了新的文献求助30
3秒前
WittingGU完成签到,获得积分0
3秒前
3秒前
乐观的惜珊完成签到,获得积分10
3秒前
在水一方应助chne采纳,获得10
4秒前
竹叶青发布了新的文献求助30
4秒前
英俊的铭应助LJT采纳,获得10
4秒前
4秒前
zhuzi完成签到,获得积分20
4秒前
bkagyin应助迷人圣诞树很闲采纳,获得10
4秒前
忧伤的蓝发布了新的文献求助10
5秒前
123完成签到,获得积分10
5秒前
十一发布了新的文献求助10
5秒前
6秒前
6秒前
7秒前
领导范儿应助风吹过采纳,获得10
7秒前
爆米花应助Leo采纳,获得10
7秒前
麦克阿瑟完成签到 ,获得积分10
8秒前
麻辣老妖婆完成签到 ,获得积分10
8秒前
峥玄完成签到,获得积分10
8秒前
8秒前
月兮2013发布了新的文献求助10
9秒前
xnn发布了新的文献求助10
9秒前
桐桐应助TIMEIEXIST采纳,获得10
10秒前
FashionBoy应助sdl采纳,获得10
10秒前
木子也是李应助风趣从霜采纳,获得10
10秒前
高分求助中
Clinical Epidemiology: The Essentials, 6e 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Graphene Handbook (2019 Edition) 800
Adhesion Science: Principles & Practice 800
Signals, Systems, and Signal Processing 610
IEST-RP-CC018: Cleanroom Cleaning and Sanitization: Operating and Monitoring Procedures 600
Fundamentals of Pharmaceutical and Biologics Regulations: A Global Perspective, Second Edition 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6539791
求助须知:如何正确求助?哪些是违规求助? 8331088
关于积分的说明 17852241
捐赠科研通 5644699
什么是DOI,文献DOI怎么找? 2935929
邀请新用户注册赠送积分活动 1912063
关于科研通互助平台的介绍 1772700