Deep Double Descent: Where Bigger Models and More Data Hurt

下降(航空) 度量(数据仓库) 计算机科学 梯度下降 猜想 功能(生物学) 随机梯度下降算法 多样性(控制论) 深度学习 算法 人工智能 数学 人工神经网络 数据挖掘 组合数学 进化生物学 生物 工程类 航空航天工程
作者
Venkatesan Guruswami,Gal Kaplun,Yamini Bansal,Tristan Yang,Boaz Barak,Ilya Sutskever
出处
期刊:Cornell University - arXiv 被引量:163
摘要

We show that a variety of modern deep learning tasks exhibit a double-descent phenomenon where, as we increase model size, performance first gets worse and then gets better. Moreover, we show that double descent occurs not just as a function of model size, but also as a function of the number of training epochs. We unify the above phenomena by defining a new complexity measure we call the effective model complexity, and conjecture a generalized double descent with respect to this measure. Furthermore, our notion of model complexity allows us to identify certain regimes where increasing (even quadrupling) the number of train samples actually hurts test performance.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
无私的朝雪完成签到,获得积分10
刚刚
Ava应助正直听芹采纳,获得10
刚刚
txy关注了科研通微信公众号
1秒前
1秒前
量子星尘发布了新的文献求助10
2秒前
3秒前
33完成签到,获得积分10
3秒前
NCS完成签到,获得积分10
3秒前
乐乐应助香橙采纳,获得10
3秒前
狄拉克乐园完成签到,获得积分10
4秒前
爆米花应助renkemaomao采纳,获得10
4秒前
完美世界应助Max采纳,获得10
4秒前
Cyrus完成签到,获得积分10
4秒前
4秒前
充电宝应助楚天正阔采纳,获得10
4秒前
量子星尘发布了新的文献求助10
5秒前
老迟到的友菱完成签到,获得积分10
5秒前
6秒前
NexusExplorer应助小天才采纳,获得10
7秒前
strawberry发布了新的文献求助10
7秒前
7秒前
斯文败类应助DYZ采纳,获得10
7秒前
11发布了新的文献求助30
8秒前
肯德大厨完成签到 ,获得积分10
8秒前
jojo完成签到 ,获得积分10
8秒前
8秒前
9秒前
Owen应助lixxx采纳,获得10
9秒前
高山流水应助Makta采纳,获得10
9秒前
快乐的一只小跳蛙完成签到,获得积分10
9秒前
爆米花应助XNNI采纳,获得30
10秒前
11秒前
哆啦A梦完成签到 ,获得积分10
11秒前
xxy发布了新的文献求助10
11秒前
大模型应助zxy采纳,获得10
12秒前
杉杉完成签到,获得积分10
13秒前
13秒前
深海蓝鱼发布了新的文献求助30
13秒前
踏实的水云完成签到,获得积分10
13秒前
Owen应助MNing采纳,获得10
13秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Binary Alloy Phase Diagrams, 2nd Edition 8000
Comprehensive Methanol Science Production, Applications, and Emerging Technologies 2000
From Victimization to Aggression 1000
Translanguaging in Action in English-Medium Classrooms: A Resource Book for Teachers 700
Exosomes Pipeline Insight, 2025 500
Red Book: 2024–2027 Report of the Committee on Infectious Diseases 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5653573
求助须知:如何正确求助?哪些是违规求助? 4790162
关于积分的说明 15064753
捐赠科研通 4812180
什么是DOI,文献DOI怎么找? 2574341
邀请新用户注册赠送积分活动 1529955
关于科研通互助平台的介绍 1488680