A Survey on Statistical Theory of Deep Learning: Approximation, Training Dynamics, and Generative Models

生成语法 生成模型 动力学(音乐) 培训(气象学) 人工智能 计算机科学 深度学习 机器学习 计量经济学 心理学 数学 地理 教育学 气象学
作者
Namjoon Suh,Guang Cheng
出处
期刊:Annual review of statistics and its application [Annual Reviews]
标识
DOI:10.1146/annurev-statistics-040522-013920
摘要

In this article, we review the literature on statistical theories of neural networks from three perspectives: approximation, training dynamics, and generative models. In the first part, results on excess risks for neural networks are reviewed in the nonparametric framework of regression. These results rely on explicit constructions of neural networks, leading to fast convergence rates of excess risks. Nonetheless, their underlying analysis only applies to the global minimizer in the highly nonconvex landscape of deep neural networks. This motivates us to review the training dynamics of neural networks in the second part. Specifically, we review articles that attempt to answer the question of how a neural network trained via gradient-based methods finds a solution that can generalize well on unseen data. In particular, two well-known paradigms are reviewed: the neural tangent kernel and mean-field paradigms. Last, we review the most recent theoretical advancements in generative models, including generative adversarial networks, diffusion models, and in-context learning in large language models from two of the same perspectives, approximation and training dynamics.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Yolo发布了新的文献求助10
1秒前
单薄不惜完成签到,获得积分10
1秒前
汉堡包应助过时的茗茗采纳,获得10
1秒前
好的完成签到 ,获得积分10
1秒前
debuffv完成签到 ,获得积分10
1秒前
维生素CCC完成签到 ,获得积分10
1秒前
传奇3应助胡健采纳,获得10
2秒前
不不鱼完成签到,获得积分10
2秒前
木直完成签到,获得积分20
2秒前
冷艳的纸鹤完成签到,获得积分10
2秒前
1028181661发布了新的文献求助10
3秒前
鸭子完成签到,获得积分10
3秒前
爱吃泡芙发布了新的文献求助10
4秒前
暖阳完成签到,获得积分10
4秒前
顽主完成签到,获得积分10
4秒前
坚强的茗茗完成签到,获得积分10
4秒前
罐罐儿应助彪壮的刺猬采纳,获得10
5秒前
5秒前
u2u2完成签到,获得积分10
5秒前
5秒前
YH发布了新的文献求助10
5秒前
风趣的小鸽子完成签到,获得积分10
5秒前
整齐的不评完成签到,获得积分10
5秒前
vampirell完成签到,获得积分10
6秒前
单纯的小土豆完成签到 ,获得积分10
6秒前
汉堡包应助1028181661采纳,获得10
6秒前
金秋完成签到,获得积分0
7秒前
David完成签到,获得积分10
7秒前
Ava应助白给的吉采纳,获得10
8秒前
8秒前
Boring完成签到,获得积分10
8秒前
yy完成签到 ,获得积分10
9秒前
hello完成签到,获得积分10
9秒前
研友_851KE8发布了新的文献求助10
9秒前
青炀应助狐尔莫采纳,获得10
10秒前
shamy夫妇完成签到,获得积分10
10秒前
10秒前
linus完成签到,获得积分10
10秒前
11秒前
翻斗花园612完成签到,获得积分10
11秒前
高分求助中
A new approach to the extrapolation of accelerated life test data 1000
Cognitive Neuroscience: The Biology of the Mind 1000
Technical Brochure TB 814: LPIT applications in HV gas insulated switchgear 1000
Immigrant Incorporation in East Asian Democracies 600
Nucleophilic substitution in azasydnone-modified dinitroanisoles 500
不知道标题是什么 500
A Preliminary Study on Correlation Between Independent Components of Facial Thermal Images and Subjective Assessment of Chronic Stress 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3968719
求助须知:如何正确求助?哪些是违规求助? 3513608
关于积分的说明 11168681
捐赠科研通 3248960
什么是DOI,文献DOI怎么找? 1794573
邀请新用户注册赠送积分活动 875194
科研通“疑难数据库(出版商)”最低求助积分说明 804716