Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs

计算机科学 核(代数) 卷积神经网络 参数化复杂度 可扩展性 缩放比例 人工智能 树核 变压器 对比度(视觉) 模式识别(心理学) 核方法 机器学习 支持向量机 算法 分布的核嵌入 数学 几何学 量子力学 电压 物理 组合数学 数据库
作者
Xiaohan Ding,Xiangyu Zhang,Yizhuang Zhou,Jungong Han,Guiguang Ding,Jian Sun
出处
期刊:Cornell University - arXiv 被引量:17
标识
DOI:10.48550/arxiv.2203.06717
摘要

We revisit large kernel design in modern convolutional neural networks (CNNs). Inspired by recent advances in vision transformers (ViTs), in this paper, we demonstrate that using a few large convolutional kernels instead of a stack of small kernels could be a more powerful paradigm. We suggested five guidelines, e.g., applying re-parameterized large depth-wise convolutions, to design efficient high-performance large-kernel CNNs. Following the guidelines, we propose RepLKNet, a pure CNN architecture whose kernel size is as large as 31x31, in contrast to commonly used 3x3. RepLKNet greatly closes the performance gap between CNNs and ViTs, e.g., achieving comparable or superior results than Swin Transformer on ImageNet and a few typical downstream tasks, with lower latency. RepLKNet also shows nice scalability to big data and large models, obtaining 87.8% top-1 accuracy on ImageNet and 56.0% mIoU on ADE20K, which is very competitive among the state-of-the-arts with similar model sizes. Our study further reveals that, in contrast to small-kernel CNNs, large-kernel CNNs have much larger effective receptive fields and higher shape bias rather than texture bias. Code & models at https://github.com/megvii-research/RepLKNet.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
东郭南松发布了新的文献求助10
刚刚
1秒前
1秒前
烟花应助miao采纳,获得10
1秒前
酷炫翠桃完成签到,获得积分10
3秒前
丘比特应助苹果路人采纳,获得10
6秒前
choey发布了新的文献求助10
6秒前
ZZZ完成签到,获得积分10
8秒前
科研混子完成签到,获得积分10
8秒前
9秒前
10秒前
甲基醚完成签到 ,获得积分10
11秒前
11秒前
13秒前
14秒前
小鹿5460发布了新的文献求助10
15秒前
黎羽发布了新的文献求助10
15秒前
asdfghj发布了新的文献求助10
16秒前
16秒前
18秒前
18秒前
欢喜的涔发布了新的文献求助10
18秒前
啥时候吃火锅完成签到 ,获得积分0
20秒前
tunerling完成签到,获得积分10
21秒前
文艺的元柏完成签到 ,获得积分20
21秒前
阔达听寒发布了新的文献求助10
23秒前
温逊发布了新的文献求助10
23秒前
小二郎应助龙华之士采纳,获得10
23秒前
学术小兔发布了新的文献求助10
23秒前
黎羽完成签到,获得积分20
23秒前
健忘数据线完成签到 ,获得积分10
24秒前
老迟到的羊完成签到 ,获得积分10
26秒前
26秒前
27秒前
无辜的猎豹完成签到 ,获得积分10
28秒前
麦冬完成签到,获得积分20
29秒前
30秒前
z派关注了科研通微信公众号
30秒前
30秒前
木木发布了新的文献求助10
31秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Conference Record, IAS Annual Meeting 1977 1250
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
APA educational psychology handbook, Vol 1: Theories, constructs, and critical issues 700
An Annotated Checklist of Dinosaur Species by Continent 500
岡本唐貴自伝的回想画集 500
Distinct Aggregation Behaviors and Rheological Responses of Two Terminally Functionalized Polyisoprenes with Different Quadruple Hydrogen Bonding Motifs 450
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3652029
求助须知:如何正确求助?哪些是违规求助? 3216197
关于积分的说明 9711172
捐赠科研通 2924058
什么是DOI,文献DOI怎么找? 1601466
邀请新用户注册赠送积分活动 754190
科研通“疑难数据库(出版商)”最低求助积分说明 732987