Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

变压器 计算机科学 人工智能 分割 计算 像素 建筑 计算机视觉 图像分割 算法 电压 工程类 电气工程 艺术 视觉艺术
作者
Ze Liu,Yutong Lin,Yue Cao,Han Hu,Yixuan Wei,Zheng Zhang,Stephen Lin,Baining Guo
标识
DOI:10.1109/iccv48922.2021.00986
摘要

This paper presents a new vision Transformer, called Swin Transformer, that capably serves as a general-purpose backbone for computer vision. Challenges in adapting Transformer from language to vision arise from differences between the two domains, such as large variations in the scale of visual entities and the high resolution of pixels in images compared to words in text. To address these differences, we propose a hierarchical Transformer whose representation is computed with Shifted windows. The shifted windowing scheme brings greater efficiency by limiting self-attention computation to non-overlapping local windows while also allowing for cross-window connection. This hierarchical architecture has the flexibility to model at various scales and has linear computational complexity with respect to image size. These qualities of Swin Transformer make it compatible with a broad range of vision tasks, including image classification (87.3 top-1 accuracy on ImageNet-1K) and dense prediction tasks such as object detection (58.7 box AP and 51.1 mask AP on COCO test-dev) and semantic segmentation (53.5 mIoU on ADE20K val). Its performance surpasses the previous state-of-the-art by a large margin of +2.7 box AP and +2.6 mask AP on COCO, and +3.2 mIoU on ADE20K, demonstrating the potential of Transformer-based models as vision backbones. The hierarchical design and the shifted window approach also prove beneficial for all-MLP architectures. The code and models are publicly available at https://github.com/microsoft/Swin-Transformer.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
牛马完成签到 ,获得积分10
2秒前
跳跃的鹏飞完成签到 ,获得积分10
3秒前
tengyi完成签到 ,获得积分10
6秒前
852应助HM采纳,获得10
7秒前
1002SHIB完成签到,获得积分10
19秒前
nihaolaojiu完成签到,获得积分10
19秒前
sheetung完成签到,获得积分10
20秒前
20秒前
麦田麦兜完成签到,获得积分10
20秒前
C.Cat完成签到,获得积分10
22秒前
25秒前
31秒前
ZZICU完成签到,获得积分10
47秒前
jason完成签到 ,获得积分10
57秒前
58秒前
小公牛完成签到 ,获得积分10
1分钟前
小杨完成签到,获得积分10
1分钟前
1分钟前
善良的剑通完成签到 ,获得积分10
1分钟前
1分钟前
喜悦的香之完成签到 ,获得积分10
1分钟前
家迎松完成签到,获得积分10
1分钟前
心想事成完成签到 ,获得积分10
1分钟前
帅气的沧海完成签到 ,获得积分10
1分钟前
bensonyang1013完成签到 ,获得积分10
1分钟前
禾中丨小骨完成签到 ,获得积分10
1分钟前
单小芫完成签到 ,获得积分10
1分钟前
jintian完成签到 ,获得积分10
1分钟前
陈补天完成签到 ,获得积分10
2分钟前
2分钟前
HM发布了新的文献求助10
2分钟前
lr完成签到 ,获得积分10
2分钟前
搬砖的化学男完成签到 ,获得积分0
2分钟前
笨鸟先飞完成签到 ,获得积分10
2分钟前
传奇3应助科研通管家采纳,获得10
2分钟前
脑洞疼应助科研通管家采纳,获得10
2分钟前
丘比特应助科研通管家采纳,获得10
2分钟前
来自三百完成签到,获得积分10
2分钟前
张北海应助简单采纳,获得20
2分钟前
apckkk完成签到 ,获得积分10
2分钟前
高分求助中
The Mother of All Tableaux: Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 3000
A new approach to the extrapolation of accelerated life test data 1000
Problems of point-blast theory 400
Indomethacinのヒトにおける経皮吸収 400
基于可调谐半导体激光吸收光谱技术泄漏气体检测系统的研究 370
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 370
Robot-supported joining of reinforcement textiles with one-sided sewing heads 320
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3996002
求助须知:如何正确求助?哪些是违规求助? 3535669
关于积分的说明 11267397
捐赠科研通 3275275
什么是DOI,文献DOI怎么找? 1806560
邀请新用户注册赠送积分活动 883378
科研通“疑难数据库(出版商)”最低求助积分说明 809785