Transformer and CNN Hybrid Deep Neural Network for Semantic Segmentation of Very-High-Resolution Remote Sensing Imagery

计算机科学 人工智能 分割 编码器 卷积神经网络 棱锥(几何) 模式识别(心理学) 图像分割 特征(语言学) 深度学习 特征提取 计算机视觉 操作系统 光学 物理 哲学 语言学
作者
Cheng Zhang,Wanshou Jiang,Yuan Zhang,Wei Wang,Qing Zhao,Chenjie Wang
出处
期刊:IEEE Transactions on Geoscience and Remote Sensing [Institute of Electrical and Electronics Engineers]
卷期号:60: 1-20 被引量:147
标识
DOI:10.1109/tgrs.2022.3144894
摘要

This article presents a transformer and convolutional neural network (CNN) hybrid deep neural network for semantic segmentation of very high resolution (VHR) remote sensing imagery. The model follows an encoder–decoder structure. The encoder module uses a new universal backbone Swin transformer to extract features to achieve better long-range spatial dependencies modeling. The decoder module draws on some effective blocks and successful strategies of CNN-based models in remote sensing image segmentation. In the middle of the framework, an atrous spatial pyramid pooling block based on depthwise separable convolution (SASPP) is applied to obtain a multiscale context. A U-shaped decoder is used to gradually restore the size of the feature maps. Three skip connections are built between the encoder and decoder feature maps of the same size to maintain the transmission of local details and enhance the communication of multiscale features. A squeeze-and-excitation (SE) channel attention block is added before segmentation for feature augmentation. An auxiliary boundary detection branch is combined to provide edge constraints for semantic segmentation. Extensive ablation experiments were conducted on the International Society for Photogrammetry and Remote Sensing (ISPRS) Vaihingen and Potsdam benchmarks to test the effectiveness of multiple components of the network. At the same time, the proposed method is compared with the current state-of-the-art methods on the two benchmarks. The proposed hybrid network achieved the second highest overall accuracy (OA) on both the Potsdam and Vaihingen benchmarks (code and models are available at https://github.com/zq7734509/mmsegmentation- multilayer).
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
溜铭钛发布了新的文献求助10
刚刚
刚刚
1秒前
2秒前
2秒前
华仔应助轻松的雪青采纳,获得10
2秒前
开心尔琴应助娇气的雁兰采纳,获得10
2秒前
2秒前
2秒前
风涧完成签到 ,获得积分10
3秒前
噗噗完成签到,获得积分10
3秒前
苻人英完成签到,获得积分10
3秒前
3秒前
搜集达人应助sda采纳,获得10
5秒前
bkagyin应助SWZ采纳,获得10
7秒前
开朗紫发布了新的文献求助10
8秒前
上官若男应助谨慎的雨琴采纳,获得10
9秒前
meilongyong完成签到,获得积分10
9秒前
11秒前
娃哈哈完成签到,获得积分10
12秒前
12秒前
12秒前
随心完成签到,获得积分20
12秒前
搜集达人应助杨66采纳,获得10
13秒前
夏沫完成签到,获得积分10
14秒前
思源应助Zhaowx采纳,获得10
14秒前
松松包发布了新的文献求助10
15秒前
wjx发布了新的文献求助10
15秒前
锅包肉发布了新的文献求助10
15秒前
2月3日的猴妈完成签到,获得积分10
15秒前
15秒前
15秒前
16秒前
17秒前
关耳完成签到,获得积分10
17秒前
随心发布了新的文献求助10
18秒前
18秒前
斯文败类应助研友_ngK9rn采纳,获得10
19秒前
sda发布了新的文献求助10
20秒前
21秒前
高分求助中
Handbook of Fuel Cells, 6 Volume Set 1666
求助这个网站里的问题集 1000
Floxuridine; Third Edition 1000
Tracking and Data Fusion: A Handbook of Algorithms 1000
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 800
消化器内視鏡関連の偶発症に関する第7回全国調査報告2019〜2021年までの3年間 500
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 内科学 物理 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 冶金 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 2862080
求助须知:如何正确求助?哪些是违规求助? 2467821
关于积分的说明 6691820
捐赠科研通 2158665
什么是DOI,文献DOI怎么找? 1146767
版权声明 585157
科研通“疑难数据库(出版商)”最低求助积分说明 563433