CMTFNet: CNN and Multiscale Transformer Fusion Network for Remote-Sensing Image Semantic Segmentation

计算机科学 编码器 人工智能 卷积神经网络 分割 变压器 模式识别(心理学) 计算机视觉 物理 量子力学 电压 操作系统
作者
Honglin Wu,Peng Huang,Min Zhang,Wenlong Tang,Xinyu Yu
出处
期刊:IEEE Transactions on Geoscience and Remote Sensing [Institute of Electrical and Electronics Engineers]
卷期号:61: 1-12 被引量:108
标识
DOI:10.1109/tgrs.2023.3314641
摘要

Convolutional neural networks (CNNs) are powerful in extracting local information but lack the ability to model long-range dependencies. In contrast, transformer relies on multihead self-attention mechanisms to effectively extract the global contextual information and thus model long-range dependencies. In this paper, we propose a novel encoder-decoder structured semantic segmentation network, named as CNN and multiscale transformer fusion network (CMTFNet), to extract and fuse local information and multiscale global contextual information of high-resolution remote sensing images. Specifically, to further process the output features from the CNN encoder, we build a transformer decoder based on the multiscale multihead self-attention (M2SA) module for extracting rich multiscale global contextual information and channel information. Additionally, the transformer block introduces an efficient feed-forward network (E-FFN) to enhance the information interaction between different channels of the feature. Finally, the multiscale attention fusion (MAF) module fully fuses the feature information from different levels. We have conducted extensive comparison experiments and ablation experiments on the International Society for Photogrammetry and Remote Sensing (ISPRS) Vaihingen and Potsdam datasets. The extensive experimental results demonstrate that our proposed CMTFNet can obtain superior performance compared to the currently popular methods. The codes will be available at https://github.com/DrWuHonglin/CMTFNet.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
脑洞疼应助wu采纳,获得10
1秒前
英俊的铭应助热情高跟鞋采纳,获得10
1秒前
1秒前
111完成签到,获得积分10
1秒前
2秒前
在水一方应助SEANFLY采纳,获得10
2秒前
3秒前
Arthur完成签到 ,获得积分10
3秒前
3秒前
科研通AI5应助gbr0519采纳,获得10
4秒前
5秒前
5秒前
量子星尘发布了新的文献求助50
5秒前
所所应助地狱跳跳虎采纳,获得10
5秒前
无花果应助小丑采纳,获得10
5秒前
所所应助刘威采纳,获得30
6秒前
6秒前
完美世界应助G1997采纳,获得10
6秒前
7秒前
8秒前
幸福镜子发布了新的文献求助10
8秒前
8秒前
8秒前
8秒前
清柠发布了新的文献求助10
9秒前
爆米花应助tangzanwayne采纳,获得10
9秒前
9秒前
胖胖发布了新的文献求助10
9秒前
晴晴发布了新的文献求助10
10秒前
10秒前
wb发布了新的文献求助10
11秒前
11秒前
sunrase发布了新的文献求助10
12秒前
12秒前
qzp发布了新的文献求助10
12秒前
13秒前
KIVA发布了新的文献求助10
13秒前
13秒前
泡泡金运发布了新的文献求助10
13秒前
wu发布了新的文献求助10
13秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
计划经济时代的工厂管理与工人状况(1949-1966)——以郑州市国营工厂为例 500
INQUIRY-BASED PEDAGOGY TO SUPPORT STEM LEARNING AND 21ST CENTURY SKILLS: PREPARING NEW TEACHERS TO IMPLEMENT PROJECT AND PROBLEM-BASED LEARNING 500
The Pedagogical Leadership in the Early Years (PLEY) Quality Rating Scale 410
Why America Can't Retrench (And How it Might) 400
Guidelines for Characterization of Gas Turbine Engine Total-Pressure, Planar-Wave, and Total-Temperature Inlet-Flow Distortion 300
Stackable Smart Footwear Rack Using Infrared Sensor 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 催化作用 遗传学 冶金 电极 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 4604366
求助须知:如何正确求助?哪些是违规求助? 4012767
关于积分的说明 12424858
捐赠科研通 3693390
什么是DOI,文献DOI怎么找? 2036274
邀请新用户注册赠送积分活动 1069311
科研通“疑难数据库(出版商)”最低求助积分说明 953835