Enhanced multi-scale networks for semantic segmentation

分割 计算机科学 人工智能 像素 模式识别(心理学) 特征(语言学) 相似性(几何) 背景(考古学) 尺度空间分割 频道(广播) 比例(比率) 图像分割 图像(数学) 古生物学 计算机网络 哲学 语言学 物理 量子力学 生物
作者
Tianping Li,Zhaotong Cui,Han Yu,Guanxing Li,Meng Li,Dongmei Wei
出处
期刊:Complex & Intelligent Systems 卷期号:10 (2): 2557-2568 被引量:4
标识
DOI:10.1007/s40747-023-01279-x
摘要

Abstract Multi-scale representation provides an effective answer to the scale variation of objects and entities in semantic segmentation. The ability to capture long-range pixel dependency facilitates semantic segmentation. In addition, semantic segmentation necessitates the effective use of pixel-to-pixel similarity in the channel direction to enhance pixel areas. By reviewing the characteristics of earlier successful segmentation models, we discover a number of crucial elements that enhance segmentation model performance, including a robust encoder structure, multi-scale interactions, attention mechanisms, and a robust decoder structure. The attention mechanism of the asymmetric non-local neural network (ANNet) is merged with multi-scale pyramidal modules to accelerate model segmentation while maintaining high accuracy. However, ANNet does not account for the similarity between pixels in the feature map channel direction, making the segmentation accuracy unsatisfactory. As a result, we propose EMSNet, a straightforward convolutional network architecture for semantic segmentation that consists of Integration of enhanced regional module (IERM) and Multi-scale convolution module (MSCM). The IERM module generates weights using four or five-stage feature maps, then fuses the input features with the weights and uses more computation. The similarity of the channel direction feature graphs is also calculated using ANNet’s auxiliary loss function. The MSCM module can more accurately describe the interactions between various channels, capture the interdependencies between feature pixels, and capture the multi-scale context. Experiments prove that we perform well in tests using the benchmark dataset. On Cityscapes test data, we get 82.2% segmentation accuracy. The mIoU in the ADE20k and Pascal VOC datasets are, respectively, 45.58% and 85.46%.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
万能图书馆应助aging123采纳,获得10
2秒前
十一完成签到,获得积分20
2秒前
2秒前
2秒前
3秒前
科研通AI5应助俊逸的翠容采纳,获得10
3秒前
火柴发布了新的文献求助10
3秒前
rrrr完成签到,获得积分20
4秒前
十一发布了新的文献求助10
6秒前
平安喜乐发布了新的文献求助10
7秒前
wangyu发布了新的文献求助10
8秒前
10秒前
天真初蝶完成签到,获得积分10
12秒前
科研通AI2S应助ohh采纳,获得10
12秒前
pluto应助南瓜汤采纳,获得10
13秒前
大模型应助崔梦楠采纳,获得10
13秒前
未来完成签到,获得积分10
14秒前
小乐完成签到,获得积分10
14秒前
STAR发布了新的文献求助10
15秒前
15秒前
17秒前
18秒前
19秒前
wangyu完成签到,获得积分10
19秒前
mmz完成签到 ,获得积分10
20秒前
21秒前
sevenseven完成签到 ,获得积分10
22秒前
邸增楼发布了新的文献求助10
22秒前
科研小白发布了新的文献求助10
22秒前
刘能能完成签到,获得积分10
23秒前
小邱完成签到 ,获得积分10
23秒前
帅气西牛完成签到,获得积分10
24秒前
小学徒发布了新的文献求助10
24秒前
大碗完成签到 ,获得积分10
25秒前
快乐元菱完成签到 ,获得积分10
27秒前
30秒前
小蘑菇应助饱满若灵采纳,获得30
31秒前
31秒前
田様应助科研小白采纳,获得10
31秒前
小蘑菇应助火柴采纳,获得10
33秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
こんなに痛いのにどうして「なんでもない」と医者にいわれてしまうのでしょうか 510
The First Nuclear Era: The Life and Times of a Technological Fixer 500
ALUMINUM STANDARDS AND DATA 500
Walter Gilbert: Selected Works 500
岡本唐貴自伝的回想画集 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3667816
求助须知:如何正确求助?哪些是违规求助? 3226284
关于积分的说明 9768970
捐赠科研通 2936235
什么是DOI,文献DOI怎么找? 1608336
邀请新用户注册赠送积分活动 759642
科研通“疑难数据库(出版商)”最低求助积分说明 735434