Efficient Semantic Segmentation by Altering Resolutions for Compressed Videos

计算机科学 增采样 分割 特征(语言学) 人工智能 编码(集合论) 帧(网络) 相似性(几何) 约束(计算机辅助设计) 图像分辨率 解码方法 模式识别(心理学) 计算机视觉 图像(数学) 算法 机械工程 电信 哲学 语言学 集合(抽象数据类型) 工程类 程序设计语言
作者
Yubin Hu,Yuze He,Yanghao Li,Jisheng Li,Yuxing Han,Jiangtao Wen,Yong‐Jin Liu
标识
DOI:10.1109/cvpr52729.2023.02167
摘要

Video semantic segmentation (VSS) is a computationally expensive task due to the per-frame prediction for videos of high frame rates. In recent work, compact models or adaptive network strategies have been proposed for efficient VSS. However, they did not consider a crucial factor that affects the computational cost from the input side: the input resolution. In this paper, we propose an altering resolution framework called AR-Seg for compressed videos to achieve efficient VSS. AR-Seg aims to reduce the computational cost by using low resolution for non-keyframes. To prevent the performance degradation caused by downsampling, we design a Cross Resolution Feature Fusion (CR-eFF) module, and supervise it with a novel Feature Similarity Training (FST) strategy. Specifically, CReFF first makes use of motion vectors stored in a compressed video to warp features from high-resolution keyframes to low-resolution non-keyframes for better spatial alignment, and then selectively aggregates the warped features with local attention mechanism. Furthermore, the proposed FST supervises the aggregated features with high-resolution features through an explicit similarity loss and an implicit constraint from the shared decoding layer. Extensive experiments on CamVid and Cityscapes show that AR-Seg achieves state-of-the-art performance and is compatible with different segmentation backbones. On CamVid, AR-Seg saves 67% computational cost (measured in GFLOPs) with the PSPNet18 back-bone while maintaining high segmentation accuracy. Code: https://github.com/THU-LYJ-Lab/AR-Seg.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
深情安青应助ywq123采纳,获得10
刚刚
Masetti1完成签到 ,获得积分10
刚刚
爱笑灵竹发布了新的文献求助10
1秒前
oMayii完成签到 ,获得积分10
2秒前
彬墩墩发布了新的文献求助10
3秒前
3秒前
彩色若风完成签到,获得积分10
4秒前
Hello应助keran采纳,获得10
5秒前
5秒前
木南发布了新的文献求助10
6秒前
以太完成签到,获得积分10
7秒前
ww发布了新的文献求助10
8秒前
Urusaiina发布了新的文献求助30
10秒前
HanHan发布了新的文献求助10
10秒前
理塘大学士完成签到,获得积分10
11秒前
一一应助傢誠采纳,获得30
11秒前
小聋包完成签到,获得积分10
13秒前
13秒前
无花果应助啦啦啦喽采纳,获得10
14秒前
小二郎应助木南采纳,获得10
15秒前
六六完成签到,获得积分10
16秒前
彬墩墩完成签到,获得积分10
16秒前
GG完成签到,获得积分10
17秒前
18秒前
lucky完成签到,获得积分10
18秒前
传奇3应助ywq123采纳,获得10
19秒前
穆紫应助HanHan采纳,获得10
20秒前
豆浆小姐q发布了新的文献求助10
20秒前
慕青应助fanghua采纳,获得10
21秒前
月月完成签到,获得积分10
21秒前
周新运发布了新的文献求助10
23秒前
李-完成签到,获得积分10
23秒前
24秒前
超级的初彤完成签到,获得积分10
26秒前
小鱼完成签到 ,获得积分10
28秒前
28秒前
Akim应助橘子的橘采纳,获得10
28秒前
努力打个共完成签到,获得积分10
29秒前
bot_753发布了新的文献求助10
29秒前
cctv18应助威武青亦采纳,获得10
29秒前
高分求助中
Sustainability in Tides Chemistry 1500
TM 5-855-1(Fundamentals of protective design for conventional weapons) 1000
CLSI EP47 Evaluation of Reagent Carryover Effects on Test Results, 1st Edition 800
Threaded Harmony: A Sustainable Approach to Fashion 799
Livre et militantisme : La Cité éditeur 1958-1967 500
Retention of title in secured transactions law from a creditor's perspective: A comparative analysis of selected (non-)functional approaches 500
"Sixth plenary session of the Eighth Central Committee of the Communist Party of China" 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3055748
求助须知:如何正确求助?哪些是违规求助? 2712398
关于积分的说明 7431409
捐赠科研通 2357400
什么是DOI,文献DOI怎么找? 1248780
科研通“疑难数据库(出版商)”最低求助积分说明 606786
版权声明 596163