Few-shot Action Recognition via Multi-view Representation Learning

弹丸 代表(政治) 动作(物理) 人工智能 计算机科学 行动学习 动作识别 模式识别(心理学) 心理学 政治学 班级(哲学) 数学教育 物理 化学 政治 合作学习 法学 有机化学 量子力学 教学方法
作者
Xiao Wang,Yang Lu,YU Wan-chuan,Yanwei Pang,Hanzi Wang
出处
期刊:IEEE Transactions on Circuits and Systems for Video Technology [Institute of Electrical and Electronics Engineers]
卷期号:34 (9): 8522-8535 被引量:1
标识
DOI:10.1109/tcsvt.2024.3384875
摘要

Few-shot action recognition aims to recognize novel action classes with limited labeled samples and has recently received increasing attention. The core objective of few-shot action recognition is to enhance the discriminability of feature representations. In this paper, we propose a novel multi-view representation learning network (MRLN) to model intra-video and inter-video relations for few-shot action recognition. Specifically, we first propose a spatial-aware aggregation refinement module (SARM), which mainly consists of a spatial-aware aggregation sub-module and a spatial-aware refinement sub-module to explore the spatial context of samples at the frame level. Then, we design a temporal-channel enhancement module (TCEM), which can capture the temporal-aware and channel-aware features of samples with the elaborately designed temporal-aware enhancement sub-module and channel-aware enhancement sub-module. Third, we introduce a cross-video relation module (CVRM), which can explore the relations across videos by utilizing the self-attention mechanism. Moreover, we design a prototype-centered mean absolute error loss to improve the feature learning capability of the proposed MRLN. Extensive experiments on four prevalent few-shot action recognition benchmarks show that the proposed MRLN can significantly outperform a variety of state-of-the-art few-shot action recognition methods. Especially, on the 5-way 1-shot setting, our MRLN respectively achieves 75.7%, 86.9%, 65.5% and 45.9% on the Kinetics, UCF101, HMDB51 and SSv2 datasets.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
正直完成签到 ,获得积分10
1秒前
2秒前
大个应助lcs采纳,获得10
2秒前
英俊的铭应助哈士奇采纳,获得10
2秒前
wwwying完成签到,获得积分20
3秒前
3秒前
摩登兄弟发布了新的文献求助10
3秒前
3秒前
传奇3应助wilaken采纳,获得10
4秒前
4秒前
4秒前
傲娇黄豆发布了新的文献求助30
5秒前
执着的忆雪完成签到,获得积分10
6秒前
6秒前
007完成签到,获得积分10
6秒前
Ivychao发布了新的文献求助10
7秒前
念念完成签到,获得积分10
8秒前
纯真盛男发布了新的文献求助30
8秒前
兔毛毛完成签到,获得积分10
8秒前
火火吴发布了新的文献求助10
9秒前
李青梅完成签到,获得积分10
9秒前
9秒前
龚成明发布了新的文献求助10
10秒前
10秒前
zhikaiyici完成签到,获得积分10
11秒前
11秒前
12秒前
12秒前
12秒前
阿喵完成签到,获得积分0
13秒前
13秒前
wangwangdui完成签到,获得积分10
14秒前
14秒前
DDDD发布了新的文献求助10
14秒前
14秒前
龚成明完成签到,获得积分10
15秒前
研友_5Zl9D8发布了新的文献求助10
15秒前
多情dingding完成签到,获得积分10
15秒前
时尚的冷玉完成签到,获得积分10
15秒前
动听柚子发布了新的文献求助10
17秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Mechanistic Modeling of Gas-Liquid Two-Phase Flow in Pipes 2500
Structural Load Modelling and Combination for Performance and Safety Evaluation 1000
Conference Record, IAS Annual Meeting 1977 710
電気学会論文誌D(産業応用部門誌), 141 巻, 11 号 510
Virulence Mechanisms of Plant-Pathogenic Bacteria 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3563884
求助须知:如何正确求助?哪些是违规求助? 3137084
关于积分的说明 9421008
捐赠科研通 2837557
什么是DOI,文献DOI怎么找? 1559894
邀请新用户注册赠送积分活动 729212
科研通“疑难数据库(出版商)”最低求助积分说明 717195