A Semantic and Motion-Aware Spatiotemporal Transformer Network for Action Detection

计算机科学 人工智能 语义学(计算机科学) 变压器 运动(物理) 利用 特征(语言学) 模式识别(心理学) 计算机视觉 自然语言处理 物理 量子力学 电压 语言学 哲学 计算机安全 程序设计语言
作者
Matthew Korban,Peter Youngs,Scott T. Acton
出处
期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence [Institute of Electrical and Electronics Engineers]
卷期号:: 1-16
标识
DOI:10.1109/tpami.2024.3377192
摘要

This paper presents a novel spatiotemporal transformer network that introduces several original components to detect actions in untrimmed videos. First, the multi-feature selective semantic attention model calculates the correlations between spatial and motion features to model spatiotemporal interactions between different action semantics properly. Second, the motion-aware network encodes the locations of action semantics in video frames utilizing the motion-aware 2D positional encoding algorithm. Such a motion-aware mechanism memorizes the dynamic spatiotemporal variations in action frames that current methods cannot exploit. Third, the sequence-based temporal attention model captures the heterogeneous temporal dependencies in action frames. In contrast to standard temporal attention used in natural language processing, primarily aimed at finding similarities between linguistic words, the proposed sequence-based temporal attention is designed to determine both the differences and similarities between video frames that jointly define the meaning of actions. The proposed approach outperforms the state-of-the-art solutions on four spatiotemporal action datasets: AVA 2.2, AVA 2.1, UCF101-24, and EPIC-Kitchens.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
1秒前
小熊发布了新的文献求助10
1秒前
糊糊完成签到 ,获得积分20
2秒前
这个文献你有么完成签到,获得积分10
2秒前
2秒前
天天快乐应助坤坤采纳,获得10
2秒前
香蕉觅云应助泥巴采纳,获得10
2秒前
荟菁完成签到,获得积分10
2秒前
cole完成签到 ,获得积分10
3秒前
SDNUDRUG完成签到,获得积分10
3秒前
XP416完成签到,获得积分10
3秒前
蛋蛋应助ZHANG采纳,获得10
3秒前
3秒前
云汐儿应助Joy采纳,获得10
4秒前
4秒前
莫华龙发布了新的文献求助10
4秒前
善学以致用应助阿尼采纳,获得20
5秒前
Jun发布了新的文献求助10
5秒前
南_完成签到,获得积分10
7秒前
夏侯以旋完成签到,获得积分10
7秒前
雪山飞狐完成签到,获得积分10
7秒前
7秒前
善学以致用应助小董不懂采纳,获得10
7秒前
8秒前
8秒前
zhy完成签到,获得积分10
8秒前
X7完成签到,获得积分10
9秒前
Csy完成签到,获得积分10
9秒前
宇文青寒发布了新的文献求助10
9秒前
火星上曼冬完成签到,获得积分10
9秒前
9秒前
Gorge完成签到,获得积分10
10秒前
与木完成签到,获得积分10
10秒前
满天星完成签到,获得积分10
11秒前
我爱科研完成签到 ,获得积分10
11秒前
LJS发布了新的文献求助10
12秒前
12秒前
xh完成签到,获得积分10
12秒前
12秒前
高分求助中
Evolution 10000
Sustainability in Tides Chemistry 2800
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
An Introduction to Geographical and Urban Economics: A Spiky World Book by Charles van Marrewijk, Harry Garretsen, and Steven Brakman 500
Diagnostic immunohistochemistry : theranostic and genomic applications 6th Edition 500
Chen Hansheng: China’s Last Romantic Revolutionary 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3151195
求助须知:如何正确求助?哪些是违规求助? 2802651
关于积分的说明 7849434
捐赠科研通 2460087
什么是DOI,文献DOI怎么找? 1309478
科研通“疑难数据库(出版商)”最低求助积分说明 628915
版权声明 601760