Learning Spatio-Temporal Semantics and Cluster Relation for Zero-Shot Action Recognition

计算机科学 语义学(计算机科学) 班级(哲学) 代表(政治) 关系(数据库) 桥接(联网) 人工智能 语义鸿沟 符号 模式识别(心理学) 图像(数学) 理论计算机科学 数据挖掘 数学 图像检索 程序设计语言 计算机网络 算术 政治 政治学 法学
作者
Jiajun Gao,Yonghong Hou,Zihui Guo,Haochun Zheng
出处
期刊:IEEE Transactions on Circuits and Systems for Video Technology [Institute of Electrical and Electronics Engineers]
卷期号:33 (11): 6519-6530 被引量:2
标识
DOI:10.1109/tcsvt.2023.3272627
摘要

Zero-shot Action Recognition (ZSAR) aims at bridging the video $\rightarrow $ class relation with only labeled training data of seen classes while generalizing the model to alleviate the heterogeneity of unseen actions. Most existing methods have comprehensively represented videos and action classes, however, the semantic gap and the hubness problem between them remain crucial challenges that are under-explored. In this paper, we propose an effective method to tackle the above issues. Specifically, to narrow the semantic gap, we end-to-end generate a spatio-temporal semantics for each video, which provides essential textual information to refine the video representation. Furthermore, we propose a compactness-separability loss that optimizes the intra- and inter-class relations in a unified formula and quantitatively constrains cluster distribution, thus effectively diminishing the impact of the hubness problem. Extensive experiments on UCF101, HMDB51, and Olympic Sports datasets prove the effectiveness of the proposed approach and demonstrate our approach outperforms the state-of-the-art methods.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
luquanji完成签到,获得积分10
刚刚
iris2333发布了新的文献求助10
1秒前
magic7完成签到,获得积分10
1秒前
苏苏苏苏苏完成签到,获得积分10
2秒前
oracl发布了新的文献求助10
2秒前
芫菁发布了新的文献求助10
4秒前
锡嘻完成签到 ,获得积分10
5秒前
青青完成签到,获得积分10
6秒前
共享精神应助iris2333采纳,获得10
6秒前
凶狠的绿兰完成签到,获得积分10
6秒前
无极微光应助淡淡的忆彤采纳,获得20
7秒前
故意的若风完成签到,获得积分10
8秒前
孟陬二四完成签到,获得积分10
9秒前
mmyhn应助囧素囧采纳,获得20
10秒前
左右兮完成签到,获得积分0
10秒前
w9412完成签到,获得积分10
11秒前
宣花雨完成签到,获得积分10
12秒前
一朵小鲜花儿完成签到,获得积分10
13秒前
科研通AI2S应助孟陬二四采纳,获得10
13秒前
jenningseastera完成签到,获得积分0
13秒前
骑猪兜风完成签到 ,获得积分10
14秒前
ZZZ完成签到,获得积分10
14秒前
小小完成签到,获得积分10
16秒前
miao3718完成签到 ,获得积分10
16秒前
超级的慕山完成签到,获得积分10
16秒前
Niuniu完成签到,获得积分10
16秒前
林勇德完成签到,获得积分10
17秒前
巴乔完成签到,获得积分10
17秒前
kathy完成签到,获得积分10
18秒前
18秒前
MRshenyy完成签到,获得积分10
19秒前
积极的随阴完成签到,获得积分10
19秒前
小满完成签到,获得积分10
20秒前
猕猴桃完成签到 ,获得积分10
20秒前
21秒前
Wsh完成签到,获得积分10
21秒前
vivi完成签到 ,获得积分10
21秒前
Yanping完成签到,获得积分10
22秒前
小郭的华南虎完成签到,获得积分10
22秒前
23秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Introduction to Helicopter and Tiltrotor Flight Simulation, Second Edition 2500
卤化钙钛矿人工突触的研究 2000
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
Software that combines deep learning,3D reconstruction and CFD to analyze the state of carotid arteries from ultrasound imaging 600
Bounds for Statistical Estimation in Semiparametric Models 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6498307
求助须知:如何正确求助?哪些是违规求助? 8294269
关于积分的说明 17697224
捐赠科研通 5594352
什么是DOI,文献DOI怎么找? 2917610
邀请新用户注册赠送积分活动 1894577
关于科研通互助平台的介绍 1755252