Spatial-Temporal Transformer for Dynamic Scene Graph Generation

计算机科学 编码器 变压器 人工智能 图形 空间语境意识 计算机视觉 理论计算机科学 电压 量子力学 操作系统 物理
作者
Cong Yang,Wuping Liao,Hanno Ackermann,Bodo Rosenhahn,Michael Ying Yang
标识
DOI:10.1109/iccv48922.2021.01606
摘要

Dynamic scene graph generation aims at generating a scene graph of the given video. Compared to the task of scene graph generation from images, it is more challenging because of the dynamic relationships between objects and the temporal dependencies between frames allowing for a richer semantic interpretation. In this paper, we propose Spatial-temporal Transformer (STTran), a neural network that consists of two core modules: (1) a spatial encoder that takes an input frame to extract spatial context and reason about the visual relationships within a frame, and (2) a temporal decoder which takes the output of the spatial encoder as input in order to capture the temporal dependencies between frames and infer the dynamic relationships. Furthermore, STTran is flexible to take varying lengths of videos as input without clipping, which is especially important for long videos. Our method is validated on the benchmark dataset Action Genome (AG). The experimental results demonstrate the superior performance of our method in terms of dynamic scene graphs. Moreover, a set of ablative studies is conducted and the effect of each proposed module is justified. Code available at: https://github.com/yrcong/STTran.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
mmr完成签到,获得积分10
5秒前
隐形曼青应助阿湫采纳,获得10
5秒前
是一整个圆完成签到,获得积分10
9秒前
芽芽配茄子完成签到,获得积分10
12秒前
SJW--666完成签到,获得积分10
14秒前
投石问路完成签到,获得积分10
18秒前
画龙点睛完成签到 ,获得积分10
18秒前
阿Q完成签到,获得积分10
22秒前
王莫为发布了新的文献求助10
27秒前
王二哈完成签到,获得积分10
33秒前
熊二纯牛奶完成签到,获得积分10
33秒前
33秒前
33秒前
bad boy完成签到,获得积分10
36秒前
36秒前
王路宽发布了新的文献求助10
38秒前
CipherSage应助呜呜呜采纳,获得10
43秒前
46秒前
51秒前
52秒前
十一完成签到 ,获得积分10
52秒前
栀然完成签到,获得积分10
53秒前
任性的天空完成签到,获得积分10
53秒前
丁丁完成签到 ,获得积分10
56秒前
秋半梦完成签到 ,获得积分10
56秒前
蓝莓酱完成签到,获得积分0
58秒前
wan发布了新的文献求助10
58秒前
dnmd完成签到,获得积分10
59秒前
1分钟前
Chief完成签到,获得积分10
1分钟前
1分钟前
1分钟前
所所应助wan采纳,获得10
1分钟前
Akim应助背后的巧荷采纳,获得10
1分钟前
llg发布了新的文献求助10
1分钟前
2233完成签到,获得积分10
1分钟前
默默的斑马完成签到,获得积分10
1分钟前
Yoo.发布了新的文献求助10
1分钟前
小马甲应助llg采纳,获得10
1分钟前
JiangHb完成签到,获得积分10
1分钟前
高分求助中
LNG地下式貯槽指針(JGA指-107-19)(Recommended practice for LNG inground storage) 1000
Second Language Writing (2nd Edition) by Ken Hyland, 2019 1000
Generalized Linear Mixed Models 第二版 1000
rhetoric, logic and argumentation: a guide to student writers 1000
QMS18Ed2 | process management. 2nd ed 1000
Operative Techniques in Pediatric Orthopaedic Surgery 510
A High Efficiency Grating Coupler Based on Hybrid Si-Lithium Niobate on Insulator Platform 500
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 免疫学 细胞生物学 电极
热门帖子
关注 科研通微信公众号,转发送积分 2922408
求助须知:如何正确求助?哪些是违规求助? 2566507
关于积分的说明 6938155
捐赠科研通 2222542
什么是DOI,文献DOI怎么找? 1181439
版权声明 588911
科研通“疑难数据库(出版商)”最低求助积分说明 578067