标题 |
Multi-Granularity Aggregation Transformer for Joint Video-Audio-Text Representation Learning
用于视频-音频-文本联合表示学习的多粒度聚合Transformer
相关领域
计算机科学
粒度
隐藏字幕
模态(人机交互)
模式
变压器
人工智能
特征学习
情报检索
自然语言处理
物理
量子力学
社会科学
电压
社会学
图像(数学)
操作系统
|
网址 | |
DOI | |
其它 |
期刊:IEEE Transactions on Circuits and Systems for Video Technology 作者:Mengge He; Wenjing Du; Zhiquan Wen; Qing Du; Yutong Xie; et al 出版日期:2022-12-01 |
求助人 | |
下载 | 暂无链接,等待应助者上传 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|