标题 |
Multimodal Analysis for Deep Video Understanding with Video Language Transformer
基于视频语言转换器的深度视频理解多模态分析
相关领域
计算机科学
变压器
匹配(统计)
人工智能
模态(人机交互)
情态动词
自然语言处理
多媒体
情报检索
人机交互
物理
统计
电压
化学
高分子化学
量子力学
数学
|
网址 | |
DOI | |
其它 |
期刊:Proceedings of the 30th ACM International Conference on Multimedia 作者:Beibei Zhang; Yaqun Fang; Tongwei Ren; Gangshan Wu 出版日期:2022-10-10 |
求助人 | |
下载 | 该求助完结已超 24 小时,文件已从服务器自动删除,无法下载。 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|