亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Multimodal Fusion Refiner Networks.

融合 计算机科学 模块化设计 图形 解码方法 人工智能 传感器融合 变压器 融合规则 代表(政治) 数据挖掘 图像融合 理论计算机科学 算法 工程类 图像(数学) 电气工程 哲学 操作系统 政治 电压 法学 语言学 政治学
作者
Sethuraman Sankaran,David J. Yang,Ser-Nam Lim
出处
期刊:Cornell University - arXiv 被引量:2
摘要

Tasks that rely on multi-modal information typically include a fusion module that combines information from different modalities. In this work, we develop a Refiner Fusion Network (ReFNet) that enables fusion modules to combine strong unimodal representation with strong multimodal representations. ReFNet combines the fusion network with a decoding/defusing module, which imposes a modality-centric responsibility condition. This approach addresses a big gap in existing multimodal fusion frameworks by ensuring that both unimodal and fused representations are strongly encoded in the latent fusion space. We demonstrate that the Refiner Fusion Network can improve upon performance of powerful baseline fusion modules such as multimodal transformers. The refiner network enables inducing graphical representations of the fused embeddings in the latent space, which we prove under certain conditions and is supported by strong empirical results in the numerical experiments. These graph structures are further strengthened by combining the ReFNet with a Multi-Similarity contrastive loss function. The modular nature of Refiner Fusion Network lends itself to be combined with different fusion architectures easily, and in addition, the refiner step can be applied for pre-training on unlabeled datasets, thus leveraging unsupervised data towards improving performance. We demonstrate the power of Refiner Fusion Networks on three datasets, and further show that they can maintain performance with only a small fraction of labeled data.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
建议保存本图,每天支付宝扫一扫(相册选取)领红包
实时播报
xixiazhiwang完成签到 ,获得积分10
13秒前
22秒前
25秒前
30秒前
34秒前
氢氧化钠Li完成签到,获得积分10
41秒前
清风朗月完成签到,获得积分10
58秒前
59秒前
天天快乐应助月华采纳,获得10
1分钟前
1分钟前
冷艳的萝莉完成签到,获得积分10
1分钟前
1分钟前
hyyyh发布了新的文献求助10
1分钟前
1分钟前
1分钟前
青青2020发布了新的文献求助10
1分钟前
英俊的铭应助青青2020采纳,获得10
1分钟前
浮游应助科研通管家采纳,获得10
1分钟前
浮游应助科研通管家采纳,获得10
1分钟前
浮游应助科研通管家采纳,获得10
1分钟前
ceeray23应助科研通管家采纳,获得10
1分钟前
GingerF应助科研通管家采纳,获得50
1分钟前
浮游应助科研通管家采纳,获得10
1分钟前
ceeray23应助科研通管家采纳,获得10
1分钟前
ceeray23应助科研通管家采纳,获得10
1分钟前
浮游应助科研通管家采纳,获得10
1分钟前
浮游应助科研通管家采纳,获得10
1分钟前
ceeray23应助科研通管家采纳,获得10
1分钟前
顾矜应助青柠采纳,获得10
1分钟前
2分钟前
2分钟前
oo完成签到 ,获得积分10
2分钟前
Jasper应助青柠采纳,获得10
2分钟前
2分钟前
sakiko发布了新的文献求助10
2分钟前
2分钟前
2分钟前
2分钟前
serein发布了新的文献求助10
2分钟前
青柠发布了新的文献求助10
2分钟前
高分求助中
Learning and Memory: A Comprehensive Reference 2000
Predation in the Hymenoptera: An Evolutionary Perspective 1800
List of 1,091 Public Pension Profiles by Region 1541
The Jasper Project 800
Holistic Discourse Analysis 600
Beyond the sentence: discourse and sentential form / edited by Jessica R. Wirth 600
Binary Alloy Phase Diagrams, 2nd Edition 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5502807
求助须知:如何正确求助?哪些是违规求助? 4598515
关于积分的说明 14464281
捐赠科研通 4532106
什么是DOI,文献DOI怎么找? 2483837
邀请新用户注册赠送积分活动 1467039
关于科研通互助平台的介绍 1439707