A multiscale neural architecture search framework for multimodal fusion

计算机科学 稳健性(进化) 人工智能 机器学习 传感器融合 融合 融合机制 过程(计算) 渲染(计算机图形) 数据挖掘 语言学 哲学 生物化学 化学 脂质双层融合 基因 操作系统
作者
Jindi Lv,Yanan Sun,Qing Ye,Wentao Feng,Jiancheng Lv
出处
期刊:Information Sciences [Elsevier BV]
卷期号:: 121005-121005
标识
DOI:10.1016/j.ins.2024.121005
摘要

Multimodal fusion, a machine learning technique, significantly enhances decision-making by leveraging complementary information extracted from different data modalities. The success of multimodal fusion relies heavily on the design of the fusion scheme. However, this process traditionally depends on manual expertise and exhaustive trials. To tackle this challenge, researchers have undertaken studies on DARTS-based Neural Architecture Search (NAS) variants to automate the search of fusion schemes. In this paper, we present theoretical and empirical evidence that highlights the presence of catastrophic search bias in DARTS-based multimodal fusion methods. This bias traps the search into a deceptive optimal childnet, rendering the entire search process ineffective. To circumvent this phenomenon, we introduce a novel NAS framework for multimodal fusion, featuring a robust search strategy and a meticulously designed multi-scale fusion search space. Significantly, the proposed framework is capable of capturing modality-specific information across multiple scales while achieving an automatic balance between intra-modal and inter-modal information. We conduct extensive experiments on three commonly used multimodal classification tasks from different domains and compare the proposed framework against state-of-the-art approaches. The experimental results demonstrate the superior robustness and high efficiency of the proposed framework.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
vidi发布了新的文献求助10
1秒前
shishi完成签到,获得积分10
1秒前
YY88687321完成签到 ,获得积分10
1秒前
香蕉觅云应助老木虫采纳,获得10
3秒前
宋泽艺完成签到 ,获得积分10
6秒前
ding应助vidi采纳,获得10
8秒前
晨熙关注了科研通微信公众号
9秒前
啾一口香菜完成签到 ,获得积分10
12秒前
xinanan发布了新的文献求助10
13秒前
roger完成签到,获得积分10
13秒前
xiaohu6311完成签到,获得积分20
14秒前
甜美的初蓝完成签到 ,获得积分10
15秒前
引子完成签到,获得积分10
17秒前
871624521完成签到,获得积分10
17秒前
木木发布了新的文献求助10
19秒前
朱华彪完成签到,获得积分10
19秒前
Dky_安静的初夏完成签到,获得积分10
20秒前
今天不学习明天变垃圾完成签到,获得积分10
20秒前
叮当完成签到,获得积分10
20秒前
21秒前
21秒前
22秒前
fengmian完成签到,获得积分10
22秒前
李健的小迷弟应助JIE采纳,获得10
25秒前
自己发布了新的文献求助10
26秒前
27秒前
祖逸凡完成签到,获得积分10
27秒前
YANG完成签到 ,获得积分10
27秒前
宁远完成签到,获得积分10
27秒前
年轻迪奥完成签到,获得积分10
28秒前
zhx完成签到,获得积分10
29秒前
CipherSage应助自己采纳,获得10
31秒前
qw1完成签到,获得积分20
31秒前
胡洁媛完成签到,获得积分20
31秒前
chenzui关注了科研通微信公众号
31秒前
在水一方应助李哈哈采纳,获得10
32秒前
栗爷完成签到,获得积分10
33秒前
snowskating完成签到,获得积分20
33秒前
34秒前
宁远发布了新的文献求助10
34秒前
高分求助中
A new approach to the extrapolation of accelerated life test data 1000
Cognitive Neuroscience: The Biology of the Mind 1000
Technical Brochure TB 814: LPIT applications in HV gas insulated switchgear 1000
Immigrant Incorporation in East Asian Democracies 500
Nucleophilic substitution in azasydnone-modified dinitroanisoles 500
不知道标题是什么 500
A Preliminary Study on Correlation Between Independent Components of Facial Thermal Images and Subjective Assessment of Chronic Stress 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3965950
求助须知:如何正确求助?哪些是违规求助? 3511289
关于积分的说明 11157176
捐赠科研通 3245859
什么是DOI,文献DOI怎么找? 1793182
邀请新用户注册赠送积分活动 874245
科研通“疑难数据库(出版商)”最低求助积分说明 804286