A Comprehensive Survey on Deep Learning Multi-Modal Fusion: Methods, Technologies and Applications

传感器融合 情态动词 计算机科学 融合 保险丝(电气) 模式 人工智能 噪音(视频) 数据挖掘 机器学习 数据科学 工程类 语言学 哲学 高分子化学 社会科学 化学 社会学 电气工程 图像(数学)
作者
Tianzhe Jiao,Chaopeng Guo,Xiaoyue Feng,Yuming Chen,Jie Song
出处
期刊:Computers, materials & continua 卷期号:80 (1): 1-35 被引量:43
标识
DOI:10.32604/cmc.2024.053204
摘要

Multi-modal fusion technology gradually become a fundamental task in many fields, such as autonomous driving, smart healthcare, sentiment analysis, and human-computer interaction. It is rapidly becoming the dominant research due to its powerful perception and judgment capabilities. Under complex scenes, multi-modal fusion technology utilizes the complementary characteristics of multiple data streams to fuse different data types and achieve more accurate predictions. However, achieving outstanding performance is challenging because of equipment performance limitations, missing information, and data noise. This paper comprehensively reviews existing methods based on multi-modal fusion techniques and completes a detailed and in-depth analysis. According to the data fusion stage, multi-modal fusion has four primary methods: early fusion, deep fusion, late fusion, and hybrid fusion. The paper surveys the three major multi-modal fusion technologies that can significantly enhance the effect of data fusion and further explore the applications of multi-modal fusion technology in various fields. Finally, it discusses the challenges and explores potential research opportunities. Multi-modal tasks still need intensive study because of data heterogeneity and quality. Preserving complementary information and eliminating redundant information between modalities is critical in multi-modal technology. Invalid data fusion methods may introduce extra noise and lead to worse results. This paper provides a comprehensive and detailed summary in response to these challenges.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
从容祥发布了新的文献求助10
1秒前
1秒前
我是老大应助桥桥采纳,获得10
1秒前
CodeCraft应助daggeraxe采纳,获得10
2秒前
宋垚发布了新的文献求助10
2秒前
niko发布了新的文献求助10
2秒前
柒八染发布了新的文献求助10
2秒前
2秒前
nicoco完成签到,获得积分10
2秒前
XZ发布了新的文献求助10
3秒前
慕青应助xsy采纳,获得10
3秒前
乐乐应助求助人员采纳,获得10
3秒前
852应助李胜采纳,获得10
3秒前
善良枫叶发布了新的文献求助10
3秒前
火星上的小笼包完成签到,获得积分10
3秒前
你你完成签到,获得积分10
4秒前
既然发布了新的文献求助10
4秒前
完美世界应助鲜艳的傲蕾采纳,获得10
4秒前
活力的依风完成签到,获得积分10
4秒前
champagnefeng完成签到,获得积分10
4秒前
4秒前
5秒前
Mine_cherry应助密斯刘采纳,获得10
5秒前
Lucas应助爱吃鱼的猫采纳,获得10
6秒前
英俊的铭应助戴冬梅采纳,获得10
6秒前
Disguise发布了新的文献求助10
6秒前
6秒前
Lucas应助某人采纳,获得10
7秒前
7秒前
禾沐发布了新的文献求助10
7秒前
FashionBoy应助小巧老鼠采纳,获得10
7秒前
8秒前
xjdb123发布了新的文献求助10
8秒前
bkagyin应助专注白安采纳,获得10
8秒前
FashionBoy应助咦yiyi采纳,获得10
9秒前
champagnefeng发布了新的文献求助10
9秒前
HWY完成签到,获得积分10
10秒前
00完成签到 ,获得积分10
11秒前
临渊坐禅完成签到,获得积分10
11秒前
桐桐应助123采纳,获得10
11秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Predation in the Hymenoptera: An Evolutionary Perspective 1800
List of 1,091 Public Pension Profiles by Region 1561
Binary Alloy Phase Diagrams, 2nd Edition 1400
Specialist Periodical Reports - Organometallic Chemistry Organometallic Chemistry: Volume 46 1000
Holistic Discourse Analysis 600
Beyond the sentence: discourse and sentential form / edited by Jessica R. Wirth 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5512216
求助须知:如何正确求助?哪些是违规求助? 4606600
关于积分的说明 14500450
捐赠科研通 4542054
什么是DOI,文献DOI怎么找? 2488803
邀请新用户注册赠送积分活动 1470901
关于科研通互助平台的介绍 1443089