A multimodal fusion emotion recognition method based on multitask learning and attention mechanism

概化理论 计算机科学 模式 人工智能 模态(人机交互) 相似性(几何) 任务(项目管理) 情绪识别 多模式学习 机制(生物学) 机器学习 图像(数学) 心理学 发展心理学 哲学 社会学 经济 管理 认识论 社会科学
作者
Jinbao Xie,Wei Wang,Qingyan Wang,Yang Dali,Jinming Gu,Yongqiang Tang,Yury I. Varatnitski
出处
期刊:Neurocomputing [Elsevier BV]
卷期号:556: 126649-126649 被引量:6
标识
DOI:10.1016/j.neucom.2023.126649
摘要

With new developments in the field of human–computer interaction, researchers are now paying attention to emotion recognition, especially multimodal emotion recognition, as emotion is a multidimensional expression. In this study, we propose a multimodal fusion emotion recognition method (MTL-BAM) based on multitask learning and the attention mechanism to tackle the major problems encountered in multimodal emotion recognition tasks regarding the lack of consideration of emotion interactions among modalities and the focus on emotion similarity among modalities while ignoring the differences. By improving the attention mechanism, the emotional contribution of each modality is further analyzed so that the emotional representations of each modality can learn from and complement each other to achieve better interactive fusion effect, thereby building a multitask learning framework. By introducing three types of monomodal emotion recognition tasks as auxiliary tasks, the model can detect emotion differences. Simultaneously, the label generation unit is introduced into the auxiliary tasks, and the monomodal emotion label value can be obtained more accurately through two proportional formulas while preventing the zero value problem. Our results show that the proposed method outperforms selected state-of-the-art methods on four evaluation indexes of emotion classification (i.e., accuracy, F1 score, MAE, and Pearson correlation coefficient). The proposed method achieved accuracy rates of 85.36% and 84.61% on the published multimodal datasets of CMU-MOSI and CMU-MOSEI, respectively, which are 2–6% higher than those of existing state-of-the-art models, demonstrating good multimodal emotion recognition performance and strong generalizability.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
浮游应助22222采纳,获得10
刚刚
浮生发布了新的文献求助10
刚刚
传奇3应助芋泥采纳,获得10
1秒前
术语完成签到 ,获得积分10
1秒前
2秒前
2秒前
2秒前
Diamond完成签到 ,获得积分10
3秒前
早起晚睡关注了科研通微信公众号
4秒前
术语关注了科研通微信公众号
7秒前
李键刚发布了新的文献求助10
8秒前
8秒前
Jennifer发布了新的文献求助10
9秒前
9秒前
10秒前
Alex完成签到,获得积分0
11秒前
11秒前
12秒前
Leo完成签到,获得积分10
15秒前
暖阳发布了新的文献求助10
15秒前
芋泥发布了新的文献求助10
16秒前
647发布了新的文献求助10
17秒前
斯文败类应助OKYT采纳,获得10
17秒前
Owen应助鸢尾采纳,获得10
18秒前
Maceyyy发布了新的文献求助10
18秒前
十三完成签到,获得积分10
19秒前
qiqiqiqiqi完成签到 ,获得积分10
20秒前
21秒前
21秒前
ll发布了新的文献求助10
21秒前
Li应助小菜采纳,获得50
22秒前
Jennifer完成签到,获得积分20
23秒前
传奇3应助1234567采纳,获得10
23秒前
文艺安青完成签到 ,获得积分10
23秒前
可不发布了新的文献求助10
24秒前
25秒前
在水一方应助yuanyingge采纳,获得10
26秒前
一天完成签到,获得积分10
26秒前
淡定落雁完成签到,获得积分10
27秒前
28秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Einführung in die Rechtsphilosophie und Rechtstheorie der Gegenwart 1500
Binary Alloy Phase Diagrams, 2nd Edition 1000
青少年心理适应性量表(APAS)使用手册 700
Air Transportation A Global Management Perspective 9th Edition 700
DESIGN GUIDE FOR SHIPBOARD AIRBORNE NOISE CONTROL 600
NMR in Plants and Soils: New Developments in Time-domain NMR and Imaging 600
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4979500
求助须知:如何正确求助?哪些是违规求助? 4232187
关于积分的说明 13182437
捐赠科研通 4023165
什么是DOI,文献DOI怎么找? 2201193
邀请新用户注册赠送积分活动 1213667
关于科研通互助平台的介绍 1129839