A multimodal fusion emotion recognition method based on multitask learning and attention mechanism

概化理论 计算机科学 模式 人工智能 模态(人机交互) 相似性(几何) 任务(项目管理) 情绪识别 多模式学习 机制(生物学) 机器学习 图像(数学) 心理学 发展心理学 哲学 社会学 经济 管理 认识论 社会科学
作者
Jinbao Xie,Jiyu Wang,Qingyan Wang,Dali Yang,Jinming Gu,Yongqiang Tang,Yury I. Varatnitski
出处
期刊:Neurocomputing [Elsevier]
卷期号:556: 126649-126649 被引量:10
标识
DOI:10.1016/j.neucom.2023.126649
摘要

With new developments in the field of human–computer interaction, researchers are now paying attention to emotion recognition, especially multimodal emotion recognition, as emotion is a multidimensional expression. In this study, we propose a multimodal fusion emotion recognition method (MTL-BAM) based on multitask learning and the attention mechanism to tackle the major problems encountered in multimodal emotion recognition tasks regarding the lack of consideration of emotion interactions among modalities and the focus on emotion similarity among modalities while ignoring the differences. By improving the attention mechanism, the emotional contribution of each modality is further analyzed so that the emotional representations of each modality can learn from and complement each other to achieve better interactive fusion effect, thereby building a multitask learning framework. By introducing three types of monomodal emotion recognition tasks as auxiliary tasks, the model can detect emotion differences. Simultaneously, the label generation unit is introduced into the auxiliary tasks, and the monomodal emotion label value can be obtained more accurately through two proportional formulas while preventing the zero value problem. Our results show that the proposed method outperforms selected state-of-the-art methods on four evaluation indexes of emotion classification (i.e., accuracy, F1 score, MAE, and Pearson correlation coefficient). The proposed method achieved accuracy rates of 85.36% and 84.61% on the published multimodal datasets of CMU-MOSI and CMU-MOSEI, respectively, which are 2–6% higher than those of existing state-of-the-art models, demonstrating good multimodal emotion recognition performance and strong generalizability.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
兔子发布了新的文献求助10
1秒前
nn发布了新的文献求助10
1秒前
1秒前
严怜梦发布了新的文献求助10
1秒前
xww发布了新的文献求助10
3秒前
LEESO发布了新的文献求助10
3秒前
皓月星辰发布了新的文献求助10
3秒前
after发布了新的文献求助10
3秒前
3秒前
Goahead完成签到,获得积分10
3秒前
4秒前
柚C美式完成签到 ,获得积分10
4秒前
jajaqy完成签到,获得积分10
4秒前
GUKGO发布了新的文献求助10
4秒前
秀莉发布了新的文献求助10
4秒前
汉堡包应助霸气千易采纳,获得10
4秒前
乌托邦发布了新的文献求助10
4秒前
大力的百合完成签到,获得积分20
4秒前
逸风望发布了新的文献求助10
5秒前
哈哈哈哈发布了新的文献求助10
5秒前
顾矜应助飞兰采纳,获得10
5秒前
5秒前
学渣完成签到,获得积分10
6秒前
自由蓉完成签到,获得积分10
6秒前
猪大胖发布了新的文献求助10
7秒前
7秒前
orixero应助ZWL采纳,获得10
7秒前
kiterunner完成签到,获得积分10
7秒前
8秒前
lzr发布了新的文献求助10
8秒前
SJW--666完成签到,获得积分0
9秒前
GUKGO完成签到,获得积分10
10秒前
10秒前
研友_nPoWNL完成签到,获得积分10
10秒前
10秒前
ding应助许欣瑞采纳,获得10
11秒前
11秒前
崔宏玺发布了新的文献求助10
11秒前
tong发布了新的文献求助10
11秒前
Ava应助111采纳,获得10
12秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
HIGH DYNAMIC RANGE CMOS IMAGE SENSORS FOR LOW LIGHT APPLICATIONS 1500
Constitutional and Administrative Law 1000
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.). Frederic G. Reamer 800
Holistic Discourse Analysis 600
Vertébrés continentaux du Crétacé supérieur de Provence (Sud-Est de la France) 600
Vertebrate Palaeontology, 5th Edition 530
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5352065
求助须知:如何正确求助?哪些是违规求助? 4485004
关于积分的说明 13961490
捐赠科研通 4384753
什么是DOI,文献DOI怎么找? 2409168
邀请新用户注册赠送积分活动 1401603
关于科研通互助平台的介绍 1375188