Multi-modal speech emotion recognition using self-attention mechanism and multi-scale fusion framework

计算机科学 话语 人工智能 背景(考古学) 语音识别 光学(聚焦) 水准点(测量) 特征(语言学) 传感器融合 生物 光学 物理 哲学 古生物学 语言学 地理 大地测量学
作者
Yang Liu,Haoqin Sun,Wenbo Guan,Yuqi Xia,Zhao Zhen
出处
期刊:Speech Communication [Elsevier]
卷期号:139: 1-9 被引量:16
标识
DOI:10.1016/j.specom.2022.02.006
摘要

Accurately recognizing emotion from speech is a necessary yet challenging task due to the variability in speech and emotion. In this paper, a novel method combined self-attention mechanism and multi-scale fusion framework is proposed for multi-modal SER by using speech and text information. A self-attentional bidirectional contextual LSTM (bc-LSTM) is proposed to learn the context-sensitive dependences from speech. Specifically, the BLSTM layer is applied to learn long-term dependencies and utterance-level contextual information and the multi-head self-attention layer makes the model focus on the features that are most related to the emotions. A self-attentional multi-channel CNN (MCNN), which takes advantage of static and dynamic channels, is applied for learning general and thematic features from text. Finally, a multi-scale fusion strategy, including feature-level fusion and decision-level fusion, is applied to improve the overall performance. Experimental results on the benchmark dataset IEMOCAP demonstrate that our method gains an absolute improvement of 1.48% and 3.00% over state-of-the-art strategies in terms of weighted accuracy (WA) and unweighted accuracy (UA), respectively.

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
pu完成签到 ,获得积分10
1秒前
贝果发布了新的文献求助10
2秒前
华仔应助科研通管家采纳,获得10
5秒前
顾矜应助义气的雪兰采纳,获得10
8秒前
团子完成签到,获得积分10
8秒前
9秒前
11秒前
凌兰完成签到 ,获得积分10
11秒前
Zero发布了新的文献求助10
11秒前
贝果完成签到,获得积分10
12秒前
风中追风完成签到 ,获得积分10
14秒前
15秒前
aa发布了新的文献求助10
16秒前
净净子完成签到 ,获得积分10
16秒前
王世缘完成签到,获得积分10
21秒前
csd完成签到 ,获得积分10
21秒前
22秒前
23秒前
斯文败类应助aa采纳,获得10
24秒前
小菜一碟完成签到 ,获得积分10
24秒前
小二郎应助magicyang采纳,获得10
27秒前
Colorc发布了新的文献求助10
27秒前
zzzy完成签到 ,获得积分10
28秒前
SABUBU发布了新的文献求助10
29秒前
斯文败类应助哈哈_333采纳,获得20
32秒前
科研通AI6.1应助endlessloop采纳,获得30
34秒前
39秒前
Colorc完成签到,获得积分10
40秒前
Zero完成签到,获得积分10
41秒前
阳光下完成签到,获得积分10
41秒前
43秒前
44秒前
哈哈_333发布了新的文献求助20
48秒前
情怀应助tutounanyisheng采纳,获得10
57秒前
58秒前
1分钟前
所所应助阳光下采纳,获得10
1分钟前
小益完成签到,获得积分10
1分钟前
斯文败类应助哈哈_333采纳,获得10
1分钟前
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de guyane 2500
Common Foundations of American and East Asian Modernisation: From Alexander Hamilton to Junichero Koizumi 600
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
Competency Based Human Resource Management 500
How to Develop Robust Scale-up Strategies for Complex Injectable Dosage Forms 450
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5863589
求助须知:如何正确求助?哪些是违规求助? 6393164
关于积分的说明 15649199
捐赠科研通 4977636
什么是DOI,文献DOI怎么找? 2685102
邀请新用户注册赠送积分活动 1628203
关于科研通互助平台的介绍 1585881