亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

MVIB-DVA: Learning minimum sufficient multi-feature speech emotion embeddings under dual-view aware

计算机科学 瓶颈 特征(语言学) 对偶(语法数字) 领域(数学分析) 帧(网络) 信息瓶颈法 人工智能 频域 噪音(视频) 语音识别 模式识别(心理学) 机器学习 图像(数学) 计算机视觉 相互信息 数学 文学类 数学分析 哲学 艺术 嵌入式系统 电信 语言学
作者
Guoyan Li,Junjie Hou,Yi Liu,Jianguo Wei
出处
期刊:Expert Systems With Applications [Elsevier]
卷期号:246: 123110-123110 被引量:4
标识
DOI:10.1016/j.eswa.2023.123110
摘要

Speech emotion recognition (SER) is a crucial topic in human–computer interaction. However, there are still many challenges to extracting emotional embeddings. Emotional embeddings extracted by network models often contain noise and incomplete emotional information. To meet these challenges, this study developed an innovative model (MVIB-DVA) composed of a multi-feature variational information bottleneck (MVIB) based on the information bottleneck (IB) principle and a dual-view aware module (DVAM) with an attention mechanism. MVIB employs the IB principle as the driving model and utilizes learned minimal sufficient single-feature emotional embeddings as auxiliary information. The aims are to capture unique emotional information in individual features and complementary information between different types of features as well as reduce noise and represent rich emotional information with fewer parameters. DVAM proposes (1) a frequency-domain statistical aware module (FDSAM) in the frequency domain that emphasizes the frequency that best reflects emotional information and (2) a frame aware module (FAM) in the time domain that focuses on the frames that contribute to the most to the final emotion recognition results. A separate channel extracts details ignored in the frequency and time domain views, extracting more comprehensive emotional information. The experimental results show that our method performs excellently in recognizing speech emotions. MVIB-DVA achieved weighted accuracy (WA) of 74.05% and unweighted accuracy (UA) of 75.67% on the IEMOCAP dataset. Similarly, on the RAVDESS dataset, MVIB-DVA attained WA of 86.66% and UA of 86.51%.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
shinn发布了新的文献求助10
1秒前
思柔完成签到,获得积分10
3秒前
5秒前
shinn发布了新的文献求助10
5秒前
坚守完成签到 ,获得积分10
11秒前
yjr发布了新的文献求助10
11秒前
12秒前
搞怪的白云完成签到 ,获得积分10
13秒前
江江江完成签到,获得积分20
14秒前
17秒前
21秒前
瑕不掩瑜发布了新的文献求助10
21秒前
英姑应助吉吉采纳,获得10
23秒前
25秒前
莫愁完成签到 ,获得积分10
27秒前
充电宝应助shinn采纳,获得10
29秒前
30秒前
34秒前
35秒前
Owen应助发发采纳,获得30
35秒前
43秒前
瑕不掩瑜完成签到,获得积分10
45秒前
石榴汁的书完成签到,获得积分10
54秒前
55秒前
qzp完成签到 ,获得积分10
56秒前
56秒前
56秒前
寻道图强举报spring求助涉嫌违规
57秒前
shinn发布了新的文献求助10
59秒前
1分钟前
带刺的玫瑰李博应助CGDGD采纳,获得10
1分钟前
顾矜应助宇宙超人007008采纳,获得10
1分钟前
科研通AI2S应助shinn采纳,获得10
1分钟前
1分钟前
安静严青完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
1分钟前
1分钟前
吉吉发布了新的文献求助10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Introduction to strong mixing conditions volume 1-3 5000
Agyptische Geschichte der 21.30. Dynastie 3000
Aerospace Engineering Education During the First Century of Flight 2000
„Semitische Wissenschaften“? 1510
从k到英国情人 1500
sQUIZ your knowledge: Multiple progressive erythematous plaques and nodules in an elderly man 1000
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5772284
求助须知:如何正确求助?哪些是违规求助? 5597270
关于积分的说明 15429424
捐赠科研通 4905304
什么是DOI,文献DOI怎么找? 2639326
邀请新用户注册赠送积分活动 1587253
关于科研通互助平台的介绍 1542112