Speech emotion recognition with deep convolutional neural networks

计算机科学 光谱图 卷积神经网络 Mel倒谱 语音识别 概括性 代表(政治) 人工智能 情绪识别 特征提取 模式识别(心理学) 心理学 政治学 政治 法学 心理治疗师
作者
Dias Issa,M. Fatih Demirci,Adnan Yazıcı
出处
期刊:Biomedical Signal Processing and Control [Elsevier BV]
卷期号:59: 101894-101894 被引量:403
标识
DOI:10.1016/j.bspc.2020.101894
摘要

The speech emotion recognition (or, classification) is one of the most challenging topics in data science. In this work, we introduce a new architecture, which extracts mel-frequency cepstral coefficients, chromagram, mel-scale spectrogram, Tonnetz representation, and spectral contrast features from sound files and uses them as inputs for the one-dimensional Convolutional Neural Network for the identification of emotions using samples from the Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS), Berlin (EMO-DB), and Interactive Emotional Dyadic Motion Capture (IEMOCAP) datasets. We utilize an incremental method for modifying our initial model in order to improve classification accuracy. All of the proposed models work directly with raw sound data without the need for conversion to visual representations, unlike some previous approaches. Based on experimental results, our best-performing model outperforms existing frameworks for RAVDESS and IEMOCAP, thus setting the new state-of-the-art. For the EMO-DB dataset, it outperforms all previous works except one but compares favorably with that one in terms of generality, simplicity, and applicability. Specifically, the proposed framework obtains 71.61% for RAVDESS with 8 classes, 86.1% for EMO-DB with 535 samples in 7 classes, 95.71% for EMO-DB with 520 samples in 7 classes, and 64.3% for IEMOCAP with 4 classes in speaker-independent audio classification tasks.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
wisher发布了新的文献求助10
1秒前
1秒前
万能图书馆应助smartCH采纳,获得10
1秒前
xiamu发布了新的文献求助10
1秒前
李爱国应助Rutin采纳,获得10
2秒前
Hannipham完成签到,获得积分10
2秒前
3秒前
zy完成签到 ,获得积分10
3秒前
4秒前
SciGPT应助jiaojiao采纳,获得10
4秒前
情怀应助暴富采纳,获得30
4秒前
4秒前
李健的小迷弟应助Sunshine采纳,获得10
5秒前
Cyan完成签到,获得积分10
7秒前
轻松豌豆完成签到,获得积分10
7秒前
7秒前
充电宝应助thremo采纳,获得10
7秒前
善学以致用应助苹果紫萱采纳,获得10
7秒前
闻风听雨发布了新的文献求助10
8秒前
ZHI发布了新的文献求助10
8秒前
量子星尘发布了新的文献求助10
8秒前
万能图书馆应助KK采纳,获得10
10秒前
895_完成签到,获得积分0
10秒前
mm关注了科研通微信公众号
10秒前
10秒前
科研通AI5应助忧心的笑容采纳,获得10
10秒前
xhj关闭了xhj文献求助
10秒前
10秒前
范范发布了新的文献求助10
10秒前
11秒前
11秒前
轻松豌豆发布了新的文献求助10
11秒前
赘婿应助顺利毕业采纳,获得10
13秒前
14秒前
15秒前
量子星尘发布了新的文献求助10
16秒前
JamesPei应助yg采纳,获得10
16秒前
爆米花应助yiqian采纳,获得10
17秒前
Sunshine发布了新的文献求助10
17秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
Statistical Methods for the Social Sciences, Global Edition, 6th edition 600
こんなに痛いのにどうして「なんでもない」と医者にいわれてしまうのでしょうか 510
Walter Gilbert: Selected Works 500
An Annotated Checklist of Dinosaur Species by Continent 500
岡本唐貴自伝的回想画集 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3658707
求助须知:如何正确求助?哪些是违规求助? 3220706
关于积分的说明 9737132
捐赠科研通 2929876
什么是DOI,文献DOI怎么找? 1604142
邀请新用户注册赠送积分活动 757000
科研通“疑难数据库(出版商)”最低求助积分说明 734269