μ-law SGAN for generating spectra with more details in speech enhancement

计算机科学 光谱图 发电机(电路理论) 语音识别 鉴别器 谐波 人工智能 算法 电信 电压 物理 功率(物理) 量子力学 探测器
作者
Hongfeng Li,Yanyan Xu,Dengfeng Ke,Kaile Su
出处
期刊:Neural Networks [Elsevier]
卷期号:136: 17-27 被引量:8
标识
DOI:10.1016/j.neunet.2020.12.017
摘要

The goal of monaural speech enhancement is to separate clean speech from noisy speech. Recently, many studies have employed generative adversarial networks (GAN) to deal with monaural speech enhancement tasks. When using generative adversarial networks for this task, the output of the generator is a speech waveform or a spectrum, such as a magnitude spectrum, a mel-spectrum or a complex-valued spectrum. The spectra generated by current speech enhancement methods in the time–frequency domain usually lack details, such as consonants and harmonics with low energy. In this paper, we propose a new type of adversarial training framework for spectrum generation, named μ-law spectrum generative adversarial networks (μ-law SGAN). We introduce a trainable μ-law spectrum compression layer (USCL) into the proposed discriminator to compress the dynamic range of the spectrum. As a result, the compressed spectrum can display more detailed information. In addition, we use the spectrum transformed by USCL to regularize the generator’s training, so that the generator can pay more attention to the details of the spectrum. Experimental results on the open dataset Voice Bank + DEMAND show that μ-law SGAN is an effective generative adversarial architecture for speech enhancement. Moreover, visual spectrogram analysis suggests that μ-law SGAN pays more attention to the enhancement of low energy harmonics and consonants.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
梦云点灯完成签到,获得积分10
刚刚
郭郭完成签到,获得积分10
1秒前
ywl发布了新的文献求助10
2秒前
fosca完成签到,获得积分10
3秒前
xyc完成签到 ,获得积分10
4秒前
wh1t3zZ发布了新的文献求助10
4秒前
hyjcnhyj完成签到,获得积分10
5秒前
盼盼完成签到,获得积分10
5秒前
Sodagreen2023完成签到 ,获得积分10
6秒前
白华苍松发布了新的文献求助20
6秒前
不安保温杯完成签到 ,获得积分10
7秒前
严西完成签到,获得积分10
7秒前
舟遥遥完成签到,获得积分10
7秒前
7秒前
脑洞疼应助清脆的雅彤采纳,获得10
8秒前
皇帝的床帘完成签到,获得积分10
8秒前
8秒前
所所应助芙瑞采纳,获得10
8秒前
勤劳尔丝完成签到 ,获得积分10
9秒前
可爱的函函应助芙瑞采纳,获得10
9秒前
huoyiyang发布了新的文献求助10
10秒前
谷雨发布了新的文献求助10
11秒前
Hi完成签到,获得积分10
12秒前
阿北完成签到,获得积分10
12秒前
12秒前
14秒前
欣慰的书本完成签到 ,获得积分10
14秒前
热心不凡完成签到,获得积分10
14秒前
672完成签到,获得积分10
15秒前
晴天完成签到,获得积分10
15秒前
橘x应助轻松寒安采纳,获得20
16秒前
lx完成签到,获得积分10
16秒前
正一笑完成签到,获得积分10
17秒前
浅池星完成签到 ,获得积分10
17秒前
甜蜜的水香完成签到,获得积分10
18秒前
unaive完成签到,获得积分10
18秒前
19秒前
凉冰完成签到,获得积分20
19秒前
Lucas应助白华苍松采纳,获得10
19秒前
19秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Kinesiophobia : a new view of chronic pain behavior 5000
Molecular Biology of Cancer: Mechanisms, Targets, and Therapeutics 3000
First commercial application of ELCRES™ HTV150A film in Nichicon capacitors for AC-DC inverters: SABIC at PCIM Europe 1000
Feldspar inclusion dating of ceramics and burnt stones 1000
Digital and Social Media Marketing 600
Zeolites: From Fundamentals to Emerging Applications 600
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5988799
求助须知:如何正确求助?哪些是违规求助? 7423898
关于积分的说明 16050602
捐赠科研通 5130095
什么是DOI,文献DOI怎么找? 2752296
邀请新用户注册赠送积分活动 1724455
关于科研通互助平台的介绍 1627614