Self-Supervised Speaker Recognition with Loss-Gated Learning

计算机科学 说话人识别 语音识别 人工智能 人工神经网络 集合(抽象数据类型) 训练集 字错误率 模式识别(心理学) 试验装置 说话人日记 程序设计语言
作者
Ruijie Tao,Kong Aik Lee,Rohan Kumar Das,Ville Hautamäki,Haizhou Li
标识
DOI:10.1109/icassp43922.2022.9747162
摘要

In self-supervised learning for speaker recognition, pseudo labels are useful as the supervision signals. It is a known fact that a speaker recognition model doesn’t always benefit from pseudo labels due to their unreliability. In this work, we observe that a speaker recognition network tends to model the data with reliable labels faster than those with unreliable labels. This motivates us to study a loss-gated learning (LGL) strategy, which extracts the reliable labels through the fitting ability of the neural network during training. With the proposed LGL, our speaker recognition model obtains a 46.3% performance gain over the system without it. Further, the proposed self-supervised speaker recognition with LGL trained on the VoxCeleb2 dataset without any labels achieves an equal error rate of 1.66% on the VoxCeleb1 original test set.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
CipherSage应助joyce采纳,获得10
1秒前
于乐发布了新的文献求助10
1秒前
dj920616发布了新的文献求助30
2秒前
3秒前
文艺雁兰发布了新的文献求助10
4秒前
111驳回了丘比特应助
5秒前
所所应助linman采纳,获得10
6秒前
6秒前
CodeCraft应助恋人采纳,获得10
8秒前
希妍发布了新的文献求助10
9秒前
yaya125完成签到 ,获得积分10
10秒前
顾矜应助多喝水采纳,获得10
10秒前
哞哞哞发布了新的文献求助10
11秒前
刘旦生发布了新的文献求助10
11秒前
zho应助陶醉代云采纳,获得10
11秒前
陈光华发布了新的文献求助10
13秒前
13秒前
今天完成签到,获得积分10
14秒前
14秒前
MXS关注了科研通微信公众号
15秒前
汉堡包应助kangk采纳,获得10
16秒前
Abel完成签到,获得积分10
17秒前
18秒前
aaa发布了新的文献求助10
19秒前
着急的迎蕾完成签到,获得积分20
19秒前
Clytze发布了新的文献求助10
20秒前
21秒前
21秒前
不许人间见白头完成签到 ,获得积分20
21秒前
22秒前
wjj完成签到,获得积分10
22秒前
bobochicken完成签到,获得积分10
22秒前
张艳茹发布了新的文献求助10
23秒前
刘旦生完成签到,获得积分10
23秒前
zm完成签到,获得积分10
23秒前
FashionBoy应助linman采纳,获得10
23秒前
情怀应助Abel采纳,获得10
24秒前
小陈陈完成签到,获得积分20
24秒前
Dillen发布了新的文献求助10
24秒前
zzz发布了新的文献求助10
24秒前
高分求助中
Principles of Economics, 11th Edition 10000
Prescott's Microbiology: 2026 Release ISE 10000
University Physics with Modern Physics, 16th edition 10000
Cronologia da história de Macau 5000
Environmental Leverage in Times of Climate Crisis: Product Standards, Carbon Border Measures and Preferential Trade Agreements 1000
Interactions of Vowel Quality and Prosody in East Slavic 1000
Matrix Methods in Data Mining and Pattern Recognition 510
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7156186
求助须知:如何正确求助?哪些是违规求助? 8800762
关于积分的说明 18598944
捐赠科研通 6756934
什么是DOI,文献DOI怎么找? 3161429
关于科研通互助平台的介绍 2296074
邀请新用户注册赠送积分活动 2136123