发布文献求助

Advancing the Dimensionality Reduction of Speaker Embeddings for Speaker Diarisation: Disentangling Noise and Informing Speech Activity

计算机科学语音识别虚假关系降维说话人识别说话人日记噪音（视频）还原（数学）说话人验证降噪维数之咒航程（航空）模式识别（心理学）人工智能机器学习数学工程类几何学图像（数学）航空航天工程

作者

You Jin Kim,Hee-Soo Heo,Jee-weon Jung,Youngki Kwon,Bong‐Jin Lee,Joon Son Chung

链接

arxiv.org arxiv.orgdoi.org

标识

DOI：10.1109/icassp49357.2023.10095530

摘要

The objective of this work is to train noise-robust speaker embeddings adapted for speaker diarisation. Speaker embeddings play a crucial role in the performance of diarisation systems, but they often capture spurious information such as noise, adversely affecting performance. Our previous work has proposed an auto-encoder-based dimensionality reduction module to help remove the redundant information. However, they do not explicitly separate such information and have also been found to be sensitive to hyper-parameter values. To this end, we propose two contributions to overcome these issues: (i) a novel dimensionality reduction framework that can disentangle spurious information from the speaker embeddings; (ii) the use of speech activity vector to prevent the speaker code from representing the background noise. Through a range of experiments conducted on four datasets, our approach consistently demonstrates the state-of-the-art performance among models without system fusion.

求助该文献

科研通智能强力驱动
Strongly Powered by AbleSci AI

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

更新

新增更精细的自定义提醒设置 (2026-1-4)

新增

🕒每天60秒读懂世界·精选全球要闻 (2026-1-2)

更新

2025年影响因子查询已上线 (2025-6-18)

新增

PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: FashionBoy上传了应助文件

刚刚; 上官若男上传了应助文件

刚刚; 拼搏诗筠发布了新的文献求助10

1秒前; 完美世界上传了应助文件

1秒前; mutong完成签到，获得积分10

1秒前; 派大星完成签到，获得积分10

1秒前; SciGPT的应助被竹子采纳，获得10

2秒前; Ttttsyu发布了新的文献求助10

3秒前; 科研通AI6.1上传了应助文件

3秒前; 哼哼哼发布了新的文献求助10

3秒前; 999发布了新的文献求助10

3秒前; 所所的应助被bb采纳，获得10

4秒前; happyou发布了新的文献求助10

5秒前; 科目三上传了应助文件

5秒前; ZLPY完成签到，获得积分10

5秒前; MEI23333333发布了新的文献求助10

5秒前; NexusExplorer的应助被无心的亦绿采纳，获得10

5秒前; 无期发布了新的文献求助10

6秒前; CipherSage的应助被沉默小虾米采纳，获得10

6秒前; 丘比特上传了应助文件

6秒前; 24完成签到，获得积分10

7秒前; 一个果儿上传了应助文件

8秒前; linger发布了新的文献求助10

8秒前; 大王叫我来巡山关闭了大王叫我来巡山的文献求助

8秒前; 归海一刀完成签到，获得积分10

8秒前; Sea_U的应助被手拿把掐采纳，获得10

8秒前; 我是老大的应助被ziguang采纳，获得10

9秒前; 宝坤完成签到，获得积分10

9秒前; 小二郎上传了应助文件

9秒前; 传奇3的应助被Jie采纳，获得10

10秒前; 阿巴阿巴完成签到，获得积分10

10秒前; Nori完成签到，获得积分10

10秒前; 北冥有鱼发布了新的文献求助10

10秒前; 胡志宇发布了新的文献求助10

11秒前; 充电宝的应助被黄药师采纳，获得10

11秒前; ckeong89的应助被碧蓝寄风采纳，获得30

11秒前; ilooksjw完成签到，获得积分20

11秒前; 852上传了应助文件

11秒前; 香蕉觅云上传了应助文件

11秒前; 互助的应助被周一采纳，获得20

11秒前

高分求助中: (应助此贴封号)【重要！！请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000; Modern Epidemiology, Fourth Edition 5000; Kinesiophobia : a new view of chronic pain behavior 5000; Molecular Biology of Cancer: Mechanisms, Targets, and Therapeutics 3000; Digital Twins of Advanced Materials Processing 2000; Propeller Design 2000; Weaponeering, Fourth Edition – Two Volume SET 2000

热门求助领域（近24小时）

热门帖子: 关注科研通微信公众号，转发送积分 6015736; 求助须知：如何正确求助？哪些是违规求助？ 7594968; 关于积分的说明 16149666; 捐赠科研通 5163560; 什么是DOI，文献DOI怎么找？ 2764408; 邀请新用户注册赠送积分活动 1745094; 关于科研通互助平台的介绍 1634803

今日热心研友

热心市民小杨

蓝莓橘子酱

谨慎的易蓉

热心市民小红花

注：热心度 = 本日应助数 + 本日被采纳获取积分÷10

Copyright © 2020-2026 AbleSci.COM, 科研通, All Right Reserved

科研通是非营利科研互助平台，不忘初心，为科研助力

本站互助的所有文件仅供个人学习研究用，禁止任何人把求助的所得文献进行盈利或传播

皖ICP备2024041134号-1

皖公网安备34019202002308

科研通【文献互助QQ群】：如果您有特殊求助，或发布求助超过24小时未得到应助，可加群求助，群号：821889395【点击一键加群】

科研通【志愿服务QQ群】：如果您热爱文献互助，有热心愿意为更多人服务，请加入小伙伴群，点击申请加入

关注微信服务号

科研通