Hard Regularization to Prevent Deep Online Clustering Collapse without Data Augmentation

聚类分析 正规化(语言学) 计算机科学 人工智能 数据科学
作者
Louis Mahon,Thomas Lukasiewicz
出处
期刊:Proceedings of the ... AAAI Conference on Artificial Intelligence [Association for the Advancement of Artificial Intelligence (AAAI)]
卷期号:38 (13): 14281-14288
标识
DOI:10.1609/aaai.v38i13.29340
摘要

Online deep clustering refers to the joint use of a feature extraction network and a clustering model to assign cluster labels to each new data point or batch as it is processed. While faster and more versatile than offline methods, online clustering can easily reach the collapsed solution where the encoder maps all inputs to the same point and all are put into a single cluster. Successful existing models have employed various techniques to avoid this problem, most of which require data augmentation or which aim to make the average soft assignment across the dataset the same for each cluster. We propose a method that does not require data augmentation, and that, differently from existing methods, regularizes the hard assignments. Using a Bayesian framework, we derive an intuitive optimization objective that can be straightforwardly included in the training of the encoder network. Tested on four image datasets, it consistently avoids collapse more robustly than other methods and leads to more accurate clustering. We also conduct further experiments and analyses justifying our choice to regularize the hard cluster assignments. Code is available at https://github.com/Lou1sM/online_hard_clustering.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小胡发布了新的文献求助10
5秒前
天天快乐应助不样钓鱼采纳,获得10
5秒前
补喵完成签到,获得积分20
5秒前
5秒前
7秒前
英姑应助吱哦周采纳,获得10
8秒前
11完成签到,获得积分10
9秒前
bedrock发布了新的文献求助10
10秒前
10秒前
12秒前
12秒前
明亮无颜发布了新的文献求助10
12秒前
13秒前
闻歌发布了新的文献求助10
14秒前
14秒前
15秒前
加菲丰丰应助量子采纳,获得20
16秒前
研友_VZG7GZ应助文泽采纳,获得10
16秒前
17秒前
evefei发布了新的文献求助30
17秒前
123321发布了新的文献求助10
17秒前
Ler发布了新的文献求助10
18秒前
筱诸雄完成签到,获得积分10
18秒前
bkagyin应助闻歌采纳,获得10
19秒前
YU发布了新的文献求助10
19秒前
遇见完成签到,获得积分10
20秒前
稳重元菱完成签到,获得积分20
21秒前
吱哦周发布了新的文献求助10
21秒前
24秒前
orixero应助淡淡菠萝采纳,获得10
24秒前
小二郎应助女神金采纳,获得10
25秒前
思源应助ZK采纳,获得10
25秒前
量子完成签到,获得积分20
26秒前
26秒前
李健应助Ler采纳,获得10
26秒前
在水一方应助温乘云采纳,获得10
27秒前
28秒前
28秒前
28秒前
29秒前
高分求助中
The Oxford Handbook of Social Cognition (Second Edition, 2024) 1050
Kinetics of the Esterification Between 2-[(4-hydroxybutoxy)carbonyl] Benzoic Acid with 1,4-Butanediol: Tetrabutyl Orthotitanate as Catalyst 1000
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
Chen Hansheng: China’s Last Romantic Revolutionary 500
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3140718
求助须知:如何正确求助?哪些是违规求助? 2791628
关于积分的说明 7799729
捐赠科研通 2447921
什么是DOI,文献DOI怎么找? 1302210
科研通“疑难数据库(出版商)”最低求助积分说明 626473
版权声明 601194