Towards K-means-friendly Spaces: Simultaneous Deep Learning and Clustering

计算机科学 聚类分析 人工智能 可扩展性 转化(遗传学) 人工神经网络 机器学习 降维 维数之咒 生成语法 生物化学 数据库 基因 化学
作者
Bo Yang,Xiao Fu,Nicholas D. Sidiropoulos,Hong Mei
出处
期刊:Cornell University - arXiv 被引量:354
标识
DOI:10.48550/arxiv.1610.04794
摘要

Most learning approaches treat dimensionality reduction (DR) and clustering separately (i.e., sequentially), but recent research has shown that optimizing the two tasks jointly can substantially improve the performance of both. The premise behind the latter genre is that the data samples are obtained via linear transformation of latent representations that are easy to cluster; but in practice, the transformation from the latent space to the data can be more complicated. In this work, we assume that this transformation is an unknown and possibly nonlinear function. To recover the `clustering-friendly' latent representations and to better cluster the data, we propose a joint DR and K-means clustering approach in which DR is accomplished via learning a deep neural network (DNN). The motivation is to keep the advantages of jointly optimizing the two tasks, while exploiting the deep neural network's ability to approximate any nonlinear function. This way, the proposed approach can work well for a broad class of generative models. Towards this end, we carefully design the DNN structure and the associated joint optimization criterion, and propose an effective and scalable algorithm to handle the formulated optimization problem. Experiments using different real datasets are employed to showcase the effectiveness of the proposed approach.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
ddd完成签到,获得积分10
1秒前
思源应助宁宁宁采纳,获得10
2秒前
weixiaosi完成签到 ,获得积分10
3秒前
菲菲公主发布了新的文献求助30
4秒前
5秒前
英俊的铭应助科研通管家采纳,获得100
5秒前
科研通AI2S应助科研通管家采纳,获得10
5秒前
酷波er应助何雨亭采纳,获得10
8秒前
9秒前
9秒前
飘逸的山柏完成签到 ,获得积分10
9秒前
Yjj发布了新的文献求助10
11秒前
Ava应助秋冬采纳,获得10
11秒前
柠檬九分酸完成签到,获得积分10
12秒前
12秒前
16秒前
脑洞疼应助复杂的路人采纳,获得10
17秒前
尼古拉斯佩奇完成签到,获得积分10
18秒前
19秒前
20秒前
英俊的铭应助jella采纳,获得10
20秒前
宁宁宁发布了新的文献求助10
21秒前
23秒前
超级灰狼完成签到 ,获得积分10
23秒前
Jasen发布了新的文献求助10
24秒前
24秒前
25秒前
27秒前
大橙子发布了新的文献求助10
27秒前
叮叮车发布了新的文献求助30
28秒前
秋冬发布了新的文献求助10
28秒前
烂漫碧玉发布了新的文献求助10
29秒前
30秒前
sherrinford完成签到,获得积分10
31秒前
31秒前
动人的诗霜完成签到 ,获得积分10
31秒前
HonglinGao发布了新的文献求助10
33秒前
跳跃富完成签到,获得积分10
33秒前
宁宁宁完成签到,获得积分20
34秒前
35秒前
高分求助中
Lire en communiste 1000
Ore genesis in the Zambian Copperbelt with particular reference to the northern sector of the Chambishi basin 800
Becoming: An Introduction to Jung's Concept of Individuation 600
中国氢能技术发展路线图研究 500
Communist propaganda: a fact book, 1957-1958 500
Briefe aus Shanghai 1946‒1952 (Dokumente eines Kulturschocks) 500
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3168340
求助须知:如何正确求助?哪些是违规求助? 2819684
关于积分的说明 7927447
捐赠科研通 2479569
什么是DOI,文献DOI怎么找? 1320994
科研通“疑难数据库(出版商)”最低求助积分说明 632925
版权声明 602460