Clustering aggregation

聚类分析 相关聚类 CURE数据聚类算法 范畴变量 约束聚类 计算机科学 数据挖掘 数据流聚类 树冠聚类算法 模糊聚类 数学 人工智能 机器学习
作者
Aristides Gionis,Heikki Mannila,Panayiotis Tsaparas
出处
期刊:ACM Transactions on Knowledge Discovery From Data [Association for Computing Machinery]
卷期号:1 (1): 4-4 被引量:756
标识
DOI:10.1145/1217299.1217303
摘要

We consider the following problem: given a set of clusterings, find a single clustering that agrees as much as possible with the input clusterings. This problem, clustering aggregation , appears naturally in various contexts. For example, clustering categorical data is an instance of the clustering aggregation problem; each categorical attribute can be viewed as a clustering of the input rows where rows are grouped together if they take the same value on that attribute. Clustering aggregation can also be used as a metaclustering method to improve the robustness of clustering by combining the output of multiple algorithms. Furthermore, the problem formulation does not require a priori information about the number of clusters; it is naturally determined by the optimization function. In this article, we give a formal statement of the clustering aggregation problem, and we propose a number of algorithms. Our algorithms make use of the connection between clustering aggregation and the problem of correlation clustering . Although the problems we consider are NP-hard, for several of our methods, we provide theoretical guarantees on the quality of the solutions. Our work provides the best deterministic approximation algorithm for the variation of the correlation clustering problem we consider. We also show how sampling can be used to scale the algorithms for large datasets. We give an extensive empirical evaluation demonstrating the usefulness of the problem and of the solutions.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
n1gern发布了新的文献求助20
刚刚
周可以发布了新的文献求助10
1秒前
Akim应助alisa采纳,获得10
2秒前
2秒前
2秒前
紧张的谷槐完成签到,获得积分10
4秒前
Max发布了新的文献求助30
4秒前
mhdu完成签到,获得积分10
5秒前
77完成签到,获得积分10
6秒前
6秒前
無心发布了新的文献求助10
6秒前
今后应助wayhome采纳,获得10
6秒前
7秒前
nnnnn完成签到,获得积分10
8秒前
董致宇完成签到,获得积分20
8秒前
zengyiyong完成签到,获得积分10
8秒前
朱大头完成签到,获得积分10
8秒前
8秒前
yydragen应助难过宫苴采纳,获得80
8秒前
汤振杰关注了科研通微信公众号
9秒前
科研通AI2S应助忧郁的听露采纳,获得10
9秒前
实验失败导一导完成签到,获得积分10
9秒前
宋畅完成签到 ,获得积分10
10秒前
zjz9928发布了新的文献求助10
10秒前
10秒前
mhdu发布了新的文献求助50
11秒前
12秒前
12秒前
Owen应助李白采纳,获得10
12秒前
13秒前
张豪英完成签到,获得积分10
13秒前
凯睿发布了新的文献求助10
13秒前
俏皮从雪发布了新的文献求助10
13秒前
14秒前
苑小苑发布了新的文献求助10
14秒前
小吕小吕发布了新的文献求助10
14秒前
Robert完成签到,获得积分10
14秒前
科研通AI2S应助傻傻的芹菜采纳,获得10
15秒前
Tera发布了新的文献求助10
16秒前
swityha发布了新的文献求助10
16秒前
高分求助中
Ophthalmic Equipment Market by Devices(surgical: vitreorentinal,IOLs,OVDs,contact lens,RGP lens,backflush,diagnostic&monitoring:OCT,actorefractor,keratometer,tonometer,ophthalmoscpe,OVD), End User,Buying Criteria-Global Forecast to2029 2000
A new approach to the extrapolation of accelerated life test data 1000
Cognitive Neuroscience: The Biology of the Mind 1000
Cognitive Neuroscience: The Biology of the Mind (Sixth Edition) 1000
ACSM’s Guidelines for Exercise Testing and Prescription, 12th edition 588
Christian Women in Chinese Society: The Anglican Story 500
A Preliminary Study on Correlation Between Independent Components of Facial Thermal Images and Subjective Assessment of Chronic Stress 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3961351
求助须知:如何正确求助?哪些是违规求助? 3507711
关于积分的说明 11137438
捐赠科研通 3240131
什么是DOI,文献DOI怎么找? 1790762
邀请新用户注册赠送积分活动 872504
科研通“疑难数据库(出版商)”最低求助积分说明 803271