BIRCH

聚类分析 计算机科学 数据挖掘 CURE数据聚类算法 鉴定(生物学) 高维数据聚类 相关聚类 公制(单位) 人工智能 机器学习 模式识别(心理学) 运营管理 植物 经济 生物
作者
Tian Zhang,Raghu Ramakrishnan,Miron Livny
标识
DOI:10.1145/233269.233324
摘要

Finding useful patterns in large datasets has attracted considerable interest recently, and one of the most widely studied problems in this area is the identification of clusters, or densely populated regions, in a multi-dimensional dataset. Prior work does not adequately address the problem of large datasets and minimization of I/O costs.This paper presents a data clustering method named BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies), and demonstrates that it is especially suitable for very large databases. BIRCH incrementally and dynamically clusters incoming multi-dimensional metric data points to try to produce the best quality clustering with the available resources (i.e., available memory and time constraints). BIRCH can typically find a good clustering with a single scan of the data, and improve the quality further with a few additional scans. BIRCH is also the first clustering algorithm proposed in the database area to handle "noise" (data points that are not part of the underlying pattern) effectively.We evaluate BIRCH's time/space efficiency, data input order sensitivity, and clustering quality through several experiments. We also present a performance comparisons of BIRCH versus CLARANS, a clustering method proposed recently for large datasets, and show that BIRCH is consistently superior.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
奋斗秋完成签到,获得积分20
刚刚
李爱国应助xiao采纳,获得10
刚刚
铋层状发布了新的文献求助10
刚刚
幸福的鑫鹏完成签到 ,获得积分10
刚刚
1秒前
zzhc发布了新的文献求助10
2秒前
脑洞疼应助爱狗人士Hito采纳,获得10
3秒前
4秒前
pukej完成签到 ,获得积分10
5秒前
6秒前
6秒前
小田儿发布了新的文献求助10
6秒前
情怀应助凯kai采纳,获得10
8秒前
zzhc完成签到,获得积分10
8秒前
黑神白了发布了新的文献求助10
9秒前
wiaa发布了新的文献求助10
10秒前
糊涂的凡发布了新的文献求助10
10秒前
r12r1完成签到,获得积分10
11秒前
Lucky应助wang采纳,获得10
11秒前
小蘑菇应助单薄的南蕾采纳,获得10
11秒前
12秒前
伊弦完成签到,获得积分10
12秒前
万能图书馆应助yang采纳,获得10
13秒前
13秒前
CodeCraft应助xzh采纳,获得10
13秒前
大模型应助不安的黑猫采纳,获得10
16秒前
18秒前
LVZHIPENG发布了新的文献求助10
18秒前
sannia发布了新的文献求助10
20秒前
22秒前
22秒前
贝贝发布了新的文献求助10
23秒前
24秒前
黑神白了完成签到,获得积分10
24秒前
科研通AI6.2应助唐11采纳,获得10
24秒前
义气的猫咪应助YANG采纳,获得10
25秒前
26秒前
27秒前
Zyyyh发布了新的文献求助10
28秒前
脱碳甲醇完成签到,获得积分10
28秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Modern Epidemiology, Fourth Edition 5000
Kinesiophobia : a new view of chronic pain behavior 5000
Molecular Biology of Cancer: Mechanisms, Targets, and Therapeutics 3000
Digital Twins of Advanced Materials Processing 2000
Propeller Design 2000
Weaponeering, Fourth Edition – Two Volume SET 2000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 纳米技术 化学工程 生物化学 物理 计算机科学 内科学 复合材料 催化作用 物理化学 光电子学 电极 冶金 细胞生物学 基因
热门帖子
关注 科研通微信公众号,转发送积分 6015188
求助须知:如何正确求助?哪些是违规求助? 7591009
关于积分的说明 16148068
捐赠科研通 5162807
什么是DOI,文献DOI怎么找? 2764194
邀请新用户注册赠送积分活动 1744655
关于科研通互助平台的介绍 1634650