CosTaL: an accurate and scalable graph-based clustering algorithm for high-dimensional single-cell data analysis

聚类分析 计算机科学 余弦相似度 可扩展性 图形 聚类系数 模式识别(心理学) 算法 数据挖掘 人工智能 理论计算机科学 数据库
作者
Yijia Li,Jonathan V. Nguyen,David C. Anastasiu,Edgar A. Arriaga
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:24 (3) 被引量:3
标识
DOI:10.1093/bib/bbad157
摘要

Abstract With the aim of analyzing large-sized multidimensional single-cell datasets, we are describing a method for Cosine-based Tanimoto similarity-refined graph for community detection using Leiden’s algorithm (CosTaL). As a graph-based clustering method, CosTaL transforms the cells with high-dimensional features into a weighted k-nearest-neighbor (kNN) graph. The cells are represented by the vertices of the graph, while an edge between two vertices in the graph represents the close relatedness between the two cells. Specifically, CosTaL builds an exact kNN graph using cosine similarity and uses the Tanimoto coefficient as the refining strategy to re-weight the edges in order to improve the effectiveness of clustering. We demonstrate that CosTaL generally achieves equivalent or higher effectiveness scores on seven benchmark cytometry datasets and six single-cell RNA-sequencing datasets using six different evaluation metrics, compared with other state-of-the-art graph-based clustering methods, including PhenoGraph, Scanpy and PARC. As indicated by the combined evaluation metrics, Costal has high efficiency with small datasets and acceptable scalability for large datasets, which is beneficial for large-scale analysis.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
罐罐儿应助MNing采纳,获得10
刚刚
桐桐应助小所采纳,获得10
刚刚
DAI正杰发布了新的文献求助10
刚刚
朴实的母鸡完成签到,获得积分10
刚刚
跳跃小伙完成签到 ,获得积分10
1秒前
科研老兵完成签到,获得积分10
1秒前
电化学小生完成签到,获得积分10
1秒前
sulyspr发布了新的文献求助10
1秒前
Night完成签到,获得积分10
1秒前
2秒前
着急的小松鼠完成签到,获得积分10
2秒前
2秒前
Qianyun完成签到,获得积分10
3秒前
3秒前
刘小天完成签到,获得积分10
3秒前
3秒前
3秒前
dongjh发布了新的文献求助10
3秒前
星辰大海应助复杂易形采纳,获得10
4秒前
狄秋白完成签到,获得积分10
4秒前
4秒前
5秒前
zhanfan321完成签到,获得积分10
6秒前
刘成发布了新的文献求助30
6秒前
逗逗完成签到,获得积分10
6秒前
好好好完成签到 ,获得积分10
6秒前
6秒前
华仔应助WenyHe采纳,获得10
6秒前
顺利的伊完成签到,获得积分10
7秒前
sunshine发布了新的文献求助10
7秒前
就叫十一吧完成签到,获得积分10
7秒前
科研通AI6应助WestHoter采纳,获得10
8秒前
小二郎应助笨蛋小章采纳,获得10
8秒前
浮游应助研友_LapYN8采纳,获得10
8秒前
Akim应助刘小天采纳,获得10
8秒前
延胡索完成签到,获得积分10
8秒前
killer10831完成签到,获得积分10
9秒前
9秒前
391X小king发布了新的文献求助10
9秒前
要努力鸭发布了新的文献求助10
9秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Reproduction Third Edition 3000
Comprehensive Methanol Science Production, Applications, and Emerging Technologies 2000
From Victimization to Aggression 1000
化妆品原料学 1000
小学科学课程与教学 500
Study and Interlaboratory Validation of Simultaneous LC-MS/MS Method for Food Allergens Using Model Processed Foods 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5645431
求助须知:如何正确求助?哪些是违规求助? 4768803
关于积分的说明 15028908
捐赠科研通 4804012
什么是DOI,文献DOI怎么找? 2568656
邀请新用户注册赠送积分活动 1525914
关于科研通互助平台的介绍 1485570