scGCC: Graph Contrastive Clustering With Neighborhood Augmentations for scRNA-Seq Data Analysis

聚类分析 计算机科学 稳健性(进化) 人工智能 过度拟合 数据挖掘 特征学习 机器学习 降维 推论 图形 共识聚类 模式识别(心理学) 相关聚类 CURE数据聚类算法 人工神经网络 理论计算机科学 基因 生物化学 化学
作者
Shengwen Tian,Jiancheng Ni,Yutian Wang,Chun-Hou Zheng,Cun-Mei Ji
出处
期刊:IEEE Journal of Biomedical and Health Informatics [Institute of Electrical and Electronics Engineers]
卷期号:27 (12): 6133-6143 被引量:1
标识
DOI:10.1109/jbhi.2023.3319551
摘要

Single-cell RNA sequencing (scRNA-seq) has rapidly emerged as a powerful technique for analyzing cellular heterogeneity at the individual cell level. In the analysis of scRNA-seq data, cell clustering is a critical step in downstream analysis, as it enables the identification of cell types and the discovery of novel cell subtypes. However, the characteristics of scRNA-seq data, such as high dimensionality and sparsity, dropout events and batch effects, present significant computational challenges for clustering analysis. In this study, we propose scGCC, a novel graph self-supervised contrastive learning model, to address the challenges faced in scRNA-seq data analysis. scGCC comprises two main components: a representation learning module and a clustering module. The scRNA-seq data is first fed into a representation learning module for training, which is then used for data classification through a clustering module. scGCC can learn low-dimensional denoised embeddings, which is advantageous for our clustering task. We introduce Graph Attention Networks (GAT) for cell representation learning, which enables better feature extraction and improved clustering accuracy. Additionally, we propose five data augmentation methods to improve clustering performance by increasing data diversity and reducing overfitting. These methods enhance the robustness of clustering results. Our experimental study on 14 real-world datasets has demonstrated that our model achieves extraordinary accuracy and robustness. We also perform downstream tasks, including batch effect removal, trajectory inference, and marker genes analysis, to verify the biological effectiveness of our model.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
croissante完成签到 ,获得积分10
15秒前
Ding完成签到,获得积分10
28秒前
btcat完成签到,获得积分10
28秒前
寒冷的断秋发布了新的文献求助150
47秒前
沙里飞完成签到 ,获得积分10
52秒前
是我呀小夏完成签到 ,获得积分10
53秒前
lvvvvvv完成签到,获得积分10
1分钟前
cyskdsn完成签到 ,获得积分10
1分钟前
铜豌豆完成签到 ,获得积分10
1分钟前
Hank完成签到 ,获得积分10
1分钟前
张亮完成签到 ,获得积分10
1分钟前
Singularity应助科研通管家采纳,获得30
1分钟前
Singularity应助科研通管家采纳,获得30
1分钟前
joeqin完成签到,获得积分10
1分钟前
maggiexjl完成签到,获得积分10
1分钟前
小杨完成签到 ,获得积分10
2分钟前
搜集达人应助夏添采纳,获得10
2分钟前
慧喆完成签到 ,获得积分10
2分钟前
可靠谷蓝完成签到 ,获得积分10
2分钟前
木光完成签到,获得积分20
2分钟前
太拗口哟完成签到,获得积分10
2分钟前
2分钟前
六等于三二一完成签到 ,获得积分10
3分钟前
榆木小鸟完成签到 ,获得积分10
3分钟前
任性星星完成签到 ,获得积分10
3分钟前
lyk完成签到 ,获得积分10
3分钟前
123完成签到 ,获得积分10
3分钟前
李浅墨完成签到 ,获得积分10
3分钟前
WLX001完成签到 ,获得积分10
3分钟前
Singularity应助科研通管家采纳,获得10
3分钟前
小马甲应助科研通管家采纳,获得10
3分钟前
Singularity应助科研通管家采纳,获得10
3分钟前
Singularity应助科研通管家采纳,获得10
3分钟前
Singularity应助科研通管家采纳,获得10
3分钟前
qiaobaqiao完成签到 ,获得积分10
3分钟前
Din完成签到 ,获得积分10
4分钟前
zuhangzhao完成签到 ,获得积分10
4分钟前
名侦探柯基完成签到 ,获得积分10
4分钟前
幽默大象完成签到 ,获得积分10
4分钟前
l老王完成签到 ,获得积分10
5分钟前
高分求助中
Sustainability in Tides Chemistry 2800
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
Rechtsphilosophie 1000
Bayesian Models of Cognition:Reverse Engineering the Mind 888
Defense against predation 800
Very-high-order BVD Schemes Using β-variable THINC Method 568
Chen Hansheng: China’s Last Romantic Revolutionary 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3137039
求助须知:如何正确求助?哪些是违规求助? 2788025
关于积分的说明 7784284
捐赠科研通 2444088
什么是DOI,文献DOI怎么找? 1299724
科研通“疑难数据库(出版商)”最低求助积分说明 625536
版权声明 601010