scGPT-spatial: Continual Pretraining of Single-Cell Foundation Model for Spatial Transcriptomics

基础(证据) 计算机科学 转录组 人工智能 地理 生物 基因表达 遗传学 考古 基因
作者
Chloe Xueqi Wang,Haotian Cui,A. Zhang,Ronald Xie,Hani Goodarzi,Bo Wang
标识
DOI:10.1101/2025.02.05.636714
摘要

Spatial transcriptomics has emerged as a pivotal technology for profiling gene expression of cells within their spatial context. The rapid growth of publicly available spatial data presents an opportunity to further our understanding of microenvironments that drive cell fate decisions and disease progression. However, existing foundation models, largely pretrained on single-cell RNA sequencing (scRNA-seq) data, fail to resolve the spatial relationships among samples or capture the unique distributions from various sequencing protocols. We introduce scGPT-spatial, a specialized foundation model for spatial transcriptomics continually pretrained on our previously published scGPT scRNA-seq foundation model. We also curate SpatialHuman30M, a comprehensive spatial transcriptomics dataset comprising of 30 million spatial transcriptomic profiles, encompassing both imaging- and sequencing-based protocols. To facilitate integration, scGPT-spatial introduces a novel MoE (Mixture of Experts) decoder that adaptively routes samples for protocol-aware decoding of gene expression profiles. Moreover, scGPT-spatial employs a spatially-aware sampling strategy and a novel neighborhood-based training objective to better capture spatial co-localization patterns among cell states within tissue. Empirical evaluations demonstrate that scGPT-spatial robustly integrates spatial data in mulit-slide and multi-modal settings, and effectively supports cell-type deconvolution and contextualized missing gene expression imputation, outperforming many existing methods. The scGPT-spatial codebase is publicly available at https://github.com/bowang-lab/scGPT-spatial.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
壁虎君完成签到,获得积分10
刚刚
情怀应助调皮的如凡采纳,获得10
1秒前
2秒前
奋斗的荆发布了新的文献求助10
5秒前
完美世界应助平常的海露采纳,获得10
6秒前
pcm完成签到 ,获得积分10
6秒前
归尘发布了新的文献求助10
9秒前
李海平发布了新的文献求助10
10秒前
10秒前
专注的晋鹏完成签到,获得积分10
12秒前
12秒前
南浔完成签到 ,获得积分10
13秒前
小唐发布了新的文献求助10
16秒前
materials_完成签到,获得积分10
16秒前
17秒前
奋斗的荆完成签到,获得积分10
17秒前
Zz完成签到,获得积分10
19秒前
19秒前
今后应助Jennie采纳,获得10
20秒前
22秒前
23秒前
丘比特应助zz采纳,获得10
25秒前
柔弱友卉应助李不过采纳,获得20
25秒前
26秒前
搜集达人应助平常的海露采纳,获得10
27秒前
27秒前
Zack发布了新的文献求助30
27秒前
you完成签到,获得积分10
29秒前
那些年发布了新的文献求助10
31秒前
上官若男应助lish采纳,获得10
31秒前
Cici完成签到 ,获得积分10
32秒前
小唐完成签到,获得积分10
33秒前
凶狠的绿兰完成签到,获得积分10
35秒前
36秒前
吡咯爱成环应助朴实山兰采纳,获得10
36秒前
Mio完成签到,获得积分10
38秒前
hjlhjl完成签到,获得积分10
38秒前
40秒前
笑点低亚男完成签到,获得积分10
42秒前
魔法签证1993完成签到,获得积分10
43秒前
高分求助中
Востребованный временем 2500
Agaricales of New Zealand 1: Pluteaceae - Entolomataceae 1040
지식생태학: 생태학, 죽은 지식을 깨우다 600
海南省蛇咬伤流行病学特征与预后影响因素分析 500
Neuromuscular and Electrodiagnostic Medicine Board Review 500
ランス多機能化技術による溶鋼脱ガス処理の高効率化の研究 500
Relativism, Conceptual Schemes, and Categorical Frameworks 500
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3462542
求助须知:如何正确求助?哪些是违规求助? 3056077
关于积分的说明 9050722
捐赠科研通 2745731
什么是DOI,文献DOI怎么找? 1506546
科研通“疑难数据库(出版商)”最低求助积分说明 696165
邀请新用户注册赠送积分活动 695677