亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Improving the prediction of protein stability changes upon mutations by geometric learning and a pre-training strategy

概化理论 人工智能 理论(学习稳定性) 水准点(测量) 计算机科学 机器学习 训练集 适应度函数 深度学习 相关性 试验数据 数学 遗传算法 统计 大地测量学 几何学 程序设计语言 地理
作者
Yunxin Xu,Ди Лю,Haipeng Gong
标识
DOI:10.1101/2023.05.28.542668
摘要

A bstract Accurate prediction of the fitness and stability of a protein upon mutations is of high importance in protein engineering and design. Despite the rapid development of deep learning techniques and accumulation of experimental data, the multi-labeled nature of fitness data hinders the training of robust deep-learning-based models for the fitness and stability prediction tasks. Here, we propose three geometric-learning-based models, GeoFitness, GeoDDG and GeoDTm, for the prediction of the fitness score, ΔΔ G and Δ T m of a protein upon mutations, respectively. In the optimization of GeoFitness, we designed a novel loss function to allow supervised training of a unified model using the large amount of multi-labeled fitness data in the deep mutational scanning (DMS) database. By this means, GeoFitness efficiently learns the general functional effects of protein mutations and achieves better performance over the other state-of-the-art methods. To further improve the downstream tasks of ΔΔ G /Δ T m prediction, we re-utilized the encoder of GeoFitness as a pre-trained module in GeoDDG and GeoDTm to overcome the challenge of lack of sufficient amount of specifically labeled data. This pre-training strategy in combination with data expansion remarkably improves model performance and generalizability. When evaluated on the benchmark test sets (S669 for ΔΔ G prediction and a newly collected set S571 for Δ T m prediction), GeoDDG and GeoDTm outperform the other state-of-the-art methods by at least 30% and 70%, respectively, in terms of the Spearman correlation coefficient between predicted and experimental values. An online server for the suite of these three predictors, GeoStab-suite, is available at http://structpred.life.tsinghua.edu.cn/server_geostab.html .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
roy完成签到,获得积分10
8秒前
bkagyin应助hkxfg采纳,获得10
11秒前
21秒前
02发布了新的文献求助10
28秒前
运运完成签到 ,获得积分10
31秒前
Maple发布了新的文献求助10
38秒前
wzzznh完成签到 ,获得积分10
49秒前
Maple完成签到,获得积分10
53秒前
端庄亦巧完成签到 ,获得积分10
54秒前
科研通AI5应助jacs111采纳,获得10
54秒前
CodeCraft应助罗舒采纳,获得10
57秒前
1分钟前
1分钟前
jacs111发布了新的文献求助10
1分钟前
Zjc0913完成签到 ,获得积分10
1分钟前
libob完成签到,获得积分10
1分钟前
Aaaaa发布了新的文献求助10
1分钟前
jacs111完成签到,获得积分10
1分钟前
xmqaq完成签到,获得积分10
1分钟前
Orange应助科研通管家采纳,获得10
1分钟前
领导范儿应助科研通管家采纳,获得10
1分钟前
Aaaaa完成签到,获得积分20
1分钟前
林利芳完成签到 ,获得积分0
1分钟前
1分钟前
流萤发布了新的文献求助30
1分钟前
hwen1998完成签到 ,获得积分10
1分钟前
鱼羊明完成签到 ,获得积分10
1分钟前
tufei完成签到,获得积分10
1分钟前
暮冬完成签到 ,获得积分10
1分钟前
流萤完成签到,获得积分10
1分钟前
瑞瑞刘完成签到 ,获得积分10
2分钟前
土豪的摩托完成签到 ,获得积分10
2分钟前
z610938841完成签到,获得积分10
2分钟前
雨yu完成签到 ,获得积分10
2分钟前
张晓祁完成签到,获得积分10
2分钟前
yueying完成签到,获得积分10
2分钟前
2分钟前
脑洞疼应助邓邓采纳,获得10
2分钟前
3分钟前
笨蛋美女完成签到 ,获得积分10
3分钟前
高分求助中
Ophthalmic Equipment Market by Devices(surgical: vitreorentinal,IOLs,OVDs,contact lens,RGP lens,backflush,diagnostic&monitoring:OCT,actorefractor,keratometer,tonometer,ophthalmoscpe,OVD), End User,Buying Criteria-Global Forecast to2029 2000
A new approach to the extrapolation of accelerated life test data 1000
Cognitive Neuroscience: The Biology of the Mind 1000
Technical Brochure TB 814: LPIT applications in HV gas insulated switchgear 1000
Immigrant Incorporation in East Asian Democracies 500
Nucleophilic substitution in azasydnone-modified dinitroanisoles 500
不知道标题是什么 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3965642
求助须知:如何正确求助?哪些是违规求助? 3510896
关于积分的说明 11155529
捐赠科研通 3245353
什么是DOI,文献DOI怎么找? 1792856
邀请新用户注册赠送积分活动 874161
科研通“疑难数据库(出版商)”最低求助积分说明 804214