已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Enhancing Protein Function Prediction Performance by Utilizing AlphaFold-Predicted Protein Structures

水准点(测量) 蛋白质结构预测 计算机科学 集合(抽象数据类型) 训练集 功能(生物学) 蛋白质功能预测 性能预测 数据挖掘 机器学习 人工智能 蛋白质结构 蛋白质功能 模拟 生物 基因 大地测量学 物理 进化生物学 生物化学 化学 程序设计语言 地理 核磁共振
作者
Wenjian Ma,Shugang Zhang,Zhen Li,Mingjian Jiang,Shuang Wang,Weigang Lu,Xiangpeng Bi,Huasen Jiang,Henggui Zhang,Zhiqiang Wei
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:62 (17): 4008-4017 被引量:45
标识
DOI:10.1021/acs.jcim.2c00885
摘要

The structure of a protein is of great importance in determining its functionality, and this characteristic can be leveraged to train data-driven prediction models. However, the limited number of available protein structures severely limits the performance of these models. AlphaFold2 and its open-source data set of predicted protein structures have provided a promising solution to this problem, and these predicted structures are expected to benefit the model performance by increasing the number of training samples. In this work, we constructed a new data set that acted as a benchmark and implemented a state-of-the-art structure-based approach for determining whether the performance of the function prediction model can be improved by putting additional AlphaFold-predicted structures into the training set and further compared the performance differences between two models separately trained with real structures only and AlphaFold-predicted structures only. Experimental results indicated that structure-based protein function prediction models could benefit from virtual training data consisting of AlphaFold-predicted structures. First, model performances were improved in all three categories of Gene Ontology terms (GO terms) after adding predicted structures as training samples. Second, the model trained only on AlphaFold-predicted virtual samples achieved comparable performances to the model based on experimentally solved real structures, suggesting that predicted structures were almost equally effective in predicting protein functionality.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
柠木完成签到,获得积分10
刚刚
nna完成签到,获得积分10
1秒前
研友_Z6Qggn完成签到 ,获得积分10
4秒前
五五完成签到 ,获得积分10
4秒前
土豆你个西红柿完成签到 ,获得积分10
4秒前
纪梵希发布了新的文献求助10
4秒前
8秒前
11秒前
小黄发布了新的文献求助10
14秒前
14秒前
葛怀锐完成签到 ,获得积分10
15秒前
wuyoung发布了新的文献求助30
17秒前
LYL完成签到,获得积分10
19秒前
qc发布了新的文献求助10
23秒前
江楠完成签到 ,获得积分10
26秒前
英俊的铭应助唐阳采纳,获得10
27秒前
高兴宝贝完成签到 ,获得积分10
28秒前
pathway完成签到 ,获得积分0
31秒前
耳冉完成签到 ,获得积分10
32秒前
传统的哲瀚完成签到,获得积分20
32秒前
canvas完成签到,获得积分10
33秒前
qifunongsuo1213完成签到,获得积分10
35秒前
huenguyenvan完成签到,获得积分10
40秒前
zihang发布了新的文献求助10
42秒前
Alanni完成签到 ,获得积分10
42秒前
43秒前
儒雅完成签到 ,获得积分10
46秒前
唐阳发布了新的文献求助10
46秒前
充电宝应助Abstract采纳,获得10
47秒前
51秒前
无极微光应助qc采纳,获得20
51秒前
小黄发布了新的文献求助10
53秒前
KEyanba发布了新的文献求助10
56秒前
Komorebi完成签到 ,获得积分10
56秒前
沉静的毛衣完成签到,获得积分10
58秒前
xwz626发布了新的文献求助50
58秒前
59秒前
笑点低忆之完成签到 ,获得积分10
1分钟前
w1x2123完成签到,获得积分0
1分钟前
Li发布了新的文献求助10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
Development Across Adulthood 600
天津市智库成果选编 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6444232
求助须知:如何正确求助?哪些是违规求助? 8258117
关于积分的说明 17590782
捐赠科研通 5503161
什么是DOI,文献DOI怎么找? 2901295
邀请新用户注册赠送积分活动 1878333
关于科研通互助平台的介绍 1717595