Highly accurate protein structure prediction for the human proteome

计算机科学 蛋白质组 领域(数学分析) 人类蛋白质组计划 计算生物学 蛋白质组学 比例(比率) 蛋白质结构 机器学习 生物 数据科学 数据挖掘 生物信息学 化学 数学 生物化学 量子力学 基因 物理 数学分析
作者
Kathryn Tunyasuvunakool,Jonas Adler,Zachary Wu,Tim Green,Michał Zieliński,Augustin Žídek,Alex Bridgland,Andrew Cowie,Clemens Meyer,Agata Laydon,Sameer Velankar,Gerard J. Kleywegt,Alex Bateman,Richard Evans,Alexander Pritzel,Michael Figurnov,Olaf Ronneberger,Russell Bates,Simon Kohl,Anna Potapenko,Andrew J. Ballard,Bernardino Romera‐Paredes,Stanislav Nikolov,Rishub Jain,Ellen Clancy,David Reiman,Stig Petersen,Andrew Senior,Koray Kavukcuoglu,Ewan Birney,Pushmeet Kohli,John Jumper,Demis Hassabis
出处
期刊:Nature [Springer Nature]
卷期号:596 (7873): 590-596 被引量:2187
标识
DOI:10.1038/s41586-021-03828-1
摘要

Abstract Protein structures can provide invaluable information, both for reasoning about biological processes and for enabling interventions such as structure-based drug development or targeted mutagenesis. After decades of effort, 17% of the total residues in human protein sequences are covered by an experimentally determined structure 1 . Here we markedly expand the structural coverage of the proteome by applying the state-of-the-art machine learning method, AlphaFold 2 , at a scale that covers almost the entire human proteome (98.5% of human proteins). The resulting dataset covers 58% of residues with a confident prediction, of which a subset (36% of all residues) have very high confidence. We introduce several metrics developed by building on the AlphaFold model and use them to interpret the dataset, identifying strong multi-domain predictions as well as regions that are likely to be disordered. Finally, we provide some case studies to illustrate how high-quality predictions could be used to generate biological hypotheses. We are making our predictions freely available to the community and anticipate that routine large-scale and high-accuracy structure prediction will become an important tool that will allow new questions to be addressed from a structural perspective.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
科研通AI2S应助科研通管家采纳,获得10
1秒前
星辰大海应助科研通管家采纳,获得10
1秒前
1秒前
英姑应助科研通管家采纳,获得10
1秒前
Jasper应助科研通管家采纳,获得10
1秒前
1秒前
1秒前
1秒前
SciGPT应助王111采纳,获得10
2秒前
bofu发布了新的文献求助20
4秒前
5秒前
共享精神应助仔仔采纳,获得10
5秒前
6秒前
tian给tian的求助进行了留言
9秒前
9秒前
10秒前
10秒前
Lucas应助兴奋寄容采纳,获得10
11秒前
vfuisNBIO发布了新的文献求助10
11秒前
kento应助acceleactor采纳,获得100
11秒前
12秒前
bofu发布了新的文献求助10
14秒前
慕冰蝶发布了新的文献求助10
14秒前
哈哈哈完成签到 ,获得积分10
16秒前
16秒前
桐桐应助彧辰采纳,获得10
16秒前
李健的小迷弟应助Liam采纳,获得10
17秒前
cuiguo发布了新的文献求助10
18秒前
Hubery完成签到 ,获得积分10
18秒前
19秒前
子车茗应助ZQF采纳,获得10
19秒前
20秒前
21秒前
Lucas应助vfuisNBIO采纳,获得10
22秒前
丘比特应助cuiguo采纳,获得10
22秒前
acceleactor完成签到,获得积分10
23秒前
bofu发布了新的文献求助10
24秒前
25秒前
杜嘟嘟发布了新的文献求助10
25秒前
25秒前
高分求助中
Sustainability in Tides Chemistry 2000
Bayesian Models of Cognition:Reverse Engineering the Mind 800
Essentials of thematic analysis 700
A Dissection Guide & Atlas to the Rabbit 600
Very-high-order BVD Schemes Using β-variable THINC Method 568
Внешняя политика КНР: о сущности внешнеполитического курса современного китайского руководства 500
Revolution und Konterrevolution in China [by A. Losowsky] 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3124565
求助须知:如何正确求助?哪些是违规求助? 2774891
关于积分的说明 7724521
捐赠科研通 2430358
什么是DOI,文献DOI怎么找? 1291087
科研通“疑难数据库(出版商)”最低求助积分说明 622052
版权声明 600297