Evolutionary-scale prediction of atomic-level protein structure with a language model

基因组 推论 计算机科学 蛋白质结构预测 构造(python库) 蛋白质结构 序列(生物学) 人工智能 比例(比率) 机器学习 计算生物学 生物 遗传学 地理 地图学 生物化学 基因 程序设计语言
作者
Zeming Lin,Halil Akin,Roshan Rao,Brian Hie,Zhongkai Zhu,Wenting Lu,Nikita Smetanin,Robert Verkuil,Ori Kabeli,Yaniv Shmueli,Allan dos Santos Costa,Maryam Fazel-Zarandi,Tom Sercu,Salvatore Candido,Alexander Rives
出处
期刊:Science [American Association for the Advancement of Science (AAAS)]
卷期号:379 (6637): 1123-1130 被引量:3635
标识
DOI:10.1126/science.ade2574
摘要

Recent advances in machine learning have leveraged evolutionary information in multiple sequence alignments to predict protein structure. We demonstrate direct inference of full atomic-level protein structure from primary sequence using a large language model. As language models of protein sequences are scaled up to 15 billion parameters, an atomic-resolution picture of protein structure emerges in the learned representations. This results in an order-of-magnitude acceleration of high-resolution structure prediction, which enables large-scale structural characterization of metagenomic proteins. We apply this capability to construct the ESM Metagenomic Atlas by predicting structures for >617 million metagenomic protein sequences, including >225 million that are predicted with high confidence, which gives a view into the vast breadth and diversity of natural proteins.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
风中的善愁完成签到,获得积分10
2秒前
凉月发布了新的文献求助20
2秒前
开心发布了新的文献求助10
2秒前
3秒前
Luckqi6688发布了新的文献求助200
3秒前
潇洒的天与完成签到,获得积分10
3秒前
完美问玉完成签到,获得积分10
3秒前
3秒前
万能图书馆应助明芷蝶采纳,获得10
4秒前
4秒前
4秒前
萧瑟秋风今又是完成签到 ,获得积分10
4秒前
花花完成签到,获得积分20
4秒前
4秒前
4秒前
5秒前
jlk完成签到,获得积分10
5秒前
小乖乖永远在路上完成签到,获得积分10
5秒前
萝卜干完成签到,获得积分10
5秒前
甜蜜靖雁发布了新的文献求助10
5秒前
贰鸟完成签到,获得积分0
6秒前
李春晓完成签到,获得积分10
6秒前
英姑应助沉默的驳采纳,获得10
6秒前
达尔杜弗发布了新的文献求助10
6秒前
6秒前
化合物来发布了新的文献求助10
7秒前
喜悦莛完成签到,获得积分10
7秒前
7秒前
8秒前
Moonber发布了新的文献求助10
8秒前
Darlin发布了新的文献求助10
8秒前
rui发布了新的文献求助10
8秒前
8秒前
执着访文发布了新的文献求助10
9秒前
第十二夜完成签到,获得积分10
9秒前
INNE完成签到,获得积分10
9秒前
花花发布了新的文献求助20
9秒前
133完成签到,获得积分10
9秒前
涵胡不清完成签到 ,获得积分10
9秒前
多金多金完成签到 ,获得积分10
9秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Binary Alloy Phase Diagrams, 2nd Edition 8000
A Practical Introduction to Regression Discontinuity Designs 2000
Comprehensive Methanol Science Production, Applications, and Emerging Technologies 2000
Building Quantum Computers 800
Translanguaging in Action in English-Medium Classrooms: A Resource Book for Teachers 700
二氧化碳加氢催化剂——结构设计与反应机制研究 660
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5659205
求助须知:如何正确求助?哪些是违规求助? 4827677
关于积分的说明 15085891
捐赠科研通 4817891
什么是DOI,文献DOI怎么找? 2578393
邀请新用户注册赠送积分活动 1533047
关于科研通互助平台的介绍 1491746