亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Biological structure and function emerge from scaling unsupervised learning to 250 million protein sequences

人工智能 代表(政治) 计算机科学 无监督学习 机器学习 生成模型 蛋白质三级结构 蛋白质结构预测 序列空间 序列(生物学) 生成语法 蛋白质结构 生物 数学 生物化学 政治 遗传学 巴拿赫空间 法学 纯数学 政治学
作者
Alexander Rives,Joshua Meier,Tom Sercu,Siddharth Goyal,Zeming Lin,Jason Liu,Demi Guo,Myle Ott,C. Lawrence Zitnick,Jerry Ma,Rob Fergus
标识
DOI:10.1101/622803
摘要

Abstract In the field of artificial intelligence, a combination of scale in data and model capacity enabled by un-supervised learning has led to major advances in representation learning and statistical generation. In the life sciences, the anticipated growth of sequencing promises unprecedented data on natural sequence diversity. Protein language modeling at the scale of evolution is a logical step toward predictive and generative artificial intelligence for biology. To this end we use unsupervised learning to train a deep contextual language model on 86 billion amino acids across 250 million protein sequences spanning evolutionary diversity. The resulting model contains information about biological properties in its representations. The representations are learned from sequence data alone. The learned representation space has a multi-scale organization reflecting structure from the level of biochemical properties of amino acids to remote homology of proteins. Information about secondary and tertiary structure is encoded in the representations and can be identified by linear projections. Representation learning produces features that generalize across a range of applications, enabling state-of-the-art supervised prediction of mutational effect and secondary structure, and improving state-of-the-art features for long-range contact prediction.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
心无杂念完成签到 ,获得积分10
4秒前
15秒前
18秒前
一剑白发布了新的文献求助10
32秒前
Marciu33完成签到,获得积分10
34秒前
39秒前
Marciu33发布了新的文献求助10
41秒前
41秒前
冷静初蓝发布了新的文献求助10
46秒前
科研通AI6.2应助yyy2025采纳,获得10
53秒前
冷静初蓝完成签到,获得积分10
57秒前
1分钟前
yyy2025发布了新的文献求助10
1分钟前
SciGPT应助科研通管家采纳,获得10
1分钟前
科研通AI6.2应助yyy2025采纳,获得10
1分钟前
熬夜冠军完成签到,获得积分20
2分钟前
2分钟前
熬夜冠军关注了科研通微信公众号
2分钟前
sndurehfcn发布了新的文献求助10
2分钟前
謓言完成签到,获得积分10
2分钟前
ebgjaghg发布了新的文献求助10
2分钟前
雪满头应助謓言采纳,获得10
3分钟前
科研通AI2S应助科研通管家采纳,获得10
3分钟前
Dylan完成签到,获得积分10
3分钟前
mama完成签到 ,获得积分10
4分钟前
Tashanzhishi完成签到,获得积分10
4分钟前
锕123发布了新的文献求助10
4分钟前
5分钟前
Hello应助锕123采纳,获得10
5分钟前
我是老大应助科研通管家采纳,获得30
5分钟前
5分钟前
5分钟前
跳跃的匪完成签到,获得积分10
5分钟前
酷酷的大米完成签到,获得积分10
5分钟前
瘦瘦秋烟发布了新的文献求助10
5分钟前
Jasper应助Bin_Liu采纳,获得10
5分钟前
7分钟前
碳酸芙兰完成签到,获得积分10
7分钟前
Able完成签到,获得积分10
7分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Prompt Engineering for Clinicians: Harnessing AI in Everyday Medical Practice 600
REAL-WORLD EFFICACY AND GENOMIC LANDSCAPE OF POLATUZUMA VEDOTIN-BASED FIRST-LINE THERAPY IN DIFFUSE LARGE B-CELL LYMPHOMA: A FOCUS ON TP53 MUTATIONS AND TREATMENT RESPONSE 500
Handbook of Luminescence Dating 500
Safety Pharmacology 500
《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 500
Treatment of refractory idiopathic overactive bladder with incobotulinumtoxinA and vibe delivery system (XAVIER): pilot study 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6947285
求助须知:如何正确求助?哪些是违规求助? 8632161
关于积分的说明 18307420
捐赠科研通 6385253
什么是DOI,文献DOI怎么找? 3080413
关于科研通互助平台的介绍 2123049
邀请新用户注册赠送积分活动 2057325