Deep diversification of an AAV capsid protein by machine learning

衣壳 序列空间 计算生物学 深度学习 生物 肽序列 计算机科学 人工智能 病毒 遗传学 基因 数学 巴拿赫空间 纯数学
作者
Drew Bryant,Ali Bashir,Sam Sinai,Nina Jain,Pierce J. Ogden,Patrick Riley,George M. Church,Lucy J. Colwell,Eric D. Kelsic
出处
期刊:Nature Biotechnology [Springer Nature]
卷期号:39 (6): 691-696 被引量:204
标识
DOI:10.1038/s41587-020-00793-4
摘要

Modern experimental technologies can assay large numbers of biological sequences, but engineered protein libraries rarely exceed the sequence diversity of natural protein families. Machine learning (ML) models trained directly on experimental data without biophysical modeling provide one route to accessing the full potential diversity of engineered proteins. Here we apply deep learning to design highly diverse adeno-associated virus 2 (AAV2) capsid protein variants that remain viable for packaging of a DNA payload. Focusing on a 28-amino acid segment, we generated 201,426 variants of the AAV2 wild-type (WT) sequence yielding 110,689 viable engineered capsids, 57,348 of which surpass the average diversity of natural AAV serotype sequences, with 12–29 mutations across this region. Even when trained on limited data, deep neural network models accurately predict capsid viability across diverse variants. This approach unlocks vast areas of functional but previously unreachable sequence space, with many potential applications for the generation of improved viral vectors and protein therapeutics. Viable AAV capsids are designed with a machine learning approach.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
嘛哩嘛哩轰完成签到,获得积分10
2秒前
3秒前
leilei完成签到,获得积分10
4秒前
小周完成签到,获得积分10
5秒前
7秒前
liu发布了新的文献求助10
7秒前
SciGPT应助芳菲依旧采纳,获得150
8秒前
日天气完成签到,获得积分10
8秒前
8秒前
123566完成签到,获得积分10
8秒前
WYN发布了新的文献求助10
9秒前
10秒前
11秒前
11秒前
11秒前
11秒前
量子星尘发布了新的文献求助10
12秒前
日天气发布了新的文献求助10
12秒前
HHY完成签到,获得积分10
13秒前
清脆大门完成签到,获得积分10
14秒前
14秒前
Liuxinyiliu发布了新的文献求助10
15秒前
秋凛发布了新的文献求助10
15秒前
量子星尘发布了新的文献求助10
16秒前
THJJ发布了新的文献求助10
16秒前
17秒前
17秒前
yangching完成签到,获得积分10
18秒前
十年小橘完成签到,获得积分10
20秒前
SciGPT应助会发光的小叶子采纳,获得10
20秒前
潮流季发布了新的文献求助10
20秒前
香蕉觅云应助奶桃七七采纳,获得10
20秒前
小铭发布了新的文献求助10
22秒前
内向月饼完成签到,获得积分10
22秒前
伶俐如冰完成签到,获得积分10
24秒前
默默随阴完成签到 ,获得积分10
24秒前
25秒前
26秒前
RC_Wang应助lhlhl采纳,获得10
26秒前
量子星尘发布了新的文献求助10
26秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Quaternary Science Reference Third edition 6000
Encyclopedia of Forensic and Legal Medicine Third Edition 5000
Introduction to strong mixing conditions volume 1-3 5000
Aerospace Engineering Education During the First Century of Flight 3000
Agyptische Geschichte der 21.30. Dynastie 3000
Les Mantodea de guyane 2000
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5785393
求助须知:如何正确求助?哪些是违规求助? 5687580
关于积分的说明 15467396
捐赠科研通 4914484
什么是DOI,文献DOI怎么找? 2645216
邀请新用户注册赠送积分活动 1593054
关于科研通互助平台的介绍 1547382