Deep learning of the regulatory grammar of yeast 5′ untranslated regions from 500,000 random sequences

生物 酿酒酵母 非翻译区 计算生物学 卷积神经网络 三素数非翻译区 调节顺序 遗传学 基因表达调控 基因 五素未翻译区 信使核糖核酸 人工智能 计算机科学
作者
Josh T. Cuperus,Benjamin Groves,Anna Kuchina,Alexander Rosenberg,Nebojša Jojić,Stanley Fields,Georg Seelig
出处
期刊:Genome Research [Cold Spring Harbor Laboratory Press]
卷期号:27 (12): 2015-2024 被引量:187
标识
DOI:10.1101/gr.224964.117
摘要

Our ability to predict protein expression from DNA sequence alone remains poor, reflecting our limited understanding of cis -regulatory grammar and hampering the design of engineered genes for synthetic biology applications. Here, we generate a model that predicts the protein expression of the 5′ untranslated region (UTR) of mRNAs in the yeast Saccharomyces cerevisiae. We constructed a library of half a million 50-nucleotide-long random 5′ UTRs and assayed their activity in a massively parallel growth selection experiment. The resulting data allow us to quantify the impact on protein expression of Kozak sequence composition, upstream open reading frames (uORFs), and secondary structure. We trained a convolutional neural network (CNN) on the random library and showed that it performs well at predicting the protein expression of both a held-out set of the random 5′ UTRs as well as native S. cerevisiae 5′ UTRs. The model additionally was used to computationally evolve highly active 5′ UTRs. We confirmed experimentally that the great majority of the evolved sequences led to higher protein expression rates than the starting sequences, demonstrating the predictive power of this model.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
量子星尘发布了新的文献求助10
刚刚
Luo发布了新的文献求助10
1秒前
杨自强发布了新的文献求助10
1秒前
希望天下0贩的0应助博观采纳,获得10
1秒前
1秒前
古凊发布了新的文献求助10
2秒前
京墨天一完成签到,获得积分10
3秒前
4秒前
4秒前
浮游应助Sun采纳,获得10
4秒前
4秒前
5秒前
发论文完成签到,获得积分10
5秒前
5秒前
6秒前
6秒前
传奇3应助木火采纳,获得10
6秒前
7秒前
小白猪发布了新的文献求助10
7秒前
喝水吗完成签到,获得积分10
7秒前
小魔王发布了新的文献求助10
7秒前
Hello应助YU采纳,获得10
7秒前
亦玉发布了新的文献求助10
7秒前
专注追命发布了新的文献求助10
8秒前
9秒前
自信的发布了新的文献求助10
9秒前
666完成签到,获得积分10
9秒前
zhz发布了新的文献求助10
10秒前
三磷酸腺苷应助Genius采纳,获得10
10秒前
sa发布了新的文献求助10
11秒前
落寞怀柔完成签到,获得积分10
11秒前
12秒前
小白猪完成签到,获得积分10
12秒前
少月发布了新的文献求助10
12秒前
12秒前
12秒前
顾矜应助斯文的文轩采纳,获得10
12秒前
to高坚果发布了新的文献求助10
13秒前
陈乔乔完成签到 ,获得积分10
13秒前
Gxmmmm_应助66采纳,获得10
13秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Zeolites: From Fundamentals to Emerging Applications 1500
Architectural Corrosion and Critical Infrastructure 1000
Early Devonian echinoderms from Victoria (Rhombifera, Blastoidea and Ophiocistioidea) 1000
Hidden Generalizations Phonological Opacity in Optimality Theory 1000
2026国自然单细胞多组学大红书申报宝典 800
Real Analysis Theory of Measure and Integration 3rd Edition 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4913599
求助须知:如何正确求助?哪些是违规求助? 4188210
关于积分的说明 13007290
捐赠科研通 3956913
什么是DOI,文献DOI怎么找? 2169446
邀请新用户注册赠送积分活动 1187782
关于科研通互助平台的介绍 1095349