Precise Prediction of Promoter Strength Based on a De Novo Synthetic Promoter Library Coupled with Machine Learning

发起人 突变体 计算生物学 生物 遗传学 人工智能 数学 基因 计算机科学 基因表达
作者
Mei Zhao,Zhenqi Yuan,Longtao Wu,Shenghu Zhou,Yu Deng
出处
期刊:ACS Synthetic Biology [American Chemical Society]
卷期号:11 (1): 92-102 被引量:37
标识
DOI:10.1021/acssynbio.1c00117
摘要

Promoters are one of the most critical regulatory elements controlling metabolic pathways. However, the fast and accurate prediction of promoter strength remains challenging, leading to time- and labor-consuming promoter construction and characterization processes. This dilemma is caused by the lack of a big promoter library that has gradient strengths, broad dynamic ranges, and clear sequence profiles that can be used to train an artificial intelligence model of promoter strength prediction. To overcome this challenge, we constructed and characterized a mutant library of Trc promoters (Ptrc) using 83 rounds of mutation-construction-screening-characterization engineering cycles. After excluding invalid mutation sites, we established a synthetic promoter library that consisted of 3665 different variants, displaying an intensity range of more than two orders of magnitude. The strongest variant was ∼69-fold stronger than the original Ptrc and 1.52-fold stronger than a 1 mM isopropyl-β-d-thiogalactoside-driven PT7 promoter, with an ∼454-fold difference between the strongest and weakest expression levels. Using this synthetic promoter library, different machine learning models were built and optimized to explore the relationships between promoter sequences and transcriptional strength. Finally, our XgBoost model exhibited optimal performance, and we utilized this approach to precisely predict the strength of artificially designed promoter sequences (R2 = 0.88, mean absolute error = 0.15, and Pearson correlation coefficient = 0.94). Our work provides a powerful platform that enables the predictable tuning of promoters to achieve optimal transcriptional strength.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
石大伟完成签到 ,获得积分10
刚刚
wanci应助飘逸的威采纳,获得10
1秒前
萧水白应助skittles采纳,获得10
7秒前
7秒前
娇气的天亦完成签到,获得积分10
8秒前
小大夫完成签到 ,获得积分10
9秒前
charon完成签到 ,获得积分10
11秒前
欣喜的人龙完成签到 ,获得积分10
12秒前
飘逸的威发布了新的文献求助10
12秒前
慕青应助可靠的南霜采纳,获得10
15秒前
清净163完成签到,获得积分10
15秒前
Chemokin完成签到 ,获得积分10
16秒前
复杂觅山完成签到 ,获得积分10
18秒前
嘻哈学习完成签到,获得积分10
19秒前
碧蓝丹烟完成签到 ,获得积分10
20秒前
Coffey完成签到 ,获得积分10
20秒前
ZL完成签到,获得积分10
21秒前
贺雪完成签到,获得积分10
21秒前
Somnolence咩完成签到,获得积分10
22秒前
墩墩完成签到,获得积分10
23秒前
绿袖子完成签到,获得积分10
26秒前
Ddddd完成签到,获得积分10
29秒前
Tsuki完成签到,获得积分10
30秒前
Likz完成签到,获得积分10
31秒前
Cc完成签到,获得积分10
33秒前
荔枝完成签到 ,获得积分10
35秒前
怡然猎豹完成签到,获得积分10
36秒前
烂漫夜梅完成签到,获得积分10
36秒前
细心飞鸟完成签到 ,获得积分10
38秒前
jhxie完成签到,获得积分10
40秒前
wujinfei完成签到,获得积分10
43秒前
哒哒哒哒完成签到,获得积分10
43秒前
留胡子的丹彤完成签到 ,获得积分10
44秒前
xyzlancet完成签到,获得积分10
45秒前
花花完成签到,获得积分10
45秒前
47秒前
zhl完成签到,获得积分10
47秒前
明亮的冰颜完成签到,获得积分10
47秒前
想吃芝士焗饭完成签到 ,获得积分10
48秒前
mengmenglv完成签到 ,获得积分0
48秒前
高分求助中
Sustainability in Tides Chemistry 2800
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
Rechtsphilosophie 1000
Bayesian Models of Cognition:Reverse Engineering the Mind 888
Defense against predation 800
Very-high-order BVD Schemes Using β-variable THINC Method 568
Chen Hansheng: China’s Last Romantic Revolutionary 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3137067
求助须知:如何正确求助?哪些是违规求助? 2788032
关于积分的说明 7784385
捐赠科研通 2444102
什么是DOI,文献DOI怎么找? 1299733
科研通“疑难数据库(出版商)”最低求助积分说明 625552
版权声明 601010