Modeling 0.6 million genes for the rational design of functional cis -regulatory variants and de novo design of cis- regulatory sequences

基因 计算生物学 调节顺序 生物 生物信息学 遗传学 单核苷酸多态性 基因表达调控 基因型
作者
T. H. Li,Hui Xu,Shouzhen Teng,Mingrui Suo,Revocatus Bahitwa,Mingchi Xu,Yiheng Qian,Guillaume P. Ramstein,Baoxing Song,Edward S. Buckler,Hai Wang
出处
期刊:Proceedings of the National Academy of Sciences of the United States of America [Proceedings of the National Academy of Sciences]
卷期号:121 (26) 被引量:1
标识
DOI:10.1073/pnas.2319811121
摘要

Rational design of plant cis -regulatory DNA sequences without expert intervention or prior domain knowledge is still a daunting task. Here, we developed PhytoExpr, a deep learning framework capable of predicting both mRNA abundance and plant species using the proximal regulatory sequence as the sole input. PhytoExpr was trained over 17 species representative of major clades of the plant kingdom to enhance its generalizability. Via input perturbation, quantitative functional annotation of the input sequence was achieved at single-nucleotide resolution, revealing an abundance of predicted high-impact nucleotides in conserved noncoding sequences and transcription factor binding sites. Evaluation of maize HapMap3 single-nucleotide polymorphisms (SNPs) by PhytoExpr demonstrates an enrichment of predicted high-impact SNPs in cis -eQTL. Additionally, we provided two algorithms that harnessed the power of PhytoExpr in designing functional cis -regulatory variants, and de novo creation of species-specific cis -regulatory sequences through in silico evolution of random DNA sequences. Our model represents a general and robust approach for functional variant discovery in population genetics and rational design of regulatory sequences for genome editing and synthetic biology.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
虾502完成签到 ,获得积分10
3秒前
啊哈啊哈额完成签到,获得积分10
3秒前
老年发布了新的文献求助150
5秒前
LiLi完成签到 ,获得积分10
5秒前
量子星尘发布了新的文献求助10
6秒前
xczhu完成签到,获得积分0
7秒前
忆韶完成签到,获得积分10
9秒前
健忘的晓小完成签到 ,获得积分10
9秒前
10秒前
13秒前
时间有泪1212完成签到 ,获得积分20
14秒前
骄傲完成签到 ,获得积分10
18秒前
葡萄小伊ovo完成签到 ,获得积分10
18秒前
量子星尘发布了新的文献求助10
19秒前
一行白鹭上青天完成签到 ,获得积分10
20秒前
花花糖果完成签到 ,获得积分10
22秒前
耍酷的指甲油完成签到 ,获得积分10
25秒前
煌大河完成签到 ,获得积分10
27秒前
寒冷的匪完成签到 ,获得积分20
27秒前
朱婷完成签到 ,获得积分10
28秒前
Brave发布了新的文献求助100
30秒前
32秒前
鲤鱼灵阳完成签到,获得积分10
34秒前
caspar发布了新的文献求助10
37秒前
ymr完成签到 ,获得积分10
39秒前
i2stay完成签到,获得积分10
42秒前
量子星尘发布了新的文献求助10
43秒前
yk完成签到 ,获得积分10
46秒前
爱上学的小金完成签到 ,获得积分10
46秒前
化学兔八哥完成签到,获得积分10
50秒前
王佳豪完成签到,获得积分10
56秒前
Market123580完成签到 ,获得积分10
58秒前
llhh2024完成签到,获得积分10
58秒前
1分钟前
巫马尔槐完成签到,获得积分10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
Yang22完成签到,获得积分10
1分钟前
雨城完成签到 ,获得积分10
1分钟前
caspar完成签到,获得积分10
1分钟前
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Basic And Clinical Science Course 2025-2026 3000
人脑智能与人工智能 1000
花の香りの秘密―遺伝子情報から機能性まで 800
Terminologia Embryologica 500
Process Plant Design for Chemical Engineers 400
Principles of Plasma Discharges and Materials Processing, 3rd Edition 400
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5612076
求助须知:如何正确求助?哪些是违规求助? 4696188
关于积分的说明 14890605
捐赠科研通 4731524
什么是DOI,文献DOI怎么找? 2546126
邀请新用户注册赠送积分活动 1510434
关于科研通互助平台的介绍 1473314