亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

A 5' UTR Language Model for Decoding Untranslated Regions of mRNA and Function Predictions

非翻译区 翻译(生物学) 五素未翻译区 信使核糖核酸 三素数非翻译区 解码方法 计算生物学 核糖体 计算机科学 蛋白质生物合成 水准点(测量) 功能(生物学) 生物 遗传学 算法 基因 核糖核酸 地理 大地测量学
作者
Yanyi Chu,Dan Yu,Yupeng Li,Kaixuan Huang,Yue Shen,Le Cong,Jason Zhang,Mengdi Wang
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2310.03281
摘要

The 5' UTR, a regulatory region at the beginning of an mRNA molecule, plays a crucial role in regulating the translation process and impacts the protein expression level. Language models have showcased their effectiveness in decoding the functions of protein and genome sequences. Here, we introduced a language model for 5' UTR, which we refer to as the UTR-LM. The UTR-LM is pre-trained on endogenous 5' UTRs from multiple species and is further augmented with supervised information including secondary structure and minimum free energy. We fine-tuned the UTR-LM in a variety of downstream tasks. The model outperformed the best-known benchmark by up to 42% for predicting the Mean Ribosome Loading, and by up to 60% for predicting the Translation Efficiency and the mRNA Expression Level. The model also applies to identifying unannotated Internal Ribosome Entry Sites within the untranslated region and improves the AUPR from 0.37 to 0.52 compared to the best baseline. Further, we designed a library of 211 novel 5' UTRs with high predicted values of translation efficiency and evaluated them via a wet-lab assay. Experiment results confirmed that our top designs achieved a 32.5% increase in protein production level relative to well-established 5' UTR optimized for therapeutics.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
djdh完成签到 ,获得积分10
20秒前
领导范儿应助伊可创采纳,获得10
1分钟前
打打应助jimmylafs采纳,获得10
1分钟前
伊可创完成签到,获得积分20
1分钟前
simitundeins应助科研通管家采纳,获得50
1分钟前
1分钟前
陶醉紫青发布了新的文献求助10
1分钟前
Demi_Ming完成签到,获得积分10
1分钟前
qx完成签到,获得积分10
1分钟前
Saven发布了新的文献求助10
2分钟前
3分钟前
3分钟前
加菲丰丰完成签到,获得积分0
3分钟前
Saven发布了新的文献求助10
3分钟前
Saven完成签到,获得积分10
3分钟前
yuzh完成签到 ,获得积分10
4分钟前
bkagyin应助斯文墨镜采纳,获得10
4分钟前
小白菜完成签到,获得积分10
4分钟前
4分钟前
liudy发布了新的文献求助30
4分钟前
斯文墨镜发布了新的文献求助10
4分钟前
Sunnpy完成签到 ,获得积分10
5分钟前
充电宝应助科研通管家采纳,获得10
5分钟前
5分钟前
JamesPei应助斯文墨镜采纳,获得10
5分钟前
6分钟前
6分钟前
123456发布了新的文献求助10
6分钟前
Kevin完成签到,获得积分10
6分钟前
...完成签到,获得积分10
7分钟前
さくま完成签到,获得积分10
7分钟前
手术刀完成签到 ,获得积分10
8分钟前
竹子完成签到,获得积分10
8分钟前
周周南完成签到 ,获得积分10
8分钟前
8分钟前
8分钟前
灰灰发布了新的文献求助10
8分钟前
9分钟前
9分钟前
英姑应助SDNUDRUG采纳,获得10
10分钟前
高分求助中
Continuum Thermodynamics and Material Modelling 4000
Production Logging: Theoretical and Interpretive Elements 2700
Ensartinib (Ensacove) for Non-Small Cell Lung Cancer 1000
Les Mantodea de Guyane Insecta, Polyneoptera 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
El viaje de una vida: Memorias de María Lecea 800
Luis Lacasa - Sobre esto y aquello 700
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3521536
求助须知:如何正确求助?哪些是违规求助? 3102893
关于积分的说明 9261754
捐赠科研通 2799034
什么是DOI,文献DOI怎么找? 1536357
邀请新用户注册赠送积分活动 714778
科研通“疑难数据库(出版商)”最低求助积分说明 708462