亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

RiNALMo: General-Purpose RNA Language Models Can Generalize Well on Structure Prediction Tasks

计算机科学 人工智能 自然语言处理 计算生物学 生物
作者
Rafael Josip Penić,Tin Vlašić,Roland G. Huber,Yue Wan,Mile Šikić
出处
期刊:Cornell University - arXiv 被引量:2
标识
DOI:10.48550/arxiv.2403.00043
摘要

Ribonucleic acid (RNA) plays a variety of crucial roles in fundamental biological processes. Recently, RNA has become an interesting drug target, emphasizing the need to improve our understanding of its structures and functions. Over the years, sequencing technologies have produced an enormous amount of unlabeled RNA data, which hides important knowledge and potential. Motivated by the successes of protein language models, we introduce RiboNucleic Acid Language Model (RiNALMo) to help unveil the hidden code of RNA. RiNALMo is the largest RNA language model to date with $650$ million parameters pre-trained on $36$ million non-coding RNA sequences from several available databases. RiNALMo is able to extract hidden knowledge and capture the underlying structure information implicitly embedded within the RNA sequences. RiNALMo achieves state-of-the-art results on several downstream tasks. Notably, we show that its generalization capabilities can overcome the inability of other deep learning methods for secondary structure prediction to generalize on unseen RNA families. The code has been made publicly available on https://github.com/lbcb-sci/RiNALMo.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
陈坤完成签到,获得积分10
5秒前
8秒前
12秒前
22秒前
susu_完成签到,获得积分10
23秒前
25秒前
宁不正发布了新的文献求助10
31秒前
37秒前
喜悦寒凝完成签到,获得积分10
38秒前
选波发布了新的文献求助10
42秒前
xaopng完成签到,获得积分10
45秒前
47秒前
Lucas应助陈玺丞采纳,获得10
53秒前
55秒前
我是老大应助huang采纳,获得10
1分钟前
1分钟前
圈圈圆了完成签到,获得积分10
1分钟前
huang发布了新的文献求助10
1分钟前
纸鹤发布了新的文献求助10
1分钟前
wanci应助圈圈圆了采纳,获得50
1分钟前
1分钟前
坚定的小蘑菇完成签到 ,获得积分10
1分钟前
hh完成签到,获得积分10
1分钟前
大模型应助选波采纳,获得10
1分钟前
huang完成签到,获得积分10
1分钟前
小湛完成签到 ,获得积分10
1分钟前
JamesPei应助纸鹤采纳,获得10
1分钟前
2分钟前
2分钟前
纸鹤发布了新的文献求助10
2分钟前
选波发布了新的文献求助10
2分钟前
2分钟前
由道罡完成签到 ,获得积分10
2分钟前
失眠的惮发布了新的文献求助10
2分钟前
CodeCraft应助水水水采纳,获得10
2分钟前
kekao发布了新的文献求助10
2分钟前
上官若男应助Hayward采纳,获得10
2分钟前
香蕉觅云应助选波采纳,获得10
2分钟前
2分钟前
2分钟前
高分求助中
From Victimization to Aggression 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Reproduction Third Edition 3000
Comprehensive Methanol Science Production, Applications, and Emerging Technologies 2000
化妆品原料学 1000
1st Edition Sports Rehabilitation and Training Multidisciplinary Perspectives By Richard Moss, Adam Gledhill 600
小学科学课程与教学 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5644645
求助须知:如何正确求助?哪些是违规求助? 4764877
关于积分的说明 15025423
捐赠科研通 4803014
什么是DOI,文献DOI怎么找? 2567817
邀请新用户注册赠送积分活动 1525416
关于科研通互助平台的介绍 1484958