The super-n-motifs model: a novel alignment-free approach for representing and comparing RNA secondary structures

假结 蛋白质二级结构 计算机科学 邻接表 结构母题 核酸二级结构 核糖核酸 代表(政治) 理论计算机科学 算法 计算生物学 生物 政治 基因 生物化学 政治学 法学
作者
Jean-Pierre Séhi Glouzon,Jean-Pierre Perreault,Shengrui Wang
出处
期刊:Bioinformatics [Oxford University Press]
卷期号:: btw773-btw773 被引量:5
标识
DOI:10.1093/bioinformatics/btw773
摘要

Comparing ribonucleic acid (RNA) secondary structures of arbitrary size uncovers structural patterns that can provide a better understanding of RNA functions. However, performing fast and accurate secondary structure comparisons is challenging when we take into account the RNA configuration (i.e. linear or circular), the presence of pseudoknot and G-quadruplex (G4) motifs and the increasing number of secondary structures generated by high-throughput probing techniques. To address this challenge, we propose the super-n-motifs model based on a latent analysis of enhanced motifs comprising not only basic motifs but also adjacency relations. The super-n-motifs model computes a vector representation of secondary structures as linear combinations of these motifs.We demonstrate the accuracy of our model for comparison of secondary structures from linear and circular RNA while also considering pseudoknot and G4 motifs. We show that the super-n-motifs representation effectively captures the most important structural features of secondary structures, as compared to other representations such as ordered tree, arc-annotated and string representations. Finally, we demonstrate the time efficiency of our model, which is alignment free and capable of performing large-scale comparisons of 10 000 secondary structures with an efficiency up to 4 orders of magnitude faster than existing approaches.The super-n-motifs model was implemented in C ++. Source code and Linux binary are freely available at http://jpsglouzon.github.io/supernmotifs/ .Shengrui.Wang@Usherbrooke.ca.Supplementary data are available at Bioinformatics o nline.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
无私的丹完成签到,获得积分10
2秒前
3秒前
王子倩完成签到 ,获得积分10
3秒前
魔幻友菱完成签到 ,获得积分10
3秒前
Katyusha完成签到 ,获得积分10
4秒前
派出所110完成签到 ,获得积分10
5秒前
An慧完成签到,获得积分10
6秒前
宗剑完成签到,获得积分10
6秒前
sxl完成签到,获得积分10
8秒前
乐乐应助饼饼采纳,获得10
9秒前
听话的箴完成签到,获得积分10
11秒前
健壮洋葱完成签到 ,获得积分10
12秒前
余如龙完成签到,获得积分10
12秒前
KX2024完成签到,获得积分10
12秒前
wave完成签到,获得积分10
13秒前
ilihe应助卓向梦采纳,获得10
15秒前
carly完成签到 ,获得积分10
16秒前
阿蓉啊完成签到 ,获得积分10
16秒前
19秒前
20秒前
众行绘研完成签到 ,获得积分10
21秒前
流星完成签到,获得积分10
21秒前
22秒前
成功的强完成签到,获得积分10
23秒前
道爷发布了新的文献求助10
24秒前
爱笑半雪完成签到,获得积分10
24秒前
勤劳太阳完成签到,获得积分10
24秒前
梦梦完成签到 ,获得积分10
24秒前
emma发布了新的文献求助10
26秒前
26秒前
耶耶完成签到 ,获得积分10
27秒前
ff999完成签到,获得积分10
28秒前
31秒前
transition完成签到,获得积分10
32秒前
顺利大地发布了新的文献求助10
33秒前
33秒前
精明寒松发布了新的文献求助10
34秒前
无语的孤丹完成签到,获得积分10
34秒前
寄语明月完成签到,获得积分10
35秒前
道爷完成签到,获得积分10
35秒前
高分求助中
Clinical Epidemiology: The Essentials, 6e 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Graphene Handbook (2019 Edition) 800
Adhesion Science: Principles & Practice 800
Signals, Systems, and Signal Processing 610
Fundamentals of Pharmaceutical and Biologics Regulations: A Global Perspective, Second Edition 600
久松真一著作集〈第5巻〉禅と芸術 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6554899
求助须知:如何正确求助?哪些是违规求助? 8339335
关于积分的说明 17865415
捐赠科研通 5672111
什么是DOI,文献DOI怎么找? 2940121
邀请新用户注册赠送积分活动 1915984
关于科研通互助平台的介绍 1785755