已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

KD-KLNMF: Identification of lncRNAs subcellular localization with multiple features and nonnegative matrix factorization

非负矩阵分解 亚细胞定位 鉴定(生物学) 刀切重采样 编码 源代码 矩阵分解 分类器(UML) 特征向量 计算生物学 支持向量机 计算机科学 人工智能 模式识别(心理学) 生物 数学 物理 遗传学 基因 植物 操作系统 细胞质 估计员 统计 特征向量 量子力学
作者
Shengli Zhang,Huijuan Qiao
出处
期刊:Analytical Biochemistry [Elsevier BV]
卷期号:610: 113995-113995 被引量:18
标识
DOI:10.1016/j.ab.2020.113995
摘要

Long non-coding RNAs (lncRNAs) refer to functional RNA molecules with a length more than 200 nucleotides and have minimal or no function to encode proteins. In recent years, more studies show that lncRNAs subcellular localization has valuable clues for their biological functions. So it is count for much to identify lncRNAs subcellular localization. In this paper, a novel statistical model named KD-KLNMF is constructed to predict lncRNAs subcellular localization. Firstly, k-mer and dinucleotide-based spatial autocorrelation are incorporated as the feature vector. Then, Synthetic Minority Over-sampling Technique is used to deal with the imbalance dataset. Next, Kullback-Leibler divergence-based nonnegative matrix factorization is applied to select optimal features. And then we utilize support vector machine as the classifier after comparing with other classifiers. Finally, the jackknife test is performed to evaluate the model. The overall accuracies reach 97.24% and 92.86% on training dataset and independent dataset, respectively. The results are better than the previous methods, which indicate that our model will be a useful and feasible tool to identify lncRNAs subcellular localization. The datasets and source code are freely available at https://github.com/HuijuanQiao/KD-KLNMF.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
xiaolei完成签到 ,获得积分10
1秒前
YSWZSS完成签到 ,获得积分10
1秒前
科研通AI6.3应助二十七垚采纳,获得10
1秒前
5秒前
orixero应助猫猫猫猫采纳,获得10
5秒前
一只科研旺完成签到,获得积分10
6秒前
空空发布了新的文献求助10
7秒前
小蘑菇应助Lina采纳,获得10
8秒前
Jieko应助Keats采纳,获得30
8秒前
bjyx完成签到 ,获得积分10
8秒前
英俊的铭应助橙汁采纳,获得10
9秒前
好心秦发布了新的文献求助10
10秒前
12秒前
12秒前
13秒前
叶黄戍发布了新的文献求助10
15秒前
17秒前
哈牛发布了新的文献求助10
17秒前
猫猫猫猫发布了新的文献求助10
19秒前
叶黄戍完成签到,获得积分10
20秒前
脆脆鲨发布了新的文献求助10
20秒前
在水一方应助车牙王采纳,获得10
20秒前
初一完成签到 ,获得积分10
21秒前
火的信仰完成签到 ,获得积分10
21秒前
22秒前
ding应助好心秦采纳,获得10
22秒前
一屿完成签到,获得积分10
23秒前
23秒前
molihuakai应助tq采纳,获得30
23秒前
30秒前
NexusExplorer应助AX采纳,获得10
31秒前
tq完成签到,获得积分20
32秒前
科研通AI6.3应助竹墨采纳,获得10
32秒前
深情安青应助科研通管家采纳,获得30
34秒前
小蘑菇应助科研通管家采纳,获得10
34秒前
上官若男应助科研通管家采纳,获得10
34秒前
wanci应助科研通管家采纳,获得10
34秒前
在水一方应助科研通管家采纳,获得10
34秒前
Lucas应助科研通管家采纳,获得10
34秒前
34秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Quality by Design - An Indispensable Approach to Accelerate Biopharmaceutical Product Development 800
Pulse width control of a 3-phase inverter with non sinusoidal phase voltages 777
Signals, Systems, and Signal Processing 610
Research Methods for Applied Linguistics: A Practical Guide 600
Research Methods for Applied Linguistics 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6404116
求助须知:如何正确求助?哪些是违规求助? 8223361
关于积分的说明 17428820
捐赠科研通 5456467
什么是DOI,文献DOI怎么找? 2883501
邀请新用户注册赠送积分活动 1859814
关于科研通互助平台的介绍 1701219