Comparison of the Strengths and Weaknesses of Machine Learning Algorithms and Feature Selection on KEGG Database Microbial Gene Pathway Annotation and Its Effects on Reconstructed Network Topology

小桶 注释 聚类分析 人工智能 机器学习 计算机科学 基因注释 人类微生物组计划 生物 基因 基因组 计算生物学 基因组 遗传学 基因表达 转录组
作者
Michael Robben,Mohammad Sadegh Nasr,Avishek Das,Jai Prakash Veerla,Manfred Huber,Justyn Jaworski,Jon A. Weidanz,Jacob M. Luber
出处
期刊:Journal of Computational Biology [Mary Ann Liebert]
卷期号:30 (7): 766-782
标识
DOI:10.1089/cmb.2022.0370
摘要

The development of tools for the annotation of genes from newly sequenced species has not evolved much from homologous alignment to prior annotated species. While the quality of gene annotations continues to decline as we sequence and assemble more evolutionary distant gut microbiome species, machine learning presents a high quality alternative to traditional techniques. In this study, we investigate the relative performance of common classical and nonclassical machine learning algorithms in the problem of gene annotation using human microbiome-associated species genes from the KEGG database. The majority of the ensemble, clustering, and deep learning algorithms that we investigated showed higher prediction accuracy than CD-Hit in predicting partial KEGG function. Motif-based, machine-learning methods of annotation in new species were faster and had higher precision–recall than methods of homologous alignment or orthologous gene clustering. Gradient boosted ensemble methods and neural networks also predicted higher connectivity in reconstructed KEGG pathways, finding twice as many new pathway interactions than blast alignment. The use of motif-based, machine-learning algorithms in annotation software will allow researchers to develop powerful tools to interact with bacterial microbiomes in ways previously unachievable through homologous sequence alignment alone.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Cheney完成签到 ,获得积分10
1秒前
研友_O8Wz4Z完成签到,获得积分10
1秒前
zhaoyaoshi完成签到 ,获得积分10
2秒前
2秒前
joycelin完成签到,获得积分10
7秒前
虚幻代桃发布了新的文献求助10
8秒前
9秒前
pp1230完成签到,获得积分10
14秒前
是菜狗子啊完成签到,获得积分10
15秒前
afar完成签到 ,获得积分10
17秒前
slp完成签到 ,获得积分10
20秒前
竹焚完成签到 ,获得积分10
21秒前
豆沙包小团子完成签到 ,获得积分10
22秒前
魔幻千秋完成签到,获得积分0
23秒前
cici妈发布了新的文献求助10
23秒前
一心完成签到,获得积分10
25秒前
细心的代天完成签到 ,获得积分20
28秒前
mm完成签到,获得积分10
28秒前
ljssll完成签到 ,获得积分10
34秒前
simpleblue完成签到 ,获得积分10
36秒前
英俊的铭应助苹果采纳,获得10
36秒前
讲道理的卡卡完成签到 ,获得积分10
39秒前
喜静完成签到 ,获得积分10
43秒前
bi8bo完成签到 ,获得积分10
43秒前
basket完成签到 ,获得积分10
44秒前
小二郎应助朱奕韬采纳,获得10
45秒前
行者+完成签到,获得积分10
45秒前
Beyond095完成签到,获得积分10
49秒前
kytlnj完成签到 ,获得积分0
49秒前
51秒前
EarlyBird完成签到,获得积分10
53秒前
芝麻完成签到,获得积分10
53秒前
keke发布了新的文献求助10
56秒前
危机完成签到 ,获得积分10
57秒前
57秒前
58秒前
大乐完成签到 ,获得积分10
1分钟前
颜陌发布了新的文献求助10
1分钟前
wz完成签到,获得积分10
1分钟前
落寞溪灵完成签到 ,获得积分10
1分钟前
高分求助中
Evolution 10000
Sustainability in Tides Chemistry 2800
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
叶剑英与华南分局档案史料 500
Foreign Policy of the French Second Empire: A Bibliography 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3146916
求助须知:如何正确求助?哪些是违规求助? 2798176
关于积分的说明 7826814
捐赠科研通 2454724
什么是DOI,文献DOI怎么找? 1306446
科研通“疑难数据库(出版商)”最低求助积分说明 627788
版权声明 601565