GNPI: Graph normalization to integrate phylogenetic information for metagenomic host phenotype prediction

基因组 系统发育树 规范化(社会学) 机器学习 人工智能 计算机科学 寄主(生物学) 支持向量机 随机森林 图形 计算生物学 数据挖掘 生物 基因 理论计算机科学 遗传学 社会学 人类学
作者
Bojing Li,Duo Zhong,Jimei Qiao,Xingpeng Jiang
出处
期刊:Methods [Elsevier]
卷期号:205: 11-17 被引量:1
标识
DOI:10.1016/j.ymeth.2022.05.007
摘要

Microorganisms play important roles in our lives especially on metabolism and diseases. Determining the probability of human suffering from specific diseases and the severity of the disease based on microbial genes is the crucial research for understanding the relationship between microbes and diseases. Previous could extract the topological information of phylogenetic trees and integrate them to metagenomic datasets, thus enable classifiers to learn more information in limited datasets and thus improve the performance of the models. In this paper, we proposed a GNPI model to better learn the structure of phylogenetic trees. GNPI maintained the original vector format of metagenomic datasets, while previous research had to change the input form to matrices. The vector-like form of the input data can be easily adopted in the baseline machine learning models and is available for deep learning models. The datasets processed with GNPI help enhance the accuracy of machine learning and deep learning models in three different datasets. GNPI is an interpretable data processing method for host phenotype prediction and other bioinformatics tasks.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
LYL发布了新的文献求助10
1秒前
ver发布了新的文献求助10
1秒前
1秒前
动听的乐驹完成签到,获得积分10
2秒前
eric888应助叮叮当当采纳,获得100
2秒前
苏大大发布了新的文献求助10
3秒前
Advance.Cheng完成签到,获得积分10
4秒前
是的完成签到,获得积分20
4秒前
sunyue完成签到,获得积分10
4秒前
程CC完成签到 ,获得积分10
4秒前
5秒前
小二郎应助紫心采纳,获得10
5秒前
HHHHH发布了新的文献求助10
5秒前
6秒前
析木发布了新的文献求助20
6秒前
龙慧琳发布了新的文献求助10
8秒前
Hello应助百里幻竹采纳,获得10
9秒前
ll完成签到,获得积分10
9秒前
33完成签到 ,获得积分10
9秒前
乐乐应助Smithjiang采纳,获得10
9秒前
keyangou087完成签到,获得积分10
10秒前
10秒前
乐乐应助蓝桉采纳,获得10
11秒前
yuyuli发布了新的文献求助10
11秒前
12秒前
xyh完成签到,获得积分20
12秒前
伊尔暗色发布了新的文献求助10
12秒前
赘婿应助花海采纳,获得10
12秒前
12秒前
个性浩然完成签到,获得积分10
13秒前
lionel完成签到,获得积分10
13秒前
13秒前
13秒前
14秒前
15秒前
15秒前
15秒前
淡定碧玉完成签到,获得积分10
16秒前
沉静的怜蕾完成签到,获得积分10
16秒前
17秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Modern Epidemiology, Fourth Edition 5000
Digital Twins of Advanced Materials Processing 2000
Weaponeering, Fourth Edition – Two Volume SET 2000
Polymorphism and polytypism in crystals 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6024034
求助须知:如何正确求助?哪些是违规求助? 7654213
关于积分的说明 16174960
捐赠科研通 5172479
什么是DOI,文献DOI怎么找? 2767567
邀请新用户注册赠送积分活动 1751010
关于科研通互助平台的介绍 1637377