Sparse PLS discriminant analysis: biologically relevant feature selection and graphical displays for multiclass problems

可解释性 特征选择 线性判别分析 计算机科学 人工智能 选择(遗传算法) 机器学习 数据挖掘 判别式 模式识别(心理学)
作者
Kim‐Anh Lê Cao,Simon Boitard,Philippe Besse
出处
期刊:BMC Bioinformatics [BioMed Central]
卷期号:12 (1) 被引量:801
标识
DOI:10.1186/1471-2105-12-253
摘要

Variable selection on high throughput biological data, such as gene expression or single nucleotide polymorphisms (SNPs), becomes inevitable to select relevant information and, therefore, to better characterize diseases or assess genetic structure. There are different ways to perform variable selection in large data sets. Statistical tests are commonly used to identify differentially expressed features for explanatory purposes, whereas Machine Learning wrapper approaches can be used for predictive purposes. In the case of multiple highly correlated variables, another option is to use multivariate exploratory approaches to give more insight into cell biology, biological pathways or complex traits. A simple extension of a sparse PLS exploratory approach is proposed to perform variable selection in a multiclass classification framework. sPLS-DA has a classification performance similar to other wrapper or sparse discriminant analysis approaches on public microarray and SNP data sets. More importantly, sPLS-DA is clearly competitive in terms of computational efficiency and superior in terms of interpretability of the results via valuable graphical outputs. sPLS-DA is available in the R package mixOmics, which is dedicated to the analysis of large biological data sets.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
zzzzz完成签到,获得积分10
刚刚
无聊的人完成签到 ,获得积分10
3秒前
4秒前
kingwill举报研究僧求助涉嫌违规
5秒前
阿辉发布了新的文献求助10
5秒前
huihui完成签到,获得积分10
5秒前
偶然的风41177完成签到,获得积分10
8秒前
9秒前
科研通AI5应助敏感的灵萱采纳,获得10
9秒前
马小马发布了新的文献求助10
11秒前
体贴坤坤完成签到 ,获得积分10
12秒前
13秒前
骆三问发布了新的文献求助10
13秒前
潜放完成签到,获得积分10
14秒前
nancy吴完成签到 ,获得积分10
14秒前
星空舒完成签到,获得积分10
15秒前
刘波儿刘海儿留疤完成签到,获得积分10
15秒前
15秒前
淡淡从安完成签到 ,获得积分10
16秒前
17秒前
爱学习的小马完成签到,获得积分10
17秒前
bkagyin应助科研通管家采纳,获得10
18秒前
Owen应助科研通管家采纳,获得10
18秒前
orixero应助科研通管家采纳,获得10
18秒前
Jasper应助科研通管家采纳,获得10
18秒前
18秒前
18秒前
赘婿应助科研通管家采纳,获得10
18秒前
852应助科研通管家采纳,获得10
18秒前
21秒前
21秒前
DYDY完成签到 ,获得积分10
22秒前
超神完成签到,获得积分10
23秒前
阔达东蒽发布了新的文献求助10
24秒前
25秒前
meteor发布了新的文献求助10
26秒前
丘比特应助崔帅采纳,获得10
26秒前
科研通AI5应助猫和采纳,获得10
27秒前
大脸猫完成签到 ,获得积分10
27秒前
水滴完成签到,获得积分20
28秒前
高分求助中
Seven new species of the Palaearctic Lauxaniidae and Asteiidae (Diptera) 400
Where and how to use plate heat exchangers 350
Handbook of Laboratory Animal Science 300
Fundamentals of Medical Device Regulations, Fifth Edition(e-book) 300
Beginners Guide To Clinical Medicine (Pb 2020): A Systematic Guide To Clinical Medicine, Two-Vol Set 250
A method for calculating the flow in a centrifugal impeller when entropy gradients are present 240
机器学习与人工智能:从理论到实践 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3706097
求助须知:如何正确求助?哪些是违规求助? 3255274
关于积分的说明 9893949
捐赠科研通 2967616
什么是DOI,文献DOI怎么找? 1627366
邀请新用户注册赠送积分活动 771471
科研通“疑难数据库(出版商)”最低求助积分说明 743382