MF-GARF: Hybridizing Multiple Filters and GA Wrapper for Feature Selection of Microarray Cancer Datasets

随机森林 特征选择 计算机科学 冗余(工程) 水准点(测量) 数据挖掘 块(置换群论) 维数之咒 人工智能 特征提取 特征(语言学) 模式识别(心理学) 数学 哲学 地理 几何学 操作系统 语言学 大地测量学
作者
Pakizah Saqib,Usman Qamar,Reda Ayesha Khan,Andleeb Aslam
标识
DOI:10.23919/icact48636.2020.9061234
摘要

DNA Microarray technology is a valuable advancement in medical field but it gives birth to many challenges like curse of dimensionality, storage and computational requirements. In this paper we have proposed, a multiple filters and GA wrapper based hybrid approach (MF-GARF) that incorporates Random forest as fitness evaluator of features. The proposed hybrid approach MF-GARF is comprised of three phases relevancy block; containing information theory based filters Information Gain, Gain Ratio and Gini Index, responsible for ensuring relevancy and removal of irrelevant and noisy features. Second phase is Redundancy block; incorporating Pearson Correlation statistics to remove redundancy among features, and then final phase Optimization Block; containing Genetic Algorithm wrapper with Random Forest as fitness evaluator, responsible for generating an optimal feature subset with high predictive power. Random Forest with 10-fold cross validation is used to calculate the classification accuracy of selected feature subset. Experiments are carried out on 7 publically available benchmark Microarray cancer datasets and the proposed algorithm has achieved good accuracy with minimal selected features for all datasets. The comparison with other state of the art hybrid techniques validates the effectiveness of our proposed approach.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
打工仔完成签到 ,获得积分10
刚刚
醋溜爆肚儿完成签到,获得积分10
1秒前
hobowei完成签到 ,获得积分10
1秒前
领导范儿应助缓慢珠采纳,获得10
1秒前
顾以安发布了新的文献求助10
2秒前
Lucas应助萧水白采纳,获得100
3秒前
希望天下0贩的0应助夏夏采纳,获得10
3秒前
3秒前
NOIR4LU完成签到,获得积分10
4秒前
阎林发布了新的文献求助10
4秒前
耍酷高丽完成签到,获得积分10
4秒前
zsh完成签到 ,获得积分10
5秒前
5秒前
super chan发布了新的文献求助10
5秒前
又柔发布了新的文献求助20
5秒前
5秒前
7秒前
111完成签到,获得积分20
7秒前
共享精神应助Jello采纳,获得10
7秒前
小夜完成签到,获得积分10
8秒前
111111111完成签到,获得积分10
9秒前
9秒前
朱朱子完成签到,获得积分10
9秒前
共享精神应助red采纳,获得10
9秒前
那个笨笨发布了新的文献求助10
9秒前
bulet发布了新的文献求助10
9秒前
畅快山兰发布了新的文献求助10
10秒前
10秒前
怕黑行恶完成签到,获得积分10
10秒前
灿灿陈发布了新的文献求助80
11秒前
13秒前
13秒前
Mark_He发布了新的文献求助10
14秒前
试图每天开朗但是有点累的笨笨完成签到,获得积分10
14秒前
xs发布了新的文献求助10
15秒前
顾以安完成签到 ,获得积分10
15秒前
淡淡仙人掌完成签到 ,获得积分10
16秒前
AXXXin应助听雨采纳,获得10
18秒前
18秒前
wyz发布了新的文献求助10
19秒前
高分求助中
Licensing Deals in Pharmaceuticals 2019-2024 3000
Effect of reactor temperature on FCC yield 2000
Production Logging: Theoretical and Interpretive Elements 1500
Very-high-order BVD Schemes Using β-variable THINC Method 1000
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 800
錢鍾書楊絳親友書札 600
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3289014
求助须知:如何正确求助?哪些是违规求助? 2926184
关于积分的说明 8426015
捐赠科研通 2597274
什么是DOI,文献DOI怎么找? 1417165
科研通“疑难数据库(出版商)”最低求助积分说明 659597
邀请新用户注册赠送积分活动 642019