A Pearson’s correlation coefficient based decision tree and its parallel implementation

皮尔逊积矩相关系数 相关系数 决策树 相关性 相关比 计算机科学 距离相关 统计 数学 数据挖掘 随机变量 几何学
作者
Yashuang Mu,Xiaodong Liu,Lidong Wang
出处
期刊:Information Sciences [Elsevier]
卷期号:435: 40-58 被引量:251
标识
DOI:10.1016/j.ins.2017.12.059
摘要

In this paper, a Pearson’s correlation coefficient based decision tree (PCC-Tree) is established and its parallel implementation is developed in the framework of Map-Reduce (MR-PCC-Tree). The proposed methods employ Pearson’s correlation coefficient as a new measure of feature quality to confirm the optimal splitting attributes and splitting points in the growth of decision trees. Besides, the proposed MR-PCC-Tree adopts Map-Reduce technology to every component during the decision trees learning process for parallel computing, which mainly consists of a parallel Pearson’s correlation coefficient based splitting rule and a parallel splitting data method. The experimental analysis is conducted on a series of UCI benchmark data sets with different scales. In contrast to several traditional decision tree classifiers including BFT, C4.5, LAD, SC and NBT on 17 data sets, the proposed PCC-Tree is no worse than the traditional models as a whole. Furthermore, the experimental results on other 8 data sets show the feasibility of the proposed MR-PCC-Tree and its good parallel performance on reducing computational time for large-scale data classification problems.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
8D完成签到,获得积分10
16秒前
萨格完成签到 ,获得积分10
19秒前
山山而川完成签到 ,获得积分10
20秒前
gnr2000完成签到,获得积分0
30秒前
tzy6665完成签到,获得积分10
31秒前
Tina完成签到 ,获得积分10
36秒前
simon完成签到 ,获得积分10
39秒前
111完成签到 ,获得积分10
40秒前
阿甘完成签到,获得积分10
41秒前
radio完成签到 ,获得积分10
43秒前
ii完成签到 ,获得积分10
45秒前
feimengxia完成签到 ,获得积分10
55秒前
albertxin完成签到,获得积分10
56秒前
cc2001完成签到,获得积分10
1分钟前
杨tong完成签到 ,获得积分10
1分钟前
念初完成签到 ,获得积分10
1分钟前
小朱完成签到 ,获得积分10
1分钟前
课呢完成签到,获得积分10
1分钟前
55555发布了新的文献求助30
1分钟前
Gang完成签到,获得积分10
1分钟前
蚂蚁踢大象完成签到 ,获得积分10
1分钟前
Raymond完成签到,获得积分10
1分钟前
chowjb完成签到,获得积分10
1分钟前
i2stay完成签到,获得积分10
1分钟前
summer完成签到 ,获得积分10
1分钟前
wangsai0532完成签到,获得积分10
1分钟前
2分钟前
简易完成签到,获得积分10
2分钟前
别忘了吃胶囊完成签到,获得积分10
2分钟前
科研野狗完成签到 ,获得积分10
2分钟前
zhilianghui0807完成签到 ,获得积分10
2分钟前
lilylwy完成签到 ,获得积分0
2分钟前
泡泡茶壶o完成签到 ,获得积分10
2分钟前
花开四海完成签到 ,获得积分10
2分钟前
yinhe完成签到 ,获得积分10
2分钟前
安青梅完成签到 ,获得积分10
2分钟前
swordshine完成签到,获得积分10
2分钟前
怡然远望完成签到 ,获得积分10
3分钟前
CipherSage应助55555采纳,获得30
3分钟前
流浪完成签到 ,获得积分10
3分钟前
高分求助中
Effect of reactor temperature on FCC yield 2000
Production Logging: Theoretical and Interpretive Elements 1500
Very-high-order BVD Schemes Using β-variable THINC Method 1000
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 800
Uncertainty Quantification: Theory, Implementation, and Applications, Second Edition 800
錢鍾書楊絳親友書札 600
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3288478
求助须知:如何正确求助?哪些是违规求助? 2925860
关于积分的说明 8423505
捐赠科研通 2596904
什么是DOI,文献DOI怎么找? 1416747
科研通“疑难数据库(出版商)”最低求助积分说明 659488
邀请新用户注册赠送积分活动 641878