A hybrid random forest to predict soccer matches in international tournaments

随机森林 协变量 排名(信息检索) 计算机科学 泊松分布 随机效应模型 泊松回归 统计 预测能力 锦标赛 可能性 数据集 集合(抽象数据类型) 计量经济学 机器学习 数据挖掘 数学 人工智能 逻辑回归 医学 人口 哲学 荟萃分析 人口学 认识论 组合数学 社会学 内科学 程序设计语言
作者
Andreas Groll,Christophe Ley,Gunther Schauberger,Hans Van Eetvelde
出处
期刊:Journal of Quantitative Analysis in Sports [De Gruyter]
卷期号:15 (4): 271-287 被引量:40
标识
DOI:10.1515/jqas-2018-0060
摘要

Abstract In this work, we propose a new hybrid modeling approach for the scores of international soccer matches which combines random forests with Poisson ranking methods . While the random forest is based on the competing teams’ covariate information, the latter method estimates ability parameters on historical match data that adequately reflect the current strength of the teams. We compare the new hybrid random forest model to its separate building blocks as well as to conventional Poisson regression models with regard to their predictive performance on all matches from the four FIFA World Cups 2002–2014. It turns out that by combining the random forest with the team ability parameters from the ranking methods as an additional covariate the predictive power can be improved substantially. Finally, the hybrid random forest is used (in advance of the tournament) to predict the FIFA World Cup 2018. To complete our analysis on the previous World Cup data, the corresponding 64 matches serve as an independent validation data set and we are able to confirm the compelling predictive potential of the hybrid random forest which clearly outperforms all other methods including the betting odds.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
2秒前
赵赵完成签到 ,获得积分10
2秒前
Sandjames1889完成签到,获得积分10
2秒前
某某完成签到 ,获得积分10
3秒前
摸鱼帝王发布了新的文献求助10
4秒前
聪慧的碧空完成签到 ,获得积分10
5秒前
小鱼儿完成签到,获得积分10
5秒前
宣登仕完成签到,获得积分10
6秒前
金子悠月完成签到,获得积分10
6秒前
7秒前
11完成签到 ,获得积分10
8秒前
白k完成签到,获得积分10
10秒前
徐梓睿发布了新的文献求助10
10秒前
当冬夜渐暖完成签到,获得积分10
11秒前
一只小羊完成签到 ,获得积分10
12秒前
害怕的鞯发布了新的文献求助10
13秒前
干净的琦应助荔枝采纳,获得10
13秒前
SHANSHAN完成签到 ,获得积分10
13秒前
zhhh完成签到,获得积分10
14秒前
贾明灵完成签到,获得积分10
15秒前
科研狗完成签到,获得积分10
16秒前
选择性哑巴完成签到,获得积分10
16秒前
17秒前
科研狗发布了新的文献求助10
20秒前
姜糊完成签到 ,获得积分10
21秒前
小杨完成签到,获得积分10
21秒前
忧虑的鹭洋完成签到,获得积分10
21秒前
PDL_完成签到,获得积分20
22秒前
Hailey完成签到,获得积分10
23秒前
24秒前
朱佳宁完成签到 ,获得积分10
24秒前
小明完成签到,获得积分0
25秒前
等风的人发布了新的文献求助10
25秒前
dizi完成签到 ,获得积分10
25秒前
26秒前
小福完成签到 ,获得积分10
27秒前
KingYugene完成签到,获得积分10
28秒前
我是老大应助actor2006采纳,获得10
30秒前
噗愣噗愣地刚发芽完成签到 ,获得积分10
30秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 2000
Picture this! Including first nations fiction picture books in school library collections 1000
Signals, Systems, and Signal Processing 610
Unlocking Chemical Thinking: Reimagining Chemistry Teaching and Learning 555
Photodetectors: From Ultraviolet to Infrared 500
Cancer Targets: Novel Therapies and Emerging Research Directions (Part 1) 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6359097
求助须知:如何正确求助?哪些是违规求助? 8173163
关于积分的说明 17212541
捐赠科研通 5414120
什么是DOI,文献DOI怎么找? 2865393
邀请新用户注册赠送积分活动 1842773
关于科研通互助平台的介绍 1690901