Sample size and predictive performance of machine learning methods with survival data: A simulation study

过度拟合 协变量 可解释性 计算机科学 比例危险模型 机器学习 随机森林 样本量测定 梯度升压 回归 人工智能 生存分析 统计 预测建模 回归分析 人工神经网络 Boosting(机器学习) 数学
作者
Gabriele Infante,Rosalba Miceli,Federico Ambrogi
出处
期刊:Statistics in Medicine [Wiley]
卷期号:42 (30): 5657-5675 被引量:5
标识
DOI:10.1002/sim.9931
摘要

Prediction models are increasingly developed and used in diagnostic and prognostic studies, where the use of machine learning (ML) methods is becoming more and more popular over traditional regression techniques. For survival outcomes the Cox proportional hazards model is generally used and it has been proven to achieve good prediction performances with few strong covariates. The possibility to improve the model performance by including nonlinearities, covariate interactions and time‐varying effects while controlling for overfitting must be carefully considered during the model building phase. On the other hand, ML techniques are able to learn complexities from data at the cost of hyper‐parameter tuning and interpretability. One aspect of special interest is the sample size needed for developing a survival prediction model. While there is guidance when using traditional statistical models, the same does not apply when using ML techniques. This work develops a time‐to‐event simulation framework to evaluate performances of Cox regression compared, among others, to tuned random survival forest, gradient boosting, and neural networks at varying sample sizes. Simulations were based on replications of subjects from publicly available databases, where event times were simulated according to a Cox model with nonlinearities on continuous variables and time‐varying effects and on the SEER registry data.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
cecily81813发布了新的文献求助30
1秒前
暗号发布了新的文献求助10
2秒前
2秒前
研友_ngqxV8完成签到,获得积分0
3秒前
奋斗映寒发布了新的文献求助10
5秒前
5秒前
5秒前
ezreal发布了新的文献求助10
6秒前
思源应助cloud采纳,获得10
7秒前
GUGU发布了新的文献求助10
9秒前
肖雪依发布了新的文献求助30
10秒前
充电宝应助科研通管家采纳,获得30
12秒前
脑洞疼应助科研通管家采纳,获得30
12秒前
英俊的铭应助科研通管家采纳,获得10
12秒前
思源应助科研通管家采纳,获得10
13秒前
香蕉谷芹应助科研通管家采纳,获得10
13秒前
天天快乐应助科研通管家采纳,获得10
13秒前
科研通AI2S应助科研通管家采纳,获得10
13秒前
zxh123发布了新的文献求助10
13秒前
13秒前
wang关注了科研通微信公众号
15秒前
16秒前
敬敬完成签到,获得积分10
17秒前
科研通AI2S应助roser采纳,获得10
17秒前
zmk完成签到,获得积分10
18秒前
港a发布了新的文献求助10
18秒前
Tumumu发布了新的文献求助10
21秒前
zz发布了新的文献求助10
22秒前
课呢完成签到,获得积分10
23秒前
24秒前
令狐双发布了新的文献求助10
25秒前
渔渔完成签到,获得积分10
26秒前
clyhg完成签到,获得积分10
28秒前
29秒前
wang发布了新的文献求助10
29秒前
31秒前
ALIN完成签到,获得积分10
32秒前
33秒前
36秒前
37秒前
高分求助中
Востребованный временем 2500
Agaricales of New Zealand 1: Pluteaceae - Entolomataceae 1040
지식생태학: 생태학, 죽은 지식을 깨우다 600
海南省蛇咬伤流行病学特征与预后影响因素分析 500
Neuromuscular and Electrodiagnostic Medicine Board Review 500
ランス多機能化技術による溶鋼脱ガス処理の高効率化の研究 500
Relativism, Conceptual Schemes, and Categorical Frameworks 500
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3462675
求助须知:如何正确求助?哪些是违规求助? 3056170
关于积分的说明 9050910
捐赠科研通 2745799
什么是DOI,文献DOI怎么找? 1506591
科研通“疑难数据库(出版商)”最低求助积分说明 696165
邀请新用户注册赠送积分活动 695693