Predict DLBCL patients' recurrence within two years with Gaussian mixture model cluster oversampling and multi-kernel learning

混合模型 布里氏评分 计算机科学 人工智能 支持向量机 聚类分析 核(代数) 过采样 模式识别(心理学) 数学 带宽(计算) 计算机网络 组合数学
作者
Meng Xing,Yanbo Zhang,Hongmei Yu,Zhenhuan Yang,Xueling Li,Qiong Li,Yanlin Zhao,Zhiqiang Zhao,Yanhong Luo
出处
期刊:Computer Methods and Programs in Biomedicine [Elsevier BV]
卷期号:226: 107103-107103 被引量:7
标识
DOI:10.1016/j.cmpb.2022.107103
摘要

Diffuse large B-cell lymphoma (DLBCL) is common in adults' non-Hodgkin's lymphoma. Relapse mainly occurs within two years after diagnosis and has a poor prognosis. Relapse after two years is less frequent and has a better prognosis. In this work, we constructed a relapse prediction model for diffuse large B-cell lymphoma patients within two years, expecting to provide a reference for Clinicians to implement individualized treatment.We propose a secondary-level class imbalance method based on Gaussian mixture model (GMM) clustering resampling to balance the data. Then use a multi-kernel support vector machine(SVM) to inscribe heterogeneous clinical data. Finally, merging them to identify recurrence patients within two years.Among all the class imbalance methods in this work, Inverse Weighted -GMM +SMOTEENN has the best performance. Compared with NO-GMM (Directl use the SMOTEENN without the GMM clustering process), its Area Under the ROC Curve(AUC) increases by 8.75%, and ECE and brier scores decrease 2.07% and 3.09%, respectively. Among the four classification algorithms in this work, Multiple kernel learning (MKL) has the most minimized brier scores and expected calibration error(ECE), the largest AUC, accuracy, Recall, precision and F1, has the best discrimination and calibration.Our inverse weighted -GMM+SMOTEENN+MKL (GMM-SENN-MKL) method can handle data class imbalance and clinical heterogeneity data well and can be used to predict recurrence in DLBCL patients.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
橘子圭令完成签到,获得积分10
刚刚
小杭76应助顺心的尔白采纳,获得10
1秒前
11tty发布了新的文献求助10
2秒前
浮游应助棠棠采纳,获得10
2秒前
mzm发布了新的文献求助10
2秒前
2秒前
3秒前
搬砖完成签到,获得积分10
3秒前
4秒前
曾经的孤萍完成签到,获得积分10
4秒前
笨笨伟泽发布了新的文献求助30
4秒前
诚心中恶发布了新的文献求助10
5秒前
5秒前
星河完成签到,获得积分10
5秒前
榴榴发布了新的文献求助10
5秒前
cencen发布了新的文献求助10
6秒前
6秒前
Akim应助yuki22采纳,获得10
6秒前
阿衍完成签到,获得积分10
6秒前
6秒前
悦子发布了新的文献求助40
6秒前
言亦云应助轻狂书生采纳,获得10
7秒前
7秒前
shaiiwe发布了新的文献求助30
7秒前
Joey发布了新的文献求助10
8秒前
8秒前
阿飞发布了新的文献求助10
9秒前
乐乐应助小溜溜采纳,获得30
9秒前
然463完成签到 ,获得积分10
9秒前
mzm完成签到,获得积分10
10秒前
哈哈镜阿姐完成签到,获得积分20
10秒前
11秒前
槑槑发布了新的文献求助10
11秒前
wuhuhu发布了新的文献求助10
12秒前
烟花应助合适小凝采纳,获得10
12秒前
yiyao完成签到,获得积分10
12秒前
冷静的仙人掌完成签到,获得积分10
13秒前
13秒前
14秒前
14秒前
高分求助中
Pipeline and riser loss of containment 2001 - 2020 (PARLOC 2020) 1000
Comparing natural with chemical additive production 500
The Leucovorin Guide for Parents: Understanding Autism’s Folate 500
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 500
A Manual for the Identification of Plant Seeds and Fruits : Second revised edition 500
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.) 400
Refractory Castable Engineering 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5205765
求助须知:如何正确求助?哪些是违规求助? 4384514
关于积分的说明 13653097
捐赠科研通 4242633
什么是DOI,文献DOI怎么找? 2327576
邀请新用户注册赠送积分活动 1325326
关于科研通互助平台的介绍 1277448