Mimicking clinical trials with synthetic acute myeloid leukemia patients using generative artificial intelligence

生成模型 计算机科学 合成数据 髓系白血病 临床试验 人工智能 生成语法 医学 内科学
作者
Jan-Niklas Eckardt,Waldemar Hahn,Christoph Röllig,Sebastian Stasik,Uwe Platzbecker,Carsten Müller‐Tidow,Hubert Serve,Claudia D. Baldus,Christoph Schliemann,Kerstin Schäfer‐Eckart,Maher Hanoun,Martin Kaufmann,Andreas Burchert,Martin Bornhäuser,Johannes Schetelig,Martin Sedlmayr,Martin Bornhäuser,Markus Wolfien,Jan Moritz Middeke
出处
期刊:npj digital medicine [Springer Nature]
卷期号:7 (1) 被引量:8
标识
DOI:10.1038/s41746-024-01076-x
摘要

Clinical research relies on high-quality patient data, however, obtaining big data sets is costly and access to existing data is often hindered by privacy and regulatory concerns. Synthetic data generation holds the promise of effectively bypassing these boundaries allowing for simplified data accessibility and the prospect of synthetic control cohorts. We employed two different methodologies of generative artificial intelligence - CTAB-GAN+ and normalizing flows (NFlow) - to synthesize patient data derived from 1606 patients with acute myeloid leukemia, a heterogeneous hematological malignancy, that were treated within four multicenter clinical trials. Both generative models accurately captured distributions of demographic, laboratory, molecular and cytogenetic variables, as well as patient outcomes yielding high performance scores regarding fidelity and usability of both synthetic cohorts (n = 1606 each). Survival analysis demonstrated close resemblance of survival curves between original and synthetic cohorts. Inter-variable relationships were preserved in univariable outcome analysis enabling explorative analysis in our synthetic data. Additionally, training sample privacy is safeguarded mitigating possible patient re-identification, which we quantified using Hamming distances. We provide not only a proof-of-concept for synthetic data generation in multimodal clinical data for rare diseases, but also full public access to synthetic data sets to foster further research.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
张平一完成签到 ,获得积分10
3秒前
junge应助xiaobai123456采纳,获得10
4秒前
包容的忆灵完成签到 ,获得积分10
5秒前
cdd完成签到,获得积分10
7秒前
魔术师完成签到 ,获得积分10
7秒前
小石头完成签到,获得积分10
9秒前
ZHX完成签到 ,获得积分10
11秒前
拾壹完成签到,获得积分10
14秒前
呆橘完成签到 ,获得积分10
16秒前
w0304hf完成签到,获得积分10
19秒前
24秒前
CMD完成签到 ,获得积分10
26秒前
川川完成签到,获得积分10
27秒前
蕉太狼完成签到 ,获得积分10
34秒前
long完成签到 ,获得积分10
35秒前
36秒前
xiaobai123456发布了新的文献求助10
36秒前
37秒前
39秒前
一一发布了新的文献求助10
44秒前
不扯先生完成签到,获得积分10
44秒前
冬月初七发布了新的文献求助10
47秒前
luckyhan完成签到 ,获得积分10
47秒前
佳言2009完成签到 ,获得积分10
50秒前
小高完成签到 ,获得积分10
51秒前
细心夏瑶完成签到,获得积分10
53秒前
8D完成签到,获得积分10
56秒前
123发布了新的文献求助10
56秒前
chengjiali完成签到,获得积分10
56秒前
好学的泷泷完成签到 ,获得积分10
57秒前
58秒前
LuciusHe完成签到,获得积分10
58秒前
雨柏完成签到 ,获得积分10
1分钟前
Nicole完成签到,获得积分10
1分钟前
失眠的向日葵完成签到 ,获得积分10
1分钟前
1分钟前
火星上的雨柏完成签到,获得积分10
1分钟前
慕辰完成签到 ,获得积分10
1分钟前
和谐的冬莲完成签到 ,获得积分10
1分钟前
挽忆逍遥完成签到 ,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 3000
Polymorphism and polytypism in crystals 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
T/SNFSOC 0002—2025 独居石精矿碱法冶炼工艺技术标准 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6043130
求助须知:如何正确求助?哪些是违规求助? 7802865
关于积分的说明 16237978
捐赠科研通 5188629
什么是DOI,文献DOI怎么找? 2776648
邀请新用户注册赠送积分活动 1759700
关于科研通互助平台的介绍 1643239