Robust extraction of pneumonia-associated clinical states from electronic health records

不可用 计算机科学 聚类分析 人工智能 数据挖掘 机器学习 医学 健康档案 医疗保健 统计 数学 经济 经济增长
作者
Feihong Xu,Félix L. Morales,Luı́s A. Nunes Amaral
出处
期刊:Proceedings of the National Academy of Sciences of the United States of America [Proceedings of the National Academy of Sciences]
卷期号:121 (45)
标识
DOI:10.1073/pnas.2417688121
摘要

Mining of electronic health records (EHR) promises to automate the identification of comprehensive disease phenotypes. However, the realization of this promise is hindered by the unavailability of generalizable ground-truth information, data incompleteness and heterogeneity, and the lack of generalization to multiple cohorts. We present here a data-driven approach to identify clinical states that we implement for 585 critical care patients with suspected pneumonia recruited by the SCRIPT study, which we compare to and integrate with 9,918 pneumonia patients from the MIMIC-IV dataset. We extract and curate from their structured EHRs a primary set of clinical features (53 and 59 features for SCRIPT and MIMIC-IV, respectively), including disease severity scores, vital signs, and so on, at various degrees of completeness. We aggregate irregular time series into daily frequency, resulting in 12,495 and 94,684 patient-day pairs for SCRIPT and MIMIC, respectively. We define a “common-sense” ground truth that we then use in a semisupervised pipeline to optimize choices for data preprocessing, and reduce the feature space to four principal components. We describe and validate an ensemble-based clustering method that enables us to robustly identify five clinical states, and use a Gaussian mixture model to quantify uncertainty in cluster assignment. Demonstrating the clinical relevance of the identified states, we find that three states are strongly associated with disease outcomes (dying vs. recovering), while the other two reflect disease etiology. The outcome associated clinical states provide significantly increased discrimination of mortality rates over standard approaches.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Chasing完成签到 ,获得积分10
3秒前
Johnson完成签到 ,获得积分10
3秒前
wanghao完成签到 ,获得积分10
4秒前
小怪完成签到,获得积分10
5秒前
科研通AI2S应助素素洁采纳,获得20
8秒前
Olive完成签到,获得积分10
12秒前
梦想照进现实完成签到 ,获得积分10
17秒前
Roy完成签到,获得积分10
18秒前
20秒前
追梦完成签到,获得积分10
23秒前
Singularity应助科研通管家采纳,获得10
24秒前
Singularity应助科研通管家采纳,获得10
24秒前
Singularity应助科研通管家采纳,获得10
24秒前
呆萌的小海豚完成签到,获得积分10
25秒前
32秒前
平常雪柳完成签到 ,获得积分10
40秒前
东方欲晓完成签到 ,获得积分0
40秒前
白嫖论文完成签到 ,获得积分10
42秒前
不羡江中仙完成签到 ,获得积分10
46秒前
优美的冰巧完成签到 ,获得积分10
46秒前
快去爬山完成签到 ,获得积分10
53秒前
www完成签到 ,获得积分10
54秒前
YuLu完成签到 ,获得积分10
56秒前
优雅的平安完成签到 ,获得积分10
56秒前
檀123完成签到 ,获得积分10
58秒前
12完成签到,获得积分10
59秒前
chenying完成签到 ,获得积分0
1分钟前
Legend_完成签到 ,获得积分10
1分钟前
ymxlcfc完成签到 ,获得积分10
1分钟前
alixy完成签到,获得积分10
1分钟前
fareless完成签到 ,获得积分10
1分钟前
巫马完成签到 ,获得积分10
1分钟前
1分钟前
呆萌的金针菇完成签到 ,获得积分10
1分钟前
晓雯发布了新的文献求助10
1分钟前
北辰完成签到 ,获得积分10
1分钟前
1分钟前
现代完成签到,获得积分10
1分钟前
文龙完成签到 ,获得积分10
1分钟前
Yang2发布了新的文献求助10
1分钟前
高分求助中
Aspects of Babylonian celestial divination : the lunar eclipse tablets of enuma anu enlil 1500
中央政治學校研究部新政治月刊社出版之《新政治》(第二卷第四期) 1000
Hopemont Capacity Assessment Interview manual and scoring guide 1000
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
Mantids of the euro-mediterranean area 600
Mantodea of the World: Species Catalog Andrew M 500
Insecta 2. Blattodea, Mantodea, Isoptera, Grylloblattodea, Phasmatodea, Dermaptera and Embioptera 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 内科学 物理 纳米技术 计算机科学 基因 遗传学 化学工程 复合材料 免疫学 物理化学 细胞生物学 催化作用 病理
热门帖子
关注 科研通微信公众号,转发送积分 3434856
求助须知:如何正确求助?哪些是违规求助? 3032180
关于积分的说明 8944429
捐赠科研通 2720103
什么是DOI,文献DOI怎么找? 1492160
科研通“疑难数据库(出版商)”最低求助积分说明 689725
邀请新用户注册赠送积分活动 685862